EMアルゴリズム（えむあるごりずむ）

最終更新：2026/4/27

EMアルゴリズムは、潜在変数を持つ統計モデルのパラメータを推定するための反復的な手法である。

別名・同義語最尤推定法反復的パラメータ推定

ポイント

EMアルゴリズムは、不完全なデータや隠れた変数がある場合に、尤度関数を最大化するために用いられる。機械学習分野で広く利用されている。

概要

EMアルゴリズム（Expectation-Maximization algorithm）は、統計学におけるパラメータ推定手法の一つであり、特に潜在変数モデルにおいて有効である。観測データだけではモデルのパラメータを直接推定できない場合に、潜在変数を仮定し、その変数の存在を考慮してパラメータを推定する。

歴史

EMアルゴリズムの基本的な考え方は、1968年にJoseph H. FriedmanとWilliam J. Studneyによって提案された。その後、Dempster, Laird, Rubinらによって一般化され、現在の形になった。特に、混合ガウス分布モデルへの適用が広く知られている。

アルゴリズムの手順

EMアルゴリズムは、以下の2つのステップを繰り返すことでパラメータを推定する。

Eステップ（Expectation step）: 現在のパラメータ推定値に基づいて、潜在変数の条件付き期待値を計算する。
Mステップ（Maximization step）: Eステップで計算された期待値を用いて、尤度関数を最大化するようなパラメータを推定する。

これらのステップを繰り返すことで、尤度関数は単調増加し、局所的な最大値に収束する。

応用例

EMアルゴリズムは、様々な分野で応用されている。

混合ガウス分布モデル: データのクラスタリングや密度推定に用いられる。
隠れマルコフモデル (HMM): 音声認識や自然言語処理に用いられる。
画像処理: 画像のセグメンテーションやノイズ除去に用いられる。
遺伝子解析: 遺伝子発現データの解析に用いられる。

注意点

EMアルゴリズムは、局所的な最大値に収束する可能性がある。そのため、初期値の設定や、複数の初期値からの実行によって、より良い解を得られる場合がある。また、EMアルゴリズムは、計算コストが高い場合があるため、効率的な実装が重要となる。