EMアルゴリズム(えむあるごりずむ)
最終更新:2026/4/27
EMアルゴリズムは、潜在変数を持つ統計モデルのパラメータを推定するための反復的な手法である。
別名・同義語 最尤推定法反復的パラメータ推定
ポイント
EMアルゴリズムは、不完全なデータや隠れた変数がある場合に、尤度関数を最大化するために用いられる。機械学習分野で広く利用されている。
概要
EMアルゴリズム(Expectation-Maximization algorithm)は、統計学におけるパラメータ推定手法の一つであり、特に潜在変数モデルにおいて有効である。観測データだけではモデルのパラメータを直接推定できない場合に、潜在変数を仮定し、その変数の存在を考慮してパラメータを推定する。
歴史
EMアルゴリズムの基本的な考え方は、1968年にJoseph H. FriedmanとWilliam J. Studneyによって提案された。その後、Dempster, Laird, Rubinらによって一般化され、現在の形になった。特に、混合ガウス分布モデルへの適用が広く知られている。
アルゴリズムの手順
EMアルゴリズムは、以下の2つのステップを繰り返すことでパラメータを推定する。
- Eステップ(Expectation step): 現在のパラメータ推定値に基づいて、潜在変数の条件付き期待値を計算する。
- Mステップ(Maximization step): Eステップで計算された期待値を用いて、尤度関数を最大化するようなパラメータを推定する。
これらのステップを繰り返すことで、尤度関数は単調増加し、局所的な最大値に収束する。
応用例
EMアルゴリズムは、様々な分野で応用されている。
- 混合ガウス分布モデル: データのクラスタリングや密度推定に用いられる。
- 隠れマルコフモデル (HMM): 音声認識や自然言語処理に用いられる。
- 画像処理: 画像のセグメンテーションやノイズ除去に用いられる。
- 遺伝子解析: 遺伝子発現データの解析に用いられる。
注意点
EMアルゴリズムは、局所的な最大値に収束する可能性がある。そのため、初期値の設定や、複数の初期値からの実行によって、より良い解を得られる場合がある。また、EMアルゴリズムは、計算コストが高い場合があるため、効率的な実装が重要となる。