象徴拡散モデル(しょうちょうかくさんもでる)
最終更新:2026/4/22
象徴拡散モデルは、ノイズを段階的に付加・除去する過程を通じて画像を生成する深層学習モデルである。
別名・同義語 拡散モデルDDPM
ポイント
近年、高品質な画像生成能力が注目されており、GANなどの他の生成モデルと比較して、多様性と安定性に優れるとされる。
概要
象徴拡散モデル(Diffusion Model)は、物理学における拡散過程を模倣した生成モデルの一種である。画像生成においては、まず学習データからノイズが徐々に加わった画像を生成し、その逆過程でノイズから画像を復元するように学習を行う。これにより、多様で高品質な画像を生成することが可能となる。
歴史
拡散モデルの基礎は、2015年に提案されたDenoising Diffusion Probabilistic Models (DDPM)に遡る。初期の拡散モデルは計算コストが高いという課題があったが、近年、様々な改良が加えられ、より効率的な学習と高速な画像生成が可能になった。特に、2022年に登場したStable Diffusionは、その高性能とオープンソース化により、広く普及した。
原理
拡散モデルは、フォワード過程とリバース過程の2つの過程で構成される。
- フォワード過程(拡散過程): 学習データに徐々にガウスノイズを加えていく過程。この過程はマルコフ連鎖としてモデル化され、最終的には完全にノイズ化された画像となる。
- リバース過程(逆拡散過程): ノイズから徐々に画像を復元していく過程。この過程は、フォワード過程の逆過程を学習したニューラルネットワークによって近似される。
応用
象徴拡散モデルは、画像生成以外にも、様々な応用が期待されている。
- 画像編集: 生成された画像を部分的に編集したり、既存の画像にスタイルを適用したりすることが可能。
- 超解像: 低解像度の画像を高品質な高解像度画像に変換。
- 画像修復: 破損した画像を修復。
- 動画生成: 画像生成の技術を応用して、短い動画を生成。
課題
象徴拡散モデルは、その高い性能にもかかわらず、いくつかの課題も抱えている。
- 計算コスト: 高解像度の画像を生成するには、依然として高い計算コストが必要。
- 生成速度: GANなどの他の生成モデルと比較して、生成速度が遅い。
- 制御性: 生成される画像の細かな制御が難しい場合がある。