象徴拡散モデル（しょうちょうかくさんもでる）

最終更新：2026/4/22

象徴拡散モデルは、ノイズを段階的に付加・除去する過程を通じて画像を生成する深層学習モデルである。

別名・同義語拡散モデルDDPM

ポイント

近年、高品質な画像生成能力が注目されており、GANなどの他の生成モデルと比較して、多様性と安定性に優れるとされる。

概要

象徴拡散モデル（Diffusion Model）は、物理学における拡散過程を模倣した生成モデルの一種である。画像生成においては、まず学習データからノイズが徐々に加わった画像を生成し、その逆過程でノイズから画像を復元するように学習を行う。これにより、多様で高品質な画像を生成することが可能となる。

歴史

拡散モデルの基礎は、2015年に提案されたDenoising Diffusion Probabilistic Models (DDPM)に遡る。初期の拡散モデルは計算コストが高いという課題があったが、近年、様々な改良が加えられ、より効率的な学習と高速な画像生成が可能になった。特に、2022年に登場したStable Diffusionは、その高性能とオープンソース化により、広く普及した。

原理

拡散モデルは、フォワード過程とリバース過程の2つの過程で構成される。

フォワード過程（拡散過程）: 学習データに徐々にガウスノイズを加えていく過程。この過程はマルコフ連鎖としてモデル化され、最終的には完全にノイズ化された画像となる。
リバース過程（逆拡散過程）: ノイズから徐々に画像を復元していく過程。この過程は、フォワード過程の逆過程を学習したニューラルネットワークによって近似される。

応用

象徴拡散モデルは、画像生成以外にも、様々な応用が期待されている。

画像編集: 生成された画像を部分的に編集したり、既存の画像にスタイルを適用したりすることが可能。
超解像: 低解像度の画像を高品質な高解像度画像に変換。
画像修復: 破損した画像を修復。
動画生成: 画像生成の技術を応用して、短い動画を生成。

課題

象徴拡散モデルは、その高い性能にもかかわらず、いくつかの課題も抱えている。

計算コスト: 高解像度の画像を生成するには、依然として高い計算コストが必要。
生成速度: GANなどの他の生成モデルと比較して、生成速度が遅い。
制御性: 生成される画像の細かな制御が難しい場合がある。