拡散モデル(かくさんもでる)
最終更新:2026/4/25
拡散モデルは、ノイズを徐々に加えてデータを破壊し、その逆過程でノイズからデータを再構築する生成モデルである。
ポイント
近年、画像生成を中心に注目を集めており、高品質な画像を生成できる点が特徴である。GANなどの他の生成モデルと比較して、学習の安定性に優れる。
概要
拡散モデルは、物理学における拡散過程に着想を得た生成モデルの一種である。データに徐々にノイズを加えていき、最終的に完全にノイズ化された状態にする「拡散過程(forward process)」と、その逆過程でノイズから元のデータを再構築する「逆拡散過程(reverse process)」の二つの過程から構成される。
拡散過程
拡散過程では、データにガウスノイズなどのノイズを段階的に加えていく。各ステップでわずかなノイズを加えることで、最終的にはデータが完全にノイズに埋もれた状態になる。この過程はマルコフ連鎖としてモデル化される。
逆拡散過程
逆拡散過程は、拡散過程の逆を行うことで、ノイズからデータを再構築する。この過程は、拡散過程で得られたデータ分布を学習し、その分布に従ってノイズを除去していくことで実現される。近年では、深層学習モデル(特にU-Net)が逆拡散過程のモデルとして広く用いられている。
画像生成への応用
拡散モデルは、特に画像生成において高い性能を発揮する。GAN(Generative Adversarial Networks)などの他の生成モデルと比較して、学習が安定しており、多様で高品質な画像を生成できる。DALL-E 2やStable Diffusionなどの画像生成AIは、拡散モデルを基盤としている。
その他の応用
画像生成以外にも、音声合成、動画生成、分子構造生成など、様々な分野への応用が検討されている。
歴史
拡散モデルの基礎的なアイデアは2015年に提案されたが、2020年以降に深層学習モデルとの組み合わせによって飛躍的な性能向上が達成され、注目を集めるようになった。