認知拡散モデル(にんちひさんもでる)
最終更新:2026/4/22
認知拡散モデルは、人間の認知プロセスを模倣し、ノイズから構造化されたデータを生成する深層学習モデルである。
別名・同義語 拡散モデルDDPM
ポイント
画像生成や自然言語処理など、多様なタスクに応用可能な生成モデルであり、近年急速に発展している。潜在空間における拡散過程と逆拡散過程を学習する。
概要
認知拡散モデル(Diffusion Model)は、物理学における拡散現象を応用した生成モデルの一種である。2020年以降、画像生成の分野で顕著な成果を上げ、GAN(Generative Adversarial Network)などの既存の生成モデルに匹敵する、あるいはそれを上回る性能を示すようになった。
原理
- 拡散過程(Forward Process): データ(例えば画像)に徐々にノイズを加えていき、最終的には完全にランダムなノイズに変換する過程。
- 逆拡散過程(Reverse Process): ノイズから徐々にデータを復元していく過程。この過程を学習することで、新たなデータを生成することが可能になる。
歴史
拡散モデルの基礎は、2015年に提案されたDenoising Diffusion Probabilistic Models (DDPM)に遡る。その後、様々な改良が加えられ、より高品質な画像を生成できるようになっていった。近年では、Stable DiffusionやMidjourneyなどの、認知拡散モデルを基盤とした画像生成AIが広く利用されている。
応用分野
- 画像生成: テキストから画像を生成したり、既存の画像を編集したりすることが可能。
- 自然言語処理: テキスト生成、翻訳、要約などのタスクに応用。
- 音声合成: 音声データの生成や編集。
- 分子構造生成: 新しい分子構造の設計。