認知拡散モデル（にんちひさんもでる）

最終更新：2026/4/22

認知拡散モデルは、人間の認知プロセスを模倣し、ノイズから構造化されたデータを生成する深層学習モデルである。

別名・同義語拡散モデルDDPM

ポイント

画像生成や自然言語処理など、多様なタスクに応用可能な生成モデルであり、近年急速に発展している。潜在空間における拡散過程と逆拡散過程を学習する。

概要

認知拡散モデル（Diffusion Model）は、物理学における拡散現象を応用した生成モデルの一種である。2020年以降、画像生成の分野で顕著な成果を上げ、GAN（Generative Adversarial Network）などの既存の生成モデルに匹敵する、あるいはそれを上回る性能を示すようになった。

原理

認知拡散モデルは、以下の2つの過程から構成される。

拡散過程（Forward Process）: データ（例えば画像）に徐々にノイズを加えていき、最終的には完全にランダムなノイズに変換する過程。
逆拡散過程（Reverse Process）: ノイズから徐々にデータを復元していく過程。この過程を学習することで、新たなデータを生成することが可能になる。

歴史

拡散モデルの基礎は、2015年に提案されたDenoising Diffusion Probabilistic Models (DDPM)に遡る。その後、様々な改良が加えられ、より高品質な画像を生成できるようになっていった。近年では、Stable DiffusionやMidjourneyなどの、認知拡散モデルを基盤とした画像生成AIが広く利用されている。

応用分野

画像生成: テキストから画像を生成したり、既存の画像を編集したりすることが可能。
自然言語処理: テキスト生成、翻訳、要約などのタスクに応用。
音声合成: 音声データの生成や編集。
分子構造生成: 新しい分子構造の設計。

課題

計算コスト: 画像生成に時間がかかる場合がある。
学習データの偏り: 学習データに偏りがあると、生成されるデータにも偏りが生じる可能性がある。
倫理的な問題: 偽情報の生成や著作権侵害などのリスク。