LDM(えるでぃーえむ)
最終更新:2026/4/25
LDMは、潜在拡散モデル(Latent Diffusion Model)と呼ばれる深層学習モデルの一種であり、画像生成に用いられる。
別名・同義語 潜在拡散モデルLatent Diffusion Model
ポイント
LDMは、高次元の画像空間を低次元の潜在空間に写像することで、計算コストを削減しつつ高品質な画像を生成できる点が特徴である。
概要
LDM(Latent Diffusion Model)は、画像生成AIの分野で注目されている技術の一つである。従来の拡散モデルは、直接画像空間でノイズを除去していくため、計算コストが非常に高いという課題があった。LDMは、この課題を解決するために、画像を低次元の潜在空間に圧縮してから拡散モデルを適用する。これにより、計算コストを大幅に削減しつつ、高品質な画像を生成することが可能になった。
技術的な詳細
LDMは、主に以下の3つの要素で構成される。
- エンコーダ(Encoder): 画像を高次元の画像空間から低次元の潜在空間に圧縮する役割を担う。
- 拡散モデル(Diffusion Model): 潜在空間でノイズを除去していくことで、画像を生成する役割を担う。
- デコーダ(Decoder): 潜在空間で生成された画像を、元の画像空間に戻す役割を担う。
これらの要素を組み合わせることで、LDMは効率的に高品質な画像を生成することができる。
応用例
LDMは、様々な画像生成タスクに応用されている。
- テキストからの画像生成: テキストで指示された内容に基づいて画像を生成する。
- 画像からの画像生成: 入力された画像に基づいて、新しい画像を生成する。
- 画像修復: 破損した画像を修復する。
- 超解像: 低解像度の画像を、高解像度化する。
関連技術
LDMと関連する技術としては、GAN(Generative Adversarial Network)やVAE(Variational Autoencoder)などが挙げられる。GANは、生成器と識別器の2つのネットワークを競わせることで画像を生成する。VAEは、画像を潜在空間に圧縮し、そこから再構成することで画像を生成する。LDMは、これらの技術の利点を組み合わせたようなモデルと言える。
今後の展望
LDMは、画像生成AIの分野において、さらなる発展が期待されている。今後は、より高品質な画像を生成するための技術開発や、様々な応用分野への展開が進むと考えられる。