ControlNet（こんとろーるねっと）

最終更新：2026/4/25

ControlNetは、画像生成AIモデルの出力を、追加の入力条件で制御するためのニューラルネットワーク構造である。

別名・同義語制御ネットワーク

ポイント

既存の画像生成モデルに組み込むことで、構図、姿勢、エッジなどの要素を詳細に指定した画像生成が可能となる。これにより、より意図通りの画像を生成できる。

概要

ControlNetは、Stable Diffusionなどの大規模な画像生成モデルの能力を拡張する技術です。従来の画像生成AIは、テキストプロンプトに基づいて画像を生成しますが、ControlNetを使用することで、ユーザーはテキストプロンプトに加えて、構図、エッジマップ、深度マップ、姿勢推定などの追加の入力条件を指定できます。これにより、生成される画像の構図やスタイルをより細かく制御することが可能になります。

技術的な詳細

ControlNetは、「制御信号」と呼ばれる追加の入力情報を、画像生成モデルの特定の層に接続することで機能します。この制御信号は、ユーザーが提供する画像やその他のデータから抽出されます。ControlNetは、学習済みの画像生成モデルの重みを変更することなく、追加のニューラルネットワーク層をトレーニングすることで、既存のモデルに組み込むことができます。これにより、既存のモデルの能力を損なうことなく、新しい制御機能を追加できます。

主な機能

構図制御: 既存の画像の構図を維持したまま、新しい画像を生成できます。
エッジ制御: エッジマップを使用して、生成される画像の形状を制御できます。
深度制御: 深度マップを使用して、生成される画像の奥行きを制御できます。
姿勢制御: 人物の姿勢を制御し、特定のポーズの画像を生成できます。
セマンティックセグメンテーション制御: 画像内のオブジェクトの種類を指定し、それに基づいて画像を生成できます。

応用例

建築デザイン: 既存の建物の写真に基づいて、新しいデザインの建物を生成できます。
キャラクターデザイン: 特定のポーズのキャラクターの画像を生成できます。
画像編集: 既存の画像を編集し、構図やスタイルを変更できます。
コンテンツ制作: ゲームや映画などのコンテンツ制作において、アセットの生成を効率化できます。

概要

技術的な詳細

主な機能

応用例

参考文献