画像エンコーダ(がぞうえんこーだ)
最終更新:2026/4/27
画像エンコーダは、画像を潜在空間のベクトル表現に変換するニューラルネットワークである。
別名・同義語 画像符号化器画像特徴抽出器
ポイント
画像エンコーダは、画像認識や生成モデルにおいて重要な役割を果たし、画像の特徴抽出と圧縮を可能にする。
概要
画像エンコーダは、主に深層学習の分野で使用される技術であり、特に自己符号化器(Autoencoder)や変分自己符号化器(VAE)といった生成モデル、そして画像認識モデルの構成要素として利用される。その主な役割は、高次元の画像データを、より低次元で密なベクトル表現(潜在表現)に変換することにある。
仕組み
画像エンコーダは、畳み込みニューラルネットワーク(CNN)をベースとしていることが多い。CNNは、画像から特徴を抽出することに優れており、画像エンコーダはこの能力を活用して、画像の重要な特徴を捉え、それをベクトルとして表現する。エンコーダは、入力画像を段階的にダウンサンプリングし、特徴マップを生成していく。最終的に、これらの特徴マップを結合し、固定長のベクトル表現を得る。
用途
画像エンコーダは、以下のような様々な用途で使用される。
- 画像圧縮: 画像を低次元のベクトル表現に変換することで、データ量を削減し、効率的な画像保存や伝送を可能にする。
- 画像生成: 自己符号化器やVAEと組み合わせることで、潜在空間から画像を生成することができる。
- 画像認識: 画像の特徴抽出器として、画像分類や物体検出などのタスクに利用される。
- 画像検索: 画像をベクトル表現に変換し、類似度に基づいて画像を検索することができる。
関連技術
画像エンコーダと密接に関連する技術としては、以下のようなものが挙げられる。