HNSWインデックス（えいちえぬえすだぶりゅういんでっくす）

最終更新：2026/4/28

HNSWインデックスは、近似最近傍探索を行うためのデータ構造であり、高次元空間における類似検索を高速化する。

別名・同義語 ANNインデックス近似最近傍探索

ポイント

HNSWは、グラフ構造を用いて効率的な探索を実現し、大規模データセットでの類似検索に適している。機械学習や情報検索の分野で広く利用されている。

HNSWインデックスとは

HNSW (Hierarchical Navigable Small World) インデックスは、近似最近傍探索 (Approximate Nearest Neighbor search, ANN) を効率的に行うためのデータ構造です。高次元空間における類似検索を高速化するために設計されており、特に大規模なデータセットにおいてその効果を発揮します。

HNSWの仕組み

HNSWは、多層構造のグラフを用いてデータを表現します。各層は、より粗い粒度でデータを表現し、上位層から下位層へと探索を進めることで、効率的に最近傍点を探索します。この構造により、正確性を犠牲にすることなく、高速な検索を実現しています。

具体的には、以下の特徴があります。

階層構造: データを複数の層に分割し、各層で異なる粒度でデータを表現します。
ナビゲーブルグラフ: 各層は、ノード（データ点）とエッジ（ノード間の接続）からなるグラフ構造で表現されます。エッジは、ノード間の類似度に基づいて構築されます。
スモールワールド現象: グラフ構造は、スモールワールド現象を利用しており、任意のノードから他のノードへの平均距離が短いという特徴があります。

HNSWの応用例

HNSWインデックスは、様々な分野で応用されています。

画像検索: 画像の特徴ベクトルを用いて、類似画像を高速に検索します。
自然言語処理: 単語や文のベクトル表現を用いて、類似する単語や文を検索します。
レコメンデーションシステム: ユーザーの行動履歴に基づいて、類似するアイテムを推薦します。
異常検知: 正常なデータパターンから逸脱する異常なデータを検出します。

HNSWの利点と欠点

利点:

高速な検索速度
高いスケーラビリティ
比較的高い精度

欠点:

インデックス構築に時間がかかる場合がある
パラメータ調整が必要