PQ量子化(ぴーきゅーりょうしか)
最終更新:2026/4/28
PQ量子化は、ベクトルデータを効率的に圧縮するための量子化手法であり、特に類似検索や大規模データ処理において利用される。
別名・同義語 プロダクト量子化
ポイント
PQ量子化は、ベクトル空間を複数の部分空間に分割し、各部分空間で個別に量子化を行うことで、高い圧縮率と検索精度を実現する。
PQ量子化とは
PQ量子化(Product Quantization)は、高次元ベクトルデータを低次元に圧縮するための手法です。類似検索や大規模データ処理において、メモリ使用量と検索速度のトレードオフを改善するために用いられます。
PQ量子化の仕組み
PQ量子化では、高次元ベクトル空間を複数の独立した低次元部分空間に分割します。例えば、128次元のベクトルを8つの16次元の部分空間に分割することが考えられます。次に、各部分空間において、k-means法などのクラスタリングアルゴリズムを用いて、ベクトルをいくつかの代表的なベクトル(セントロイド)に量子化します。これにより、各ベクトルは、各部分空間におけるセントロイドのインデックスの組み合わせとして表現されるようになります。
PQ量子化の利点
- 高い圧縮率: ベクトルを低次元のインデックスで表現するため、メモリ使用量を大幅に削減できます。
- 高速な検索: 量子化されたベクトル間の距離計算は、元のベクトル間の距離計算よりも高速に行えます。
- スケーラビリティ: 大規模なデータセットに対しても効率的に適用できます。
PQ量子化の欠点
- 量子化誤差: ベクトルを量子化することで、元のベクトルとの間に誤差が生じます。この誤差が検索精度に影響を与える可能性があります。
- パラメータ調整: 部分空間の数やクラスタ数などのパラメータを適切に調整する必要があります。
PQ量子化の応用例
- 類似画像検索: 画像の特徴ベクトルをPQ量子化することで、高速かつ効率的な類似画像検索を実現できます。
- レコメンデーションシステム: ユーザーの行動履歴やアイテムの特徴ベクトルをPQ量子化することで、レコメンデーションの精度と効率を向上させることができます。
- 大規模データ分析: 大規模なデータセットをPQ量子化することで、メモリ使用量を削減し、データ分析の効率を向上させることができます。