物体検出(ぶつたいけん)
最終更新:2026/4/25
物体検出とは、画像や動画中に存在する特定の物体を識別し、その位置を特定するコンピュータビジョンの技術である。
別名・同義語 オブジェクト検出画像物体検出
ポイント
物体検出は、自動運転、監視システム、画像検索など、幅広い分野で応用されている。近年では、深層学習の発展により、その精度が飛躍的に向上している。
物体検出とは
物体検出は、画像や動画に含まれる物体を認識し、その位置を特定する技術です。画像認識の一分野であり、単に画像に何が写っているかを判断するだけでなく、画像内のどの領域にどの物体が存在するかを正確に把握することを目的とします。
物体検出の歴史
物体検出の初期の研究は、特徴量抽出と分類器の組み合わせに依存していました。例えば、Haar-like特徴とAdaBoostアルゴリズムを用いたViola-Jones物体検出器は、顔検出において大きな成功を収めました。しかし、これらの手法は、複雑な背景や照明条件の変化に弱く、汎用性に欠けるという課題がありました。
近年では、深層学習、特にConvolutional Neural Network (CNN) を用いた物体検出が主流となっています。R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSDなどのモデルが登場し、従来の技術と比較して大幅な精度向上を実現しています。
物体検出の手法
物体検出の手法は大きく分けて、以下の2つに分類できます。
- Two-stage検出器: 画像全体から候補領域を抽出し、その後、各候補領域を分類して物体を検出します。Faster R-CNNなどが代表的です。精度が高い反面、処理速度が遅いという特徴があります。
- One-stage検出器: 画像全体を一度に処理し、直接物体を検出します。YOLOやSSDなどが代表的です。処理速度が速い反面、精度はTwo-stage検出器に劣る場合があります。
物体検出の応用例
物体検出は、様々な分野で応用されています。