Zスコア検知(じーすこあけんち)
最終更新:2026/4/27
Zスコア検知とは、統計学において、データが正規分布から大きく外れているかをZスコアを用いて検出する手法である。
別名・同義語 外れ値検知異常値検出
ポイント
Zスコア検知は、異常値の検出や外れ値の特定に利用され、データ品質の向上に貢献する。特に、金融取引や製造プロセスにおける異常検知に有効である。
Zスコア検知の概要
Zスコア検知は、データセット内の各データポイントが、そのデータセットの平均からどれだけ標準偏差分離れているかを数値化したZスコアを利用して、異常値を特定する手法です。Zスコアは、以下の式で計算されます。
Z = (X - μ) / σ
ここで、Xはデータポイント、μはデータセットの平均、σはデータセットの標準偏差です。
一般的に、Zスコアの絶対値が一定の閾値(例えば、2または3)を超えるデータポイントは、異常値とみなされます。この閾値は、データセットの特性や分析の目的に応じて調整されます。
Zスコア検知の応用例
Zスコア検知は、様々な分野で応用されています。
Zスコア検知の注意点
Zスコア検知は、データが正規分布に従っていることを前提としています。データが正規分布から大きく外れている場合、Zスコア検知の精度が低下する可能性があります。また、閾値の設定も重要であり、適切な閾値を設定しないと、誤検出や見逃しが発生する可能性があります。
Zスコア検知と他の異常検知手法との比較
Zスコア検知は、比較的単純な手法ですが、他の異常検知手法と比較して、計算コストが低いという利点があります。一方、データが正規分布に従っていない場合や、複雑なデータ構造を持つデータセットに対しては、他の手法(例えば、機械学習を用いた異常検知手法)の方が適している場合があります。