高カーディナリティメトリクス(...)
最終更新:2026/4/28
...
別名・同義語 高識別度メトリクス多値メトリクス
ポイント
この指標は、顧客セグメンテーションや異常検知など、多様なデータ特性を把握する上で有用である。適切な分析手法を選択することで、隠れたパターンを発見できる。
高カーディナリティメトリクスの概要
高カーディナリティメトリクスとは、データセット内の各レコードが、非常に多くの異なる値を取りうる測定指標のことです。例えば、顧客ID、郵便番号、商品名などが該当します。これらの指標は、低カーディナリティメトリクス(性別、国籍など、取りうる値が少ない指標)とは対照的です。
高カーディナリティメトリクスの特徴
- 多様性: 各値が多くの異なるカテゴリを表すため、データセット全体の多様性を反映します。
- 詳細性: 個々のレコードを詳細に識別できるため、きめ細かい分析に適しています。
- 分析の複雑性: 取りうる値が多いため、単純な集計や比較では意味のある結果を得にくい場合があります。
高カーディナリティメトリクスの活用例
- 顧客セグメンテーション: 顧客IDや購買履歴などの高カーディナリティメトリクスを用いて、顧客をより細かく分類できます。
- 異常検知: 通常とは異なる値を持つレコードを特定し、不正行為やシステム障害などを検知できます。
- レコメンデーション: 商品名やカテゴリなどの高カーディナリティメトリクスを用いて、顧客の好みに合った商品を推薦できます。
高カーディナリティメトリクスの分析手法
高カーディナリティメトリクスの分析には、以下のような手法が用いられます。