概念ドリフト(がいねんどりふと)
最終更新:2026/4/27
概念ドリフトとは、機械学習において、入力データと正解ラベルの統計的な関係性が時間とともに変化し、モデルの予測精度が低下する現象である。
別名・同義語 データドリフトモデル劣化
ポイント
概念ドリフトは、モデルの再学習や適応が必要となる原因であり、継続的なパフォーマンス監視が重要となる。特に、時間とともに変化するデータ特性を持つシステムで顕著に発生する。
概念ドリフトとは
概念ドリフトは、機械学習モデルが実運用環境で予測を行う際に、入力データの統計的性質が時間経過とともに変化することで、モデルの予測精度が低下する現象です。これは、モデルが学習時に使用したデータ分布と、実際に予測を行うデータの分布が異なる場合に発生します。
概念ドリフトの種類
概念ドリフトには、いくつかの種類があります。
- 突然的なドリフト: データ分布が急激に変化する場合。
- 漸進的なドリフト: データ分布が徐々に変化する場合。
- 反復的なドリフト: データ分布が周期的に変化する場合。
- 段階的なドリフト: データ分布がいくつかの段階を経て変化する場合。
概念ドリフトの原因
概念ドリフトの原因は様々ですが、主なものとしては以下のものが挙げられます。
- 外部環境の変化: 経済状況、社会情勢、季節変動など、モデルの入力データに影響を与える外部環境の変化。
- ユーザー行動の変化: ユーザーの嗜好や行動パターンの変化。
- データ収集方法の変化: データ収集方法の変更や、新しいデータソースの追加。
- システムの変化: システムのアップデートや変更。
概念ドリフトへの対策
概念ドリフトに対処するためには、以下の対策が考えられます。
- モデルの再学習: 定期的にモデルを再学習させることで、新しいデータ分布に適応させることができます。
- オンライン学習: 新しいデータが到着するたびにモデルを更新することで、リアルタイムで変化するデータ分布に対応できます。
- ドリフト検出: データ分布の変化を検出し、ドリフトが発生した際にアラートを発するように設定します。
- アンサンブル学習: 複数のモデルを組み合わせることで、ドリフトの影響を軽減できます。
- 特徴量エンジニアリング: ドリフトの影響を受けにくい特徴量を設計します。