Isolation Forest（あいそれーしょんふぉれすと）

最終更新：2026/4/27

Isolation Forestは、異常検知に用いられる機械学習アルゴリズムであり、正常データよりも異常データの方が分割されやすいという特性を利用する。

別名・同義語孤立森林異常検知森林

ポイント

このアルゴリズムは、決定木を多数構築し、データの分離に必要な分割回数に基づいて異常度を評価する。分割回数が少ないほど、異常である可能性が高い。

Isolation Forestとは

Isolation Forestは、異常検知のためのアンサンブル学習アルゴリズムです。2008年にLiu FeiとZhou Zhihuaによって提案されました。従来の異常検知手法と比較して、高次元データや大規模データセットに対して効率的に機能します。

Isolation Forestの基本的な考え方は、異常値は正常値よりも「孤立」している、つまり、他のデータ点から分離しやすいというものです。この特性を利用して、以下の手順で異常度を評価します。

決定木の構築: ランダムに選択された特徴量と分割値を用いて、決定木を多数構築します。各決定木は、データをランダムに分割し続けます。
データの分離: 各データ点について、決定木で分離するために必要な分割回数を記録します。異常値は、正常値よりも少ない分割回数で分離される傾向があります。
異常度の算出: 各データ点の異常度は、そのデータ点を分離するために必要な平均分割回数に基づいて計算されます。分割回数が少ないほど、異常度が高くなります。