ファイル重複排除（ふぁいるじゅうふくはいじょ）

最終更新：2026/4/28

ファイル重複排除とは、同一のファイルデータを複数コピー保存する際に、重複する部分を排除して保存容量を削減する技術である。

別名・同義語データ重複排除デデュープリケーション

ポイント

ファイル重複排除は、バックアップやアーカイブにおいて、ストレージ効率を向上させるために広く利用されている。データの内容を比較し、同一のデータブロックを一つだけ保存する。

ファイル重複排除とは

ファイル重複排除（Data Deduplication）は、データストレージの効率を向上させるための技術の一つです。同じファイルや、ファイル内の同じデータブロックが複数存在する場合、それらを一つだけ保存し、残りの重複するデータは参照ポインタで置き換えることで、ストレージ容量を大幅に削減できます。

ファイル重複排除には、大きく分けて以下の2つの種類があります。

ファイルレベルの重複排除: ファイル全体を比較し、完全に同一のファイルを一つだけ保存します。これは比較的単純な方法ですが、ファイル全体が同一でなければ重複を認識できません。
ブロックレベルの重複排除: ファイルを固定サイズのブロックに分割し、ブロックごとに重複を比較します。ファイルの一部が変更された場合でも、変更されていないブロックは再利用できるため、より高い圧縮率が期待できます。

ファイル重複排除は、主に以下の用途で利用されています。