ファイル重複排除(ふぁいるじゅうふくはいじょ)
最終更新:2026/4/28
ファイル重複排除とは、同一のファイルデータを複数コピー保存する際に、重複する部分を排除して保存容量を削減する技術である。
別名・同義語 データ重複排除デデュープリケーション
ポイント
ファイル重複排除は、バックアップやアーカイブにおいて、ストレージ効率を向上させるために広く利用されている。データの内容を比較し、同一のデータブロックを一つだけ保存する。
ファイル重複排除とは
ファイル重複排除(Data Deduplication)は、データストレージの効率を向上させるための技術の一つです。同じファイルや、ファイル内の同じデータブロックが複数存在する場合、それらを一つだけ保存し、残りの重複するデータは参照ポインタで置き換えることで、ストレージ容量を大幅に削減できます。
ファイル重複排除の種類
ファイル重複排除には、大きく分けて以下の2つの種類があります。
- ファイルレベルの重複排除: ファイル全体を比較し、完全に同一のファイルを一つだけ保存します。これは比較的単純な方法ですが、ファイル全体が同一でなければ重複を認識できません。
- ブロックレベルの重複排除: ファイルを固定サイズのブロックに分割し、ブロックごとに重複を比較します。ファイルの一部が変更された場合でも、変更されていないブロックは再利用できるため、より高い圧縮率が期待できます。
ファイル重複排除のメリット
- ストレージ容量の削減: 重複するデータを排除することで、必要なストレージ容量を大幅に削減できます。
- バックアップ時間の短縮: バックアップするデータ量が減るため、バックアップ時間を短縮できます。
- ネットワーク帯域幅の節約: バックアップやレプリケーションの際に転送するデータ量が減るため、ネットワーク帯域幅を節約できます。
ファイル重複排除のデメリット
- 処理負荷の増加: 重複を検出するための処理負荷が増加します。
- 復元時のオーバーヘッド: 参照ポインタを解決する必要があるため、復元時にオーバーヘッドが発生する場合があります。
- 導入コスト: 専用のハードウェアやソフトウェアが必要となる場合があります。
ファイル重複排除の応用例
ファイル重複排除は、主に以下の用途で利用されています。