ブロック重複排除（ぶろっくじゅうふくはいじょ）

ブロック分割: データを固定サイズまたは可変サイズのブロックに分割します。
ハッシュ計算: 各ブロックの ハッシュ値 を計算します。ハッシュ値は、ブロックの内容を識別するためのユニークな識別子として 機 能します。
重複検出: ハッシュ値を比較し、同一のハッシュ値を持つブロックを特定します。同一のハッシュ値を持つブロックは、内容が同一であると 判断 されます。
データ保存: 重複するブロックは、1つのコピーのみを保存し、他のブロックへの参照を作成します。

最終更新：2026/4/28

ブロック重複排除は、データストレージにおいて、同一のデータブロックを複数保持せず、1つのブロックのみを保存することで、ストレージ容量を効率化する技術である。

別名・同義語データ重複排除重複データ排除

ポイント

ブロック重複排除は、特にバックアップやアーカイブなどの大量データ管理において有効であり、ストレージコストの削減に貢献する。ファイル単位ではなくブロック単位で重複を検出する点が特徴。

概要

ブロック重複排除は、データ内の重複するブロックを特定し、それらを単一のコピーに置き換えることでストレージ容量を削減する技術です。ファイル全体の重複を検出するファイル重複排除とは異なり、ブロック重複排除はファイルの一部が重複している場合でも効率的に容量を削減できます。

ブロック重複排除の基本的な仕組みは以下の通りです。