差分プライバシー（さぶんぷらいばしー）

最終更新：2026/4/25

差分プライバシーは、データセットに含まれる個々のデータの有無がクエリの結果に与える影響を数学的に制限するプライバシー保護技術である。

別名・同義語プライバシー保護技術データプライバシー

ポイント

差分プライバシーは、統計的な分析を可能にしつつ、個人のプライバシーを保護することを目的とする。ノイズを加えることで、個々のデータの影響を隠蔽する。

概要

差分プライバシーは、データセット内の個々のレコードの存在が、クエリの結果に与える影響を制限することで、プライバシーを保護する技術です。具体的には、クエリの結果にランダムなノイズを加えることで、個々のデータの影響を隠蔽します。このノイズの量は、プライバシー保護のレベルを調整するためのパラメータ（ε、δ）によって制御されます。

歴史

差分プライバシーの概念は、2006年にシータ・ナラヤンとディミトリス・カラスによって提唱されました。当初は、統計的なデータベースクエリに対するプライバシー保護を目的としていましたが、現在では、機械学習、データマイニング、位置情報サービスなど、幅広い分野で応用されています。

メカニズム

差分プライバシーを実現するための主なメカニズムとして、以下の2つが挙げられます。

ラプラスメカニズム: クエリの結果にラプラス分布に従うノイズを加えることで、差分プライバシーを保証します。ノイズの量は、クエリの感度（クエリの結果が個々のデータの変化にどれだけ影響を受けるか）とプライバシーパラメータ（ε）に依存します。
指数メカニズム: 複数の候補の中から、最適なものを選択する際に、指数関数的な確率分布を用いてノイズを加えることで、差分プライバシーを保証します。このメカニズムは、最適化問題に対するプライバシー保護に適しています。

応用例

GoogleのRAPPOR: Googleが開発した、ユーザーのブラウザからプライバシーを保護しながら統計情報を収集する技術。
Appleの差分プライバシー: AppleがiOSやmacOSに導入した、ユーザーの利用状況を分析するためのプライバシー保護技術。
米国国勢調査: 2020年の米国国勢調査で、差分プライバシーが採用され、個人のプライバシーを保護しながら、正確な統計情報を収集することが試みられました。