データウェアハウス(でーたうぇあはうす)
最終更新:2026/4/25
データウェアハウスは、分析や意思決定を目的として、様々な情報源から収集したデータを統合的に保管するデータベースである。
別名・同義語 データ基盤分析データベース
ポイント
データウェアハウスは、トランザクション処理に最適化されたデータベースとは異なり、過去のデータを分析するための構造を持つ。ビジネスインテリジェンス(BI)の基盤となる。
データウェアハウスとは
データウェアハウス(DWH)は、企業内の様々なシステムから収集されたデータを、分析や意思決定を支援するために統合的に保管するデータベースシステムです。単なるデータ保管場所ではなく、データの分析に特化した構造を持つことが特徴です。
データウェアハウスの構成要素
データウェアハウスは、一般的に以下の要素で構成されます。
- データソース: 企業内の基幹システム(販売、生産、人事など)や外部データソースからデータが収集されます。
- ETLプロセス: 抽出(Extract)、変換(Transform)、ロード(Load)のプロセスを経て、データソースからデータを抽出、クレンジング、変換し、データウェアハウスに格納します。
- データモデリング: データを分析しやすいように、スター型スキーマやスノーフレーク型スキーマなどのデータモデルで設計します。
- メタデータ: データウェアハウス内のデータに関する情報(データの意味、構造、更新履歴など)を管理します。
データウェアハウスのメリット
- 迅速なデータ分析: 統合されたデータにより、複雑な分析を迅速に行うことができます。
- 意思決定の支援: 分析結果に基づいた、より正確な意思決定を支援します。
- ビジネスインテリジェンス(BI)の強化: BIツールとの連携により、データの可視化やレポート作成を容易にします。
- 過去データの活用: 過去のデータを分析することで、将来の予測や傾向分析を行うことができます。
データウェアハウスとデータマート
データマートは、特定の部門や業務に特化したデータウェアハウスです。データウェアハウス全体から必要なデータを抽出して構築されるため、より迅速に分析を開始できます。データウェアハウスが企業全体のデータ分析を目的とするのに対し、データマートは特定のニーズに対応します。
データウェアハウスの技術
代表的なデータウェアハウス技術としては、Teradata、Snowflake、Amazon Redshift、Google BigQueryなどがあります。