DWH(データウェアハウス)とは?機能や活用事例について解説

金融業界では、キャッシュカードやクレジットカードの使用履歴・ローンやキャッシング情報・預金残高など、大量の顧客データが保管されています。新しいFintech(金融と情報サービスを結びつけた新技術)企業が次々と生まれる時代において、ビッグデータの活用は企業の伸長に必須です。これらのビッグデータを整理・分析し、有効活用するのに最適なシステムとして注目されているのがDWH(データウェアハウス)です。
この記事ではDWHとは何か、データベースやデータレイクとの違い、主要な機能や金融業界における活用事例を紹介します。
目次
1. DWH(データウェアハウス)とは?

DWH(データウェアハウス)とは、業務関連のデータを目的別に整理・保管する情報管理システムのことです。英語表記である「Data Ware House」の頭文字を取ってDWHと呼ばれます。
企業の経営活動では膨大な量のデータが発生していて、生産管理・会計管理・顧客管理などの各領域でデータを収集するシステムが運用されています。しかし、データ管理を異なるシステムごと に行っていると、後でデータを抽出・活用するのが難しくなって不便です。
DWHはさまざまなシステムからデータを集め、目的別に、時系列に沿って整理・保管するシステムです。集計や抽出といったデータ処理も行えるため、集めたデータを分析してビジネスに生かせます。
1-1. DWHとデータベースの違い
DWHと間違われやすいものに、一般的なデータベース(DB)が挙げられます。データベースとは、システム上に格納されたデータの集まりのことです。格納されたデータは、必要に応じて書き込み・読み取りといった処理が行えるようになっています。
DWHとデータベースを比較したときの大きな違いは、保管できるデータの性質とデータ容量の2点です。
まず、DWHは過去から現在までのデータを時系列順に保管しているのに対し、データベースは、常に最新データのみを保管している点が特徴です。古いデータは随時消去されるため、データベースは過去のデータを用いた分析に向きません。
データ容量については、DWHはデータベースよりも大きな容量を持っており、大量のデータを保管することが可能です。
1-2. DWHとデータレイクの違い
データレイクとは、データの種類やサイズにかかわりなく、あらゆるデータを加工処理せずに保管する情報管理システムです。Excel・CSVなどに代表される構造化データも、文書・画像などの非構造化データも、データレイクではそのままの形で保管します。