DWH(データウェアハウス)とは?機能や活用事例について解説
金融業界では、キャッシュカードやクレジットカードの使用履歴・ローンやキャッシング情報・預金残高など、大量の顧客データが保管されています。新しいFintech(金融と情報サービスを結びつけた新技術)企業が次々と生まれる時代において、ビッグデータの活用は企業の伸長に必須です。これらのビッグデータを整理・分析し、有効活用するのに最適なシステムとして注目されているのがDWH(データウェアハウス)です。
この記事ではDWHとは何か、データベースやデータレイクとの違い、主要な機能や金融業界における活用事例を紹介します。
目次
1. DWH(データウェアハウス)とは?
DWH(データウェアハウス)とは、業務関連のデータを目的別に整理・保管する情報管理システムのことです。英語表記である「Data Ware House」の頭文字を取ってDWHと呼ばれます。
企業の経営活動では膨大な量のデータが発生していて、生産管理・会計管理・顧客管理などの各領域でデータを収集するシステムが運用されています。しかし、データ管理を異なるシステムごとに行っていると、後でデータを抽出・活用するのが難しくなって不便です。
DWHはさまざまなシステムからデータを集め、目的別に、時系列に沿って整理・保管するシステムです。集計や抽出といったデータ処理も行えるため、集めたデータを分析してビジネスに生かせます。
1-1. DWHとデータベースの違い
DWHと間違われやすいものに、一般的なデータベース(DB)が挙げられます。データベースとは、システム上に格納されたデータの集まりのことです。格納されたデータは、必要に応じて書き込み・読み取りといった処理が行えるようになっています。
DWHとデータベースを比較したときの大きな違いは、保管できるデータの性質とデータ容量の2点です。
まず、DWHは過去から現在までのデータを時系列順に保管しているのに対し、データベースは、常に最新データのみを保管している点が特徴です。古いデータは随時消去されるため、データベースは過去のデータを用いた分析に向きません。
データ容量については、DWHはデータベースよりも大きな容量を持っており、大量のデータを保管することが可能です。
1-2. DWHとデータレイクの違い
データレイクとは、データの種類やサイズにかかわりなく、あらゆるデータを加工処理せずに保管する情報管理システムです。Excel・CSVなどに代表される構造化データも、文書・画像などの非構造化データも、データレイクではそのままの形で保管します。
一方でDWHは、処理された構造化データのみを保管する点が特徴です。データの形式などが最適化されていて、ユーザーによるデータ活用を容易にしています。
また、DWHはデータの一元管理や分析といった明確な利用目的があるシステムです。対するデータレイクは、さまざまな形式のデータを保管するためのシステムであり、データの利用目的は明確ではないという違いもあります。
2. DWHの主要な4つの機能
DWHの特徴には、大量のデータを保管するだけではなく、データを整理・分析するための4つの機能が備わっていることが挙げられます。DWHの導入を検討する方は、DWHの4つの機能を理解しておきましょう。
DWHの主要な機能4つを紹介し、それぞれで具体的に何ができるかも説明します。
2-1. サブジェクトごとにデータを整理する
サブジェクトとはデータの内容を分類した項目であり、「顧客」「商品」「収益」など、分析作業において注目したいデータ項目がサブジェクトの例に挙げられます。
DWHはサブジェクトごとにデータを整理して保管することが可能です。異なる管理システムに偏在していたデータを、システムを横断してサブジェクトごとに整理し、DWHのシステム内に保管します。
例を挙げると、サブジェクトが「顧客」であれば「顧客」、「商品」であれば「商品」としてデータが整理されます。分析のために「顧客」の情報が必要であれば、DWHは「顧客」のまとまったデータを出力可能です。
2-2. データを統合して形式を統一する
DWHには、データを統合して形式を統一する機能があります。
複数のソースからデータ収集を行った場合、データの重複やデータ形式の違いが発生する可能性があります。あるデータソースでは「企業名」、別のデータソースでは「会社名」となっていて、内部に同じ取引先が登録されているケースが重複の一例です。データの重複やデータ形式の違いが発生すると、分析精度が低下するおそれがあります。
DWHは重複を排除してデータを統合し、異なるデータ形式を統一できるため、分析精度を高く保てます。信頼できるデータ分析を行うことにより、高度な経営判断や意思決定に役立てられるでしょう。
2-3. データを時系列順にそろえる
DWHは過去のデータから最新のデータまで、データを時系列順にそろえます。現在のデータだけではなく、過去のデータも参照できるため、取引記録・履歴データなどを正確に出力できます。
経営にかかわる分析を行う際は、過去から現在へのデータの変遷を確認し、大局的な流れを押さえることが重要です。データベースのように最新のデータのみを保管するシステムでは、過去のデータの動きを把握できず、分析に活用できるデータを多く確保できません。
DWHのデータは時系列順にそろっていて、詳細な分析がしやすくなっています。過去のデータから、任意の状態を再現したり、特定の事象の原因を特定したりもできるでしょう。
2-4. データを長期的に保管する
DWHは原則として、収集したデータを消去することはなく、一度収集したデータは長期的に保管できます。
DWHがデータを消去しない理由は、業務・経営の分析を行うには膨大なデータの蓄積が必要であるためです。分析する目的によって必要なデータ量やデータの性質は異なっており、可能な限りすべてのデータを保存する必要があります。ただし、DWHの容量も無尽蔵に存在するわけではなく、古すぎるデータは消去される場合もあります。
データを長期的に保管する機能により、管理システム側の更新データが間違っていた場合にDWHからリカバリーする使い方も可能です。
3. 【データ分析に最適】DWHの活用事例
DWHは蓄積されたビッグデータを整理・保管し、データを分析する際にも最適なツールです。過去のデータをチェックしたり、広い視点で経営判断を行ったりなど、さまざまな場面でDWHは活用されています。
金融におけるDWHの活用事例を2つ紹介します。
3-1. ATMデータの一元管理
銀行などの金融機関において、DWHは全国のATMデータを素早く管理するために活用されています。
金融機関は顧客のチャネルが営業店窓口・ATM・ネットバンキングと拡大しているものの、実際の取引状況は残高でしか分かりません。残高のみでは顧客がどのような取引を行っているかを把握できず、収集したデータをローン・投資信託などのクロスセルに活用できない課題がありました。
DWHの導入によって、顧客のATM使用状況を詳細に分析でき、顧客情報の一元管理が可能になったことで、適切なサービスの案内に役立っています。
3-2. CRMのデータ分析・管理
DWHは、金融機関のCRM(顧客関係管理)におけるデータ分析・管理に活用されています。
CRM活動を通じて顧客と良好な関係を築くには、顧客情報の収集・管理が重要です。しかし金融機関の顧客には複数の口座を持つ個人の方や、口座を共有する世帯の方がおり、顧客データの重複も存在します。
金融機関がDWHを導入することで、口座を持つ個人や世帯の情報をまとめて把握し、かつデータの重複を避けて管理できるようになりました。DWHに収集されたデータをもとに顧客分析を行い、効率のよいマーケティングを実現しています。
まとめ
DWH(データウェアハウス)は、データを保管・統合管理する情報管理システムです。複数の情報システムを横断してデータをサブジェクトごとに整理し、重複を排除、時系列順に揃えて長期的に保管できる点が特徴です。そのため、大量のデータを分析し、経営判断に役立てるのに向いています。金融機関の場合は、全国のATMデータの分析や、大量の顧客情報管理などにDWHが活用されています。
顧客のビッグデータを収集・分析し、経営活動に役立てたい金融機関の方におすすめなのが、CAMG(CTC Autonomous Marketing with Google Cloud)です。CAMGはWebサイト上のお客さまの活動と、蓄積されたデータを結び合わせて分析し、DWHの構築をはじめとしたマーケティング施策の実行を自律的に推進します。