データウェアハウス
データウェアハウスとは
データウェアハウスは、膨大な量の統合データおよび履歴データの保存に使用されるデータ管理システムです。データウェアハウスはさまざまなソースのデータを保存しており、データ分析およびレポートに不可欠であるだけでなく、ビジネスインテリジェンス (BI) に有益な情報を取得します。このストレージアーキテクチャーはクエリを大規模に実行する機能を備えており、企業は主要な動向や関係を捉えて解釈、理解できるようになり、より詳細で有益な情報が得られます。
データウェアハウスの仕組み
データウェアハウスは、複数のデータベースのコピーを作成しており、運用データベースとトランザクションシステムからデータを受け取る際にセクションに分けられます。データがデータウェアハウスに入ると、数回のスクラブプロセスを経て、データのクレンジングと統合を効率的に行い、組織内での利用に適した信頼性の高いデータに変えます。
データウェアハウスのメリット
データウェアハウスの主なメリットを支えているのが、データのソースが制限されない、大規模なデータ分析基盤です。データを保存すれば、組織の過去のデータを参照でき、確かなメタデータと分析によって長期的にメリットが得られます。
データウェアハウスには次のようなメリットもあります。
· アナリストが、得られたデータやメタデータを評価して有益な情報を引き出せるようにサポートし、計画的なスキーマ、インフラストラクチャ、プロセスによる効率化と時間短縮を実現します。こうした迅速化によってビジネス上の能力が最大限に向上し、今日の競争が激しく急速に変化する市場に対応できます。
· BIを強化します。組織はさまざまなソースからデータを取得し、分類されたデータをビジュアル化ツールやレポートツールで統合できるようになり、レポート作成、分析、マイニングを体系的かつ効率的に行えます。この方法ではデータが非常に正確に保存されるためです。
· セキュリティを強化します。今日の組織にとって最大の障害となっているのがセキュリティですが、データウェアハウス全体のセキュリティ強化はビジネスの成功に不可欠となります。ウェアハウス構造内のデータの一元化によってセキュリティを強化します。データウェアハウスは構造上、独自の安全特性に基づいて構築されており、強固な基盤を形成するため、データセキュリティのリソースを追加する必要がありません。
データウェアハウスの課題
データウェアハウスインフラストラクチャに多くのメリットがあることは明らかですが、実装するうえで留意すべき課題もあります。どのタイプの環境にもメリットと課題がありますが、データウェアハウスには次のような課題があります。
単一拠点
組織の重要なデータをすべて収容していると、セキュリティ侵害によって壊滅的な被害を受ける恐れがあります。セキュリティ侵害は多くはありませんが、起こり得るものです。コンプライアンスを維持する能力や顧客データを保護する能力は、このタイプのデータ環境を正常に稼働させるうえで必要不可欠です。
拡張性
データウェアハウスの多くは、多額の初期投資と時間のかかるプロセスが必要となっており、小規模な組織は予算の制約上、このタイプのデータ環境を利用できない場合があります。また、データウェアハウスインフラストラクチャでは非構造化データを処理できないため、拡張性も制限されます。
メンテナンスと規制
データウェアハウスは規模が非常に大きいため、IT管理のニーズも増大します。それに伴って複雑さが増し、コストも増加する可能性があります。増大するITサポートのニーズに対応できるリソースを持たない組織は、すぐに失速するばかりか、データウェアハウスのメリットまで失うことになります。
データウェアハウス、データベース、データレイクの連携
データウェアハウス、データベース、およびデータレイクを相互に連携させながら利用したいという組織が増えています。そのメリットはデメリットを上回り、多くの場合、広範囲にわたる効率的なサポートと有益な情報が組織にもたらされます。
たとえば、データレイクには膨大な量の非構造化データとrawデータが保存されており、データおよび関連する有益な情報を保存しておき、後で参照できます。組織が特定のデータセットからさらなる有益な情報を引き出したい場合、このデータをレイクから転送してウェアハウスで追加処理することで、より多くの有益な情報を取得することができます。
また、データベースは一種のデータリザヴァー (データレイクの機能に類似) の役割も果たしており、ウェアハウスに移して集中的に処理する前に、データをある程度まで準備することが可能です。主な違いは、データベースが構造化データを利用しており、そのデータが通常はデータベース内のファイリングシステムに保存されている点です。
BIを強化して実用的なインサイトを取得するには、組織内の構造化データと非構造化データの両方を利用する必要があります。組織がデータベースを利用しているかデータレイクを利用しているかにかかわらず、データウェアハウスは、組織に実用的なインサイトをもたらす、より高パフォーマンスのレポート作成を行うための鍵となります。
HPEとデータウェアハウス
HPE Intelligent Data Platformでは、組織の規模を問わず、データに迅速かつ確実にアクセスできます。データが運用の最前線となっており、組織はデータ管理を簡素化してビジネスをいち早く成長させる必要があります。すべてのアプリケーションとデータにクラウド運用のエクスペリエンスを提供するHPE GreenLake for Storageを利用すれば、ビジネストランスフォーメーションを加速させることができます。
HPEデータサービスでは、運用の足かせとなっていた複雑なIT環境を簡素化するとともに、各種のSaaSアプリケーションを活用してエッジからクラウドまでのクラウド運用エクスペリエンスをサポートできます。同時に、あらゆるお客様のあらゆるアプリケーションにクラウドエクスペリエンスをもたらす、ワークロードに最適化されたインフラストラクチャでデータを活用できます。
データ管理の最新化にあたり、必要となるのがデータファーストのアプローチです。HPE GreenLakeはデータ保護を最新化し、セキュリティの脅威を防御する仕組みを構築してデータモビリティを最大限まで向上させるとともに、エッジからクラウドまでのデータを活用してエッジにおけるイノベーションをサポートします。