クラウドデータプラットフォーム

クラウドデータプラットフォームとは

クラウドデータプラットフォームはクラウドに配置されたデータセンターであり、サーバーとデータストレージを備えています。複数の拠点で複数のソースからデータへの仮想化アクセスを実現します。

クラウドデータプラットフォームの役割

組織のデジタルトランスフォーメーションに向けたプロセスの1つに、データエコシステムと企業データを従来のオンプレミスデータセンターやウェアハウスからクラウドに移行することがあります。クラウドデータプラットフォームにこうしたリソースを再配置することで、時間や場所を問わずアクセスできるデータレイクを構築できます。この「民主化」されたデータでは、構造化データも非構造化データも迅速に取得して分析をサポートできます。また、データと分析のニーズの変化に応じて、すぐにプラットフォームを拡張できます。

企業がクラウドデータプラットフォームを利用する理由

クラウドデータプラットフォームを利用すれば、これまでより簡単にデータを活用できます。リモートかオンプレミスかを問わず、あらゆる場所からデータを管理、保護、確認できます。こうした仮想データプラットフォームは、オンプレミスのデータウェアハウスの信頼性だけでなく、物理ハードウェアで到底及ばない経済性も備えています。クラウドデータプラットフォームによって組織のデータ交換における柔軟性が大幅に向上し、適切な情報に基づいたビジネスの意思決定が可能になります。

クラウドデータプラットフォームの柔軟性

クラウドデータプラットフォームは、オンプレミスのプラットフォームに比べてはるかに柔軟で、プラットフォームにホストされているデータを一元的に確認できます。こうしたプラットフォームでは、プラットフォーム上で実行されているすべてのリソース (CPUやメモリ使用率など) を完全に可視化し、実行中のクエリやそれを最適化する方法に関する有益な情報を取得することができます。 

データはクラスターで保管されており、企業は実際のワークロードの動きを監視しながらクラスターを拡縮することで、容量の使用率を改善できます。

クラウドデータプラットフォームへの移行

CIOの多くは、社内の最大使用量を予測することが困難だと考えており、パフォーマンスの問題を回避するためにデータウェアハウスをオーバープロビジョニングするケースが少なくありません。そのため、データリソースを最新化したうえで、迅速に拡張できるクラウドデータプラットフォームに移行するという方法が効果的であることは明らかです。 

しかし、多くのCIOにとって、60年以上もオンプレミスでワークロードを実行し維持してきた現状に見切りを付けるには時間がかかります。データを有効活用するため、企業はクラウドデータプラットフォームに切り替えた場合のコストベネフィット分析を行う必要があります。基本的には、移行と新規ライセンスのコストがオーバープロビジョニングと長期的な運用のコストを上回るかどうかを判断することになります。

クラウドデータプラットフォームのアーキテクチャー

一般的なデータプラットフォームは、データ管理のさまざまな面に対応する複数のコンポーネントで構成されており、次のようなレイヤー構造となっています。

  • データ系列
  • データセキュリティと監査ログ
  • メタデータ、ビジネス用語集、データカタログ、およびデータ検索
  • ストレージとコンピュート
  • データガバナンス
  • データ品質とデータトラスト

クラウドだけで、ユーザーがデータプラットフォームのすべてのコンポーネントを分離できるため、アプリケーションを簡単に拡張でき、ベンダーの独自ツールにロックインされることがなくなります。また、大多数のクラウドデータプラットフォームはコンピュートとストレージを個別に提供するため、データの制御性とアジリティが向上します。 

データはまずインポートされ、次にデータパイプでクリーニングされます。ストレージに関しては、クラウドデータプラットフォームはデータを「ホット」データと「コールド」データの2つの階層に保存します。最初の階層はメモリで、データのインデックスと最もアクセス頻度の高いデータが保持されます。次の階層はローカルディスク、または永続ディスク (SSDと呼ばれることが多い) で、通常は基本的なクラウドオブジェクトストレージ となります。この階層は一般的に処理速度が遅くなります。

データを保存する際、クラウドデータプラットフォームは最初に更新データを最も高速のインメモリ階層に書き込み、次にそれをクラウドオブジェクトストレージ階層にコピーして、全体のパフォーマンスを向上させます。ホットデータ階層は、クエリを受けるとコールドデータ階層からデータを取得し、非常に詳細にデータを確認するため、ビジネスクリティカルなインサイトを簡単に引き出せるようになります。

クラウドデータプラットフォームのメリットとデメリット

ワークロードが変動し、非構造化データの量が増え続けるなか、ITを最新化する必要性も増大しています。しかし組織は、クラウドデータプラットフォームなどのクラウドインフラストラクチャを既存のITエコシステムに組み込むかどうか、またその方法を慎重に検討する必要があります。 

メリット

  • 柔軟性: データと分析のニーズが変化するなか、クラウドデータプラットフォームでは容量の拡張を簡単かつ迅速に行えます。
  • 可視性: クラウドデータプラットフォームは、構造化データと非構造化データを迅速に取得して迅速な分析につなげます。
  • アクセス: リソースをクラウドに移行することでデータレイクが作成しやすくなり、データを民主化して時間や場所を問わず共有できます。
  • 適正規模のコスト: クラウドデータプラットフォームの従量制モデルでは、オーバープロビジョニングされたシステムの料金を支払うのではなく、使用した分の料金を支払うだけで済みます。

デメリット

  • 稼働率: ワークロードがクラウドに移行されると、データセンターの稼働率がすぐに最大容量から3分の2の稼働率に変わる可能性があります。単一サーバーの更新サイクルを中断すると、そのような状況になります。
  • 複雑さ: ワークロードの移行により、IT運用が複雑になる可能性があります。拡縮に関する意思決定は、ビジネスの優先事項の変更やポートフォリオとワークロードの変化に応じて、ケースバイケースで行われます。
  • コンプライアンスニーズの増大: データプライバシーやデータレジデンシーの規制が絶えず変わっており、ワークロード移行のニーズも変わりやすくなっています。

クラウドデータプラットフォームの活用

柔軟なクラウドデータプラットフォームは、ワークロードやビジネス目標、市場の変化に対応するのに最適なツールです。企業がこのプラットフォームを具体的にどのように活用しているのかについては、以下の使用事例をご覧ください。

  • データの統合: 複数の表計算ソフトやその他のフラットファイルデータソースを使用するのではなく、アナリストがクラウドデータプラットフォームを利用して「データマート」を作成できます。データマートでは、複数のソースから簡単にデータを読み込んで最適化し、分析や実用的なインサイトに活用できます。
  • 運用に関する有益な情報: クラウドデータプラットフォーム上のデータは、ビジネスクリティカルなアプリケーションと簡単に統合できるため、結果を簡単に実行可能にしてアプリケーションに戻し、データ主導の意思決定を実現できます。
  • 汎用分析: データアナリストには必ず好みのツール (特にオープンソースツール) がありますが、それが一定のデータプラットフォームと互換性がないことがあります。クラウドデータプラットフォームは完全な互換性を備えており、サブスクライバーは保有するツールを組み込んでプラットフォーム内で使用できます。このように、必要に応じて有益な情報を他のツールに移行して、ベンダーロックインを回避できます。
  • ストリーミングデータの処理:  クラウドデータプラットフォームは、データレイクとデータウェアハウスの機能を兼ね備えており、ストリーミングデータなどの構造化されていない企業データを処理して、機械学習 (ML) に活用できます。

HPEとクラウドデータプラットフォーム

多くの組織は、クラウド上のデータワークロードを最適化する方法から、それらをエッジ、データセンター、クラウド、およびマルチクラウドインフラストラクチャを含むハイブリッド環境で最適化する方法まで、データ管理に関するさまざまな課題に直面しています。HPEは、ユーザーがアプリケーションやサービスをオンプレミスとクラウドで実行できるEdge-to-Cloudプラットフォームを提供するとともに、ワークロードを管理するサービスも提供しています。たとえば、増え続ける HPE GreenLakeクラウドサービス のポートフォリオには、次のようなサービスが含まれます。

  • 分析: オープンな統合分析のクラウドサービスにより、オンプレミス、エッジ、クラウドを問わず、あらゆる場所ですべてのデータとアプリケーションを最新化します。
  • データ保護: ディザスタリカバリおよびバックアップのクラウドサービスでは、お客様がランサムウェアに対処し、エッジからクラウドまでのデータ保護を実現できるよう支援します。
  • HPE Edge-to-Cloud Adoption Framework と自動化ツール: 実績のある包括的な手法、専門知識、および自動化ツールにより、場所を問わず利用できるクラウドエクスペリエンスへの移行を加速させつつ、リスクを回避できます。
  • HPE Ezmeral Data Fabricオブジェクトストア: ハイブリッド環境全体で実行できる、Kubernetesベースのストレージテクノロジーです。ファイル、オブジェクトイベントストリーム、データベースなどのさまざまなタイプのデータを同じデータファブリックに統合できます。

またHPEは先頃、 Ezmeral Unified Analyticsの提供を開始しました。このクラウドデータレイクハウスプラットフォームは、データファブリックを提供するオープンソーステクノロジーのグループで構成されており、ユーザーは単一ベンダーのテクノロジーへのロックインを回避しつつ、データ分析やビジネスインテリジェンスのワークロードを実行できます。