
データレイク データレイクとは
データレイクとは、データが元の形式で変更なしに取り込まれるリポジトリです。データウェアハウスやサイロと異なり、データレイクではファイルのメタデータを保持するために、オブジェクトストレージのフラットアーキテクチャーを採用しています。これが最も効果を発揮するのは、より大きなデータ管理プラットフォームの一部として、既存のデータやツールと緊密に統合されることで、より強力な分析を可能にする場合です。その目標は、セキュリティ、スケーラビリティ、柔軟性を維持しながら、有益な情報やトレンドを発見することにあります。

- データレイクの説明
- 組織がデータレイクを選択する理由
- データレイクのメリット
- データレイクとデータウェアハウスの比較
- データレイクプラットフォームの内容
- 現時点のデータレイクの使用方法
- HPEとデータレイク
データレイクの説明
データレイクは、大量のデータを加工前のネイティブ形式で一元的に保持するために用いられ、通常はクラウド上に存在します。低コストのオブジェクトストレージ、オープンフォーマット、クラウドの拡張性を利用することで、データレイクに保存されている大量のデータはさまざまなアプリケーションから活用できます。
- 非構造化データ (ビッグデータと呼ばれるもの) や半構造化データを含む、あらゆる種類の定性的データが保存可能です。このことは、今日の機械学習や高度な分析のユースケースにとって重要です。
- ネットワーキングの世界では、インフラストラクチャやエンドポイントのテレメトリが、ベースラインと異常を特定するためのAI/MLモデルやアルゴリズムに入力される記述子または分類子として用いられています。
- 顧客のインフラストラクチャやエンドポイントクライアントがデータレイクにデータを供給し、ネットワーキングベンダーはデータを保持することで、IT部門によるネットワーク運用を効率化するためのAIベースのツールを提供できます。

