
数据湖 什么是数据湖?
什么是数据湖?
数据湖是一种存储库,提取到其中的数据采用了其原始形式,不做任何修改。数据湖不同于数据仓库或孤岛,其利用搭载对象存储的扁平架构来维护文件的元数据。作为较大数据管理平台的组成部分时,数据湖能够发挥较高实用价值。此外,其也能够与现有数据和工具紧密集成,以促成更强大的分析。目标在于发掘洞见和趋势,同时保持安全性、可扩展性和灵活性。

- 数据湖释义
- 组织为何会选择数据湖?
- 数据湖的优势
- 数据湖与数据仓库的比较
- 什么是数据湖平台?
- 目前数据湖可应用在哪些领域?
- HPE 与数据湖
数据湖释义
数据湖用于将大量采用其原生、原始格式的数据存放在一个中心位置(通常是云中)。只要利用实惠的对象存储、开放格式和云可扩展性,许多应用就可利用数据湖中数据所蕴含的价值。
- 所有类型的定性数据,包括非结构化(通常称为大数据)和半结构化数据都可存储。对于当下的机器学习和高级分析用例来说,这一点十分关键。
- 在联网空间中,将基础设施和端点遥测看作描述符或分类器,而描述符或分类器可馈送 AI/ML 模型和算法以识别基线和异常。
- 作为客户,您的基础设施和端点客户端会馈送数据湖,您的联网供应商会维护数据湖以交付基于 AI 的工具来协助 IT 更高效地运营网络。


点击图像以放大