您是否需要一个高性能、高密度的系统来满足不断变化的 AI 训练工作负载需求? HPE Cray XD670 系统采用紧凑的 5U 外形规格,可大规模提升 AI 性能。HPE Cray XD670 搭载八个 NVIDIA® H200 或 H100 Tensor Core GPU,非常适合 GPU 密集型工作负载,例如大型语言模型 (LLM) 训练和自然语言处理 (NLP),有助于从大量数据中获取洞见。可选择即插即用的直接液冷,有助于提高电源效率并实现能源重复使用,从而实现可持续发展目标。专用存储与系统集成,打造可快速扩展的统一架构。HPE Cray XD670 支持强大的 HPE 软件产品组合,可帮助您简化 AI 应用的开发并将其投入生产。借助专为大规模 AI 打造的 HPE Cray XD670,突破可能性界限。
新特性
- 支持八个 NVIDIA H200 Tensor Core GPU 和第五代英特尔® 至强® 可扩展处理器。
- 支持多达 32 个 DDR5 DIMM,速度高达 5600 MT/秒。
- PCIe Gen5 数据传输速度相比于 PCIe Gen4 有明显提升,可以为固态硬盘、GPU 和其他外设卡提升数据传输速度。[1]
功能
专为 AI 工作负载打造
HPE Cray XD670 系统由八个 NVIDIA H200 或 H100 Tensor Core GPU 和 Transformer Engine 提供支持。
在 MLPerf (tm) Inference v4.0 基准测试中,对于使用 BERT 99.0 离线场景的自然语言处理 (NLP) 表现,测试结果登顶。[2]
完整的 AI 解决方案,可以从一个节点扩展到数千个节点,支持不断增长的 AI 环境。
在密集架构中提供高效率和灵活性
HPE Cray XD670 是 5U 机箱系统,包含一个 2x CPU 节点。
可选择气冷或即插即用的直接液冷 (DLC),有助于提高电源效率并实现能源重复使用,从而实现可持续发展目标。
专用集成存储能够经济高效地提供强大的读写性能。
支持广泛的互连选项,包括 InfiniBand、高速以太网和 HPE Slingshot。
简化管理和部署
HPE Cray XD670 系统包含符合 DMTF 的行业标准 Redfish,可实现简单、安全的系统管理。
HPE Performance Cluster Manager (HPCM) 可针对 HPE Cray XD670 提供自动化配置、监控、远程支持和固件更新。
HPE 服务兼具技术和专门知识,可助您加速转型并为未来做好准备。
- 1. 访问 URL https://www.intel.com/content/www/us/en/gaming/resources/what-is-pcie-4-and-why-does-it-matter.html
- “新的 MLPerf Inference 基准测试结果凸显了生成式 AI 模型的快速增长”,MLCommons(tm),2024 年 3 月.
- 英特尔至强是英特尔公司或其子公司在美国和/或其他国家(地区)的商标。NVIDIA 是 NVIDIA Corporation 在美国和其他国家(地区)的商标和/或注册商标。MLCOMMONS™ 和 MLPERF™ 是 MLCommons Association 在美国和其他国家(地区)的商标和服务标志。其他第三方商标的所有权均属于各自的所有者。