HPC 云
什么是 HPC 云?
HPC 云,又称高性能计算云,将高性能计算资源和功能与云计算基础设施集成在一起,集传统 HPC 系统的算力和可扩展性与云服务的灵活性和按需提供特性于一体。
在 HPC 云环境中,用户可以访问并利用大量计算资源(包括处理能力、内存和存储)以执行复杂的资源密集型任务。这些任务包括模拟、科学研究、数据分析和其他需要海量计算资源的计算密集型工作负载。
HPC 云提供诸多优势,包括:
- 可扩展性:用户可以根据需求扩展计算资源,从而高效处理不同的工作负载。
- 成本效率:通过基于云的模式,用户只需为使用的资源付费,不再需要购置和维护价格高昂的专用 HPC 基础设施。
- 灵活性:HPC 云平台提供了各种硬件配置和软件环境,让用户可以根据任务需要选择设置。
- 可访问性:用户可以远程访问 HPC 云资源,这样分散团队便可有效协作,而研究人员可以不必亲自前往硬件所在位置便能开展实验。
- 资源优化:通过编排工具动态配置和管理资源可有效利用算力,将空闲时间降至最低。
HPC 云服务由不同的云提供商提供,如 Amazon Web Services (AWS)、Microsoft Azure、Google Cloud Platform (GCP) 等。这些服务为组织和研究人员提供了一种利用高性能计算能力的方式,从此告别管理和维护 HPC 群集的繁琐工作。
HPC 云为何重要?
HPC 云(高性能计算云)之所以重要有多种原因,因为它解决了许多挑战并为组织和研究人员在处理计算密集型任务方面提供了巨大的助益。以下是 HPC 云为何重要的一些原因:
- 适应性:传统 HPC 基础设施通常拥有固定容量,限制了处理各种计算需求的适应性。HPC 云支持无缝扩展计算资源来响应不断演变的工作负载,便于管理更广泛且更复杂的模拟和分析。
- 财务效率:建立并维持专用的 HPC 群集需要大量硬件、软件和基础设施的前期投资。HPC 云服务遵循基于消费的模式,用户仅需为所使用的资源支付费用。这就无需投入大量初始资金,有助于节约财务成本,尤其是对于计算需求波动较大的项目。
- 全球覆盖:得益于互联网,HPC 云资源随处可及。这一可访问性促进了位置分散的研究人员和团队之间的协作,简化了数据交换、工作流程和发现成果。
- 可定制程度:HPC 云平台提供了各种硬件配置和软件环境,让用户能够根据具体任务自主选择适宜的设置。这种适应性确保了用户可以选择针对其不同工作负载量身定制的资源。
- 更快收效:在云中主动配置资源的能力加快了研究人员开始实验和模拟的速度。以此缩短取得结果的周转时间,加速研发工作的节奏。
- 高效的资源分配:HPC 云平台通常配备自动化资源管理及编排功能。因此,可以根据需求动态分配和取消分配资源,在将空闲资源实例降至最低的同时最大化资源利用率。
- 恢复能力和备份:HPC 云服务经常包含数据冗余性和复制等功能,保证宝贵数据和模拟的安全,防止遭到硬件故障或预料之外的中断。
- 为应对需求高峰提供支持:某些实体会突然或间歇性产生对高性能计算的需求。HPC 云让它们在高峰时期不必提供内部基础设施就可以立即访问云资源。
- 可供小型实体访问:HPC 云普及了对高性能计算资源的访问。缺乏资源投入专用 HPC 硬件的小规模组织和研究人员可以利用云服务执行高级计算。
- 促进创新:HPC 云消除了阻碍实验和探索新概念的障碍,使研究人员能够更高效地创新和发掘全新的洞见。
HPC 云为组织和研究人员提供了一个灵活、经济高效且可实现的途径,使他们能够利用高性能计算能力却没有传统本地 HPC 基础设施的复杂性和限制。
HPC 云面临哪些挑战?
尽管 HPC 云(高性能计算云)具有诸多优势,但也面临多个妨碍成功实施的挑战。其中一些挑战包括:
- 变化多端的性能:分享云资源可能对应用性能产生负面影响,特别是对于高性能计算工作负载来说,会损害应用性能的可预测性和一致性。
- 网络延迟和连接:快速可靠的网络连接对高性能计算应用来说至关重要,因为分享云资源时的延迟会破坏应用速度和响应能力。
- 数据传输复杂性:与云之间传输大量数据既耗时又成本高昂,尤其是对于各种各样的数据集来说更是如此。数据传输瓶颈可能会阻碍云资源的有效利用,影响整体性能。
- 安全性与数据隐私:敏感数据或专有数据存储在共享云环境中会引发安全性及合规性方面的担忧。确保具备强大的数据安全和隐私措施对保护敏感信息显得格外重要。
- 软件许可挑战:HPC 应用通常依赖专用软件和许可。在云环境下管理软件许可证错综复杂且有可能导致额外的开销或合规性问题。
- 有效的成本管理:云服务提供了灵活性,但如果未监控和优化资源利用情况,即用即付模式可能会产生预料之外的费用。实施策略以高效管理成本对防止预算超支非常重要。
- 避免供应商锁定:将 HPC 工作负载迁移到特定云提供商的生态系统可能会导致供应商锁定。这样不但限制了灵活性,同时还使得在提供商之间转移工作负载或将工作负载转回本地解决方案复杂化。
- 跨云数据移动性:在涉及多个云提供商或混合云设置的场景中,在各种云环境之间无缝移动数据和工作负载可能错综复杂,需要专用工具和方法。
- 确保应用兼容性:某些 HPC 应用设计用于在特定硬件架构上运行。确保与可用云实例类型和虚拟化技术的兼容性是一大问题。
- 管理复杂性:编排和管理云中的 HPC 工作负载可能需要专业化技能和工具。将云服务与现有 HPC 基础设施和工作流程集成将增加管理流程的复杂性。
- 监管合规性障碍:不同行业可能有不同的监管合规要求,这会影响到 HPC 工作负载的处理和存储。这些要求会影响云提供商和部署策略的选择。
- 缺少基础设施控制:将 HPC 工作负载转移至云需要放弃对底层基础设施的一些控制。这种放弃可能会引起组织忧虑,特别是具有特定性能和安全性前提条件的组织。
克服这些挑战需要缜密的规划、周到的架构设计以及善用适当的技术和策略。该方法确保了可以发挥 HPC 云的优势,同时有效解决潜在的缺点。
企业为何在云中运行 HPC 工作负载?
HPC 云可以迅速加快创新并降低对内部部署 HPC 的需求或依赖,支持自动化、人工智能和机器学习功能。企业可以更快地打造解决方案和产品并更快投向市场,增强自身的竞争优势。在云中,HPC 可以根据需求或特定团队要求分成特定的工作负载。HPC 云也更加灵活,可以扩大或缩小规模以免浪费资源。传统 HPC 有许多长期成本要求,即前期架构和配置,而 HPC 云可采用第三方服务(即服务)的形式提供,免去了这些成本要求。该即服务模式(或消费型模式)确保企业只为其使用的计算资源付费。这种向所提供托管式解决方案模式的转变使广泛用户更易于获得 HPC 和 HPC 云资源;若没有这种转变,这些用户可能无法获得此类资源。
什么是云中的 HPC 解决方案?
企业使用 HPC 云解决方案处理各种应用,包括分析、信息访问、科学研究等等。
例如,制造商将使用计算机辅助工程开发先进的原型,无需配备如实操实验室和研究之类的大量实体资源,实验和模拟均在云中完成。
医疗保健研究人员可以利用 HPC 聚合患者医疗信息和数据,进而推动疾病研究、医疗试验和药物开发。HPC 云甚至可以加快基因组处理和排序。
HPC 是金融服务不可或缺的一部分,其中的风险分析和欺诈检测需要对多个数据源进行快速全面的处理,从而正确告知投资收益率和预测,并利用历史数据分析近乎实时地识别异常采购行为。
HPC 大众化也同样延伸到电影、媒体和游戏开发领域,在这些领域中,借助工作负载可进行图形渲染、图像分析、转码和编码。
HPC 云架构和组件
云中的 HPC 包括使用云资源进行复杂的计算和需要大量算力的模拟。
了解 HPC 云环境的要素:
HPC 云环境由多个关键要素组成:
- 虚拟机 (VM):这些是云的基本构建块。虚拟机提供了运行应用所需的计算资源。在 HPC 的环境下,这些虚拟机通常配备高性能 CPU、GPU 或专业化硬件来加速计算。
- 弹性和可扩展性:云可以根据需求增减资源。这在 HPC 中至关重要,因为其中的工作负载规模和复杂性可能各不相同。当工作负载繁重时,云平台允许增加额外的虚拟机,当不再需要这些虚拟机时可以释放它们。
- 编排和管理:类似 Kubernetes 的工具或云特定管理平台有助于跨多个虚拟机自动部署和管理 HPC 应用。这确保了有效的资源利用和工作负载分配。
- 监控和日志记录:HPC 云环境需要全面的监控以跟踪资源利用率、性能指标和潜在瓶颈。日志和指标有助于诊断问题并优化性能。
高性能计算云基础设施:
云提供商提供了 HPC 工作负载专用基础设施,包括:
- 计算实例:这些是具有各种 CPU、GPU 和内存配置的虚拟机,用以满足不同的计算需求。
- GPU 和加速器:许多 HPC 工作负载受益于图形处理单元 (GPU) 和其他加速器。这些硬件组件专门用于有效地并行处理任务。
- 高性能存储:云提供商提供了专为高吞吐量和低延迟设计的解决方案,这对 HPC 工作负载来说至关重要。这种解决方案提供网络连接存储 (NAS) 和对象存储之类的选项。
- 突发和即时型实例:突发实例允许您在峰值负载期间临时使用额外的资源。即时型实例这种经济性实例可由云提供商中断,但若使用得当,可以大幅降低成本。
云中 HPC 的网络和存储注意事项:
- 网络:HPC 工作负载需要低延迟和高带宽网络进行有效的节点通信。云提供商提供高速互连选项以便于进行这一通信。
- 数据移动:高效的数据移动在 HPC 中至关重要。云平台提供了丰富的工具和解决方案,用于与云之间安全地传输大型数据集。
- 存储:云存储选项包括对象存储、文件存储和块存储。
- 数据所在地:将计算资源和数据存储放置在附近可尽可能缩短数据传输时间并增强性能。
HPC 云环境将专用计算实例、加速器、高性能存储和强大的网络集中在一起,提供了复杂模拟和计算所需的算力。高效的编排、监控和数据管理对于充分发挥云中 HPC 的优势至关重要。
面向高性能计算的云服务
A. 适用于 HPC 的虚拟机和容器:
- 利用虚拟机处理 HPC 工作负载:
虚拟机 (VM) 广泛用于运行 HPC 工作负载。云提供商提供了具有不同 CPU、GPU 和内存配置的 VM 实例来满足特定计算需求。虚拟机提供了管理 HPC 应用的隔离、安全性和灵活性。
- HPC 云环境中的容器化和编排:
诸如 Docker 之类的容器提供了一致的轻量级应用环境。这些容器囊括了应用及其依赖项。Kubernetes 之类的容器编排平台对于管理复杂的 HPC 工作流程、确保资源高效利用、缩放及负载平衡来说至关重要。
- 虚拟机和容器的性能考虑:
虽然容器提供了更快的部署和可移植性,但虚拟机提供更强大的隔离功能且可能更适合特定 HPC 工作负载。当为 HPC 应用在虚拟机和容器间进行选择时,考虑如启动时间、资源开销和隔离要求之类的因素。
B. 云中的高性能网络:
- 高带宽和低延迟网络选项:
- 云提供商提供了对 HPC 通信至关重要的高速网络选项。该技术降低了延迟并增加了带宽,便于数据在节点之间高效传输。
- 适用于云中 HPC 的 RDMA(远程直接内存访问):
- RDMA 支持在节点之间直接进行内存访问而不涉及 CPU,从而降低通信开销。支持 RDMA 的网络适配器通过加速数据传输可以大幅提高 HPC 性能。
- 适用于 HPC 工作负载的网络拓扑和互连:
云提供商通常允许您自定义网络拓扑以确保为 HPC 应用提供最合适的通信模式。该拓扑包括网格、Torus 或胖树拓扑结构,可将延迟降至最低并提高数据吞吐量。
C. 适用于 HPC 的可扩展存储解决方案:
- 云中的对象存储和分布式文件系统:
云平台提供了可扩展对象存储解决方案和分布式文件系统。这些存储选项旨在处理大量数据。
- 适用于 HPC 存储的突发缓冲区和高速缓存技术:
突发缓冲区是高速中间存储层,用于应对 HPC 作业期间激增的 I/O。内容交付网络或内存中缓存之类的高速缓存技术可优化常用数据的数据访问时间。
- HPC 云设置中的数据移动和数据管理:
高效的数据移动工具对于 HPC 工作负载来说至关重要。云提供商提供多种多样的传输服务和工具,以供在本地和云环境之间移动大型数据集。有效的数据管理策略可确保数据完整性、可访问性和合规性。
HPC 云服务涉及优化虚拟机和容器、利用高性能网络选项以及实施可扩展存储解决方案。这些要素共同支持在云环境中执行要求严苛的 HPC 工作负载。
适用于 HPC 的云编排和自动化
A. 自动化 HPC 部署和资源管理:
- 自动化工具:云编排工具支持自动部署 HPC 环境。这些工具允许您将基础设施配置定义为代码,然后在各个云实例中进行一致地部署。
- 配置管理:配置管理工具可以在虚拟机或容器上自动执行软件设置和配置,以确保跨 HPC 群集的一致性。
- 自动扩展:根据工作负载要求自动扩展资源。云平台允许您设置自动扩展规则以调整实例数量,灵活满足工作负载要求。
B. 适用于 HPC 云环境的基础设施即代码 (IaC):
- IaC 优势:IaC 将基础设施配置和管理视作软件开发,在创建和修改 HPC 环境中提供了版本控制、一致性和可重复性。
- 声明式配置:IaC 允许您声明基础设施所需的状态,然后编排工具便会处理配置细节。这对于复杂 HPC 设置来说尤为重要。
- 协作与可重复性:IaC 通过共享基础设施代码,不但在各个团队间实现了协作,还确保了能够以一致方式重建相同环境,从而减少配置错误。
C. 将 HPC 调度程序和资源管理器与云编排集成:
- HPC 调度程序:HPC 群集通常使用 Slurm、Torque 或 PBS 之类的调度程序管理作业调度和资源分配。这些调度程序优化了多用户环境中的资源利用。
- 云集成:云编排可以与 HPC 调度程序协作。例如,可以根据作业要求动态配置云实例,一旦作业完成,便可终止这些实例。
- 混合环境:许多 HPC 工作负载涉及本地和云资源的混合。将本地群集与云资源集成需要细致编排以确保作业高效执行。
云编排和自动化对于在云中管理复杂的 HPC 环境来说至关重要。基础设施即代码和自动化工具简化了 HPC 群集的部署和管理,而与 HPC 调度程序的集成则确保了高效利用资源和调度作业。
HPC 云中的性能与优化
A. 监控和优化云中的 HPC 性能:
- 性能指标:监控诸如 CPU 利用率、内存使用情况、磁盘 I/O 和网络延迟之类的关键性能指标。云提供商提供了监控和日志记录服务来跟踪这些指标。
- 资源利用率:分析资源利用率以确定瓶颈和改进之处。根据资源需求增减规模以帮助保持最佳性能。
- 分析和基准测试:分析 HPC 应用以确定低效之处。借助基准测试可比较不同配置下的性能以选择最佳设置。
B. 适用于 HPC 工作负载的自动扩展和动态资源分配:
- 自动扩展策略:实施自动扩展规则以根据工作负载需求动态调整实例数量。自动扩展可在峰值负载期间保持性能并在低负载时节约成本。
- 预测性扩展:使用预测性算法或机器学习主动预测工作负载模式并调整资源。
- 即时型实例:利用云提供商的即时型实例,经济高效地扩展。即时型实例价格较低,但在需求增加时可由提供商中断。
C. 适用于云中 HPC 的 GPU(图形处理单元)加速:
- GPU 实例:选择配备有利于并行处理工作负载的 GPU 的云实例。GPU 在机器学习、模拟和渲染等任务中表现出色。
- GPU 加速库:利用 GPU 加速库和框架可改善性能。常见示例包括 CUDA(NVIDIA 的并行计算平台)和 cuDNN(NVIDIA 深度神经网络库)。
- 容器化 GPU 工作负载:容器化可封装 GPU 加速应用以实现可移植性和一致性。Kubernetes 和 Docker 支持 GPU 集成。
- GPU 调度:确保适当的 GPU 资源调度以免争用。VM 级别和容器级别的 GPU 资源分配都需要有效的管理。
在云中优化 HPC 性能涉及密切监控性能指标,通过自动扩展高效分配资源以及适用时利用 GPU 加速。通过采用这些策略,您可以为 HPC 工作负载尽可能实现最佳性能,同时有效管理成本和资源。
HPC 云中的安全性与合规性
A. HPC 云环境中的数据安全与加密:
- 数据加密:对静态数据和传输中数据实施加密。云提供商提供了加密机制以保护存储服务中存储以及实例之间传输的数据。
- 密钥管理:使用云平台或第三方解决方案提供的密钥管理服务安全管理加密密钥。
- 数据保留:选择符合组织数据保留要求的数据中心和地区。确保数据保留在指定辖区以履行法律和监管义务。
B. 适用于 HPC 工作负载的访问控制和用户身份验证:
- 身份和访问管理 (IAM):IAM 工具控制着用户对云资源的访问权限。实施最低权限原则以确保用户只拥有完成任务必需的资源访问权限。
- 多因素身份验证 (MFA):强制实施 MFA 以进行用户身份验证来增加额外的安全层。即使密码遭到破解,也可防止未经授权的访问。
- 基于角色的访问控制 (RBAC):实施 RBAC 以定义角色和权限。根据用户的职责为其分配角色以确保适当的访问控制。
C. 针对云中敏感 HPC 数据的合规性考虑:
- 监管合规性:了解您所处行业和地理区域的法规环境。确保您的云设置符合 GDPR、HIPAA 等法规。
- 数据分类:根据敏感等级对数据进行分类。对敏感数据采取适当的安全控制措施和访问限制。
- 审核和日志记录:启用云提供商提供的审核和日志记录功能。保留用户活动和系统事件日志以供合规性和安全性分析。
- 云提供商合规性:选择提供您行业相关合规性认证的云提供商。云提供商经常接受第三方审核以确保遵守行业标准。
- 合同协议:与云提供商审核并协商合同条款以确保其满足贵组织的合规性要求。
确保 HPC 云环境的安全性与合规性涉及采取强有力的数据加密方式、实施严格的访问控制以及周全考虑行业法规。通过采取这些措施,您可以在遵守法规要求的同时保持敏感数据的机密性、完整性和可用性。
HPC 云的成本管理和预算编制
A. 云中 HPC 的成本考虑因素和定价模式:
- 定价模式:了解云提供商提供的定价模式,如按需实例、保留实例和即时型实例。根据使用模式,每种定价模式都有不同的成本影响。
- 资源成本:计算资源、存储、网络和数据传输构成了成本。注意与每个组件有关的成本。
- 数据传输成本:在云中传入传出数据可能会产生额外费用。将必要的数据移动降至最低并考虑使用数据压缩技术。
B. 为 HPC 工作负载适当调整规模并优化成本:
- 实例选择:选择符合您的工作负载计算要求的实例类型。避免资源过度配置或利用不足。
- 自动扩展策略:实施自动扩展以根据工作负载需求动态调整实例数量。这有助于实现资源和成本的优化利用。
- 即时型实例:将即时型实例用于非关键工作负载以节省成本。不过,要为可能的中断做好准备。
- 保留实例:如果您有可预测的工作负载,可以考虑保留实例。这些实例可节省成本,进而换取更长的使用时间。
C. HPC 云环境中的预算规划和成本分配:
- 预算分配:为不同的 HPC 项目或部门定义预算。云提供商经常会提供预算编制工具以设定支出限制并在接近门槛时收到警报。
- 资源标记:用相关元数据(如项目名称、部门)标记云资源以准确跟踪支出并相应地分配成本。
- 成本跟踪和报告:定期审查云提供商提供的成本报告。分析支出模式以确定可实现成本优化的方面。
- 保留实例规划:从战略角度规划保留实例采购以满足长期性工作负载预测需求。避免保留容量过度使用或利用不足。
- 成本管理工具:利用第三方成本管理工具提供更精细的支出模式洞见并提出优化建议。
有效地管理云中 HPC 工作负载的成本和预算涉及了解定价模式、优化资源利用以及根据项目要求规划预算。通过缜密监控和控制成本,您可以确保 HPC 项目在财务方面保持可持续性和高效率。
HPC 云 — 选择云环境时有哪些关键考虑因素?
为高性能计算 (HPC) 选择合适的云环境需要仔细考虑各种因素。以下是需要牢记的几点重要事项:
- 计算和加速资源:评估云提供商产品中的 CPU、GPU 和其他加速器的类型。选择拥有适合您特定工作负载要求的硬件的提供商。
- 网络性能:寻找具备高带宽和低延迟网络选项(如增强网络或 InfiniBand)的云提供商,以支持节点之间高效通信。
- 可扩展性和弹性:考虑提供无缝自动扩展和动态资源分配来处理各种 HPC 工作负载需求的提供商。
- GPU 和 HPC 库:查看符合您应用需求的 GPU 加速库和框架的支持和可用性。
- 存储解决方案:评估存储选项的可扩展性和性能,这些存储选项包括对象存储、分布式文件系统和高吞吐量存储解决方案等。
- 数据传输和移动:考虑与云之间传输数据的便利性和成本,尤其对于大型数据集而言。
- HPC 软件兼容性:确保云环境支持您的 HPC 应用依赖的软件和工具。
- 资源管理工具:寻找强大的资源管理和监控工具,从而可以高效控制 HPC 群集和工作负载。
- 安全性与合规性:选择通过严密安全措施、合规性认证和加密选项保护敏感 HPC 数据的云提供商。
- 成本和预算编制:比较定价模式,了解资源成本,并考虑您的预算限制。追求成本优化功能,如保留实例或即时型实例。
- 混合云与本地集成:如果您在混合环境中开展工作,请评估一下云提供商与您的本地基础设施集成的难易程度。
- 位置与数据保留:选择符合您数据保留要求的云区域,并提供最佳地理临近位置以降低延迟。
- 支持和 SLA:评估云提供商提供的技术支持等级、服务级别协议 (SLA) 以及响应能力。
- 用户体验与易用性:考虑云提供商提供的用户界面、易部署性和管理工具。
- 供应商锁定:考虑潜在的供应商锁定并评估必要时将工作负载迁移到其他提供商的难易程度。
- 社区和文档记录:检查云提供商 HPC 产品的支持社区、文档记录和教程的可用性。
为 HPC 选择云环境取决于您的特定工作负载要求、性能需求、预算和长期策略。要确定哪家云提供商最符合贵组织的目标,全面研究并测试不同的选项至关重要。
HPC 云的未来趋势和创新
A. HPC 云硬件和基础设施的进步:
- 专用加速器:云提供商将提供专用加速器(如现场可编程门阵列 (FPGA) 和专用集成电路 (ASIC))以满足特定的 HPC 工作负载。
- 量子计算即服务:随着量子计算趋于成熟,云提供商可以为研究人员提供量子硬件,支持他们探索量子算法和应用。
- 内存密集型实例:增强的内存容量和带宽对大规模模拟和数据分析等内存密集型 HPC 工作负载来说越来越重要。
B. 旨在提高 HPC 云性能和效率的新兴技术:
- 容器原生 HPC:容器技术将进一步演变以更好地支持 HPC 应用,提供轻量化的可重现环境。
- 无服务器 HPC:无服务器计算模式可能对 HPC 工作负载颇具吸引力,这种模式可以自动扩展并管理资源,而不必管理传统实例。
- 混合计算:云提供商可以无缝集成量子计算、神经形态计算和典型计算,从而支持混合模拟和新的探索。
C. 适用于 HPC 工作负载的 AI 驱动型管理和优化:
- 自主 HPC 管理:AI 驱动型编排和资源管理工具将变得更复杂,可优化资源分配和工作负载调度。
- 预测性分析:机器学习模型将预测 HPC 工作负载模式,从而实现主动扩展和资源分配。
- 能效优化:AI 通过在 HPC 工作负载执行时动态调整资源并将能耗降至最低,在优化功耗中发挥了作用。
- 自动优化:AI 驱动型工具将自动执行 HPC 应用参数优化流程,从而提高性能并减轻手动优化工作量。
- 异常检测和安全性:采用 AI 技术的异常检测在识别实时异常行为、潜在安全威胁和性能瓶颈方面将变得至关重要。
云中 HPC 的未来发展取决于多种因素,如硬件进步、量子计算等新兴技术以及 AI 驱动型优化和管理的集成。在这些趋势的共同作用下,研究人员和组织将获得更强大、高效且便于访问的 HPC 能力。
HPE 与 HPC 云
HPE 提供广泛的 HPC 和 HPC 云产品组合,包括实现 HPC 的高性能硬件、软件和存储,并提供专业知识和托管服务来加快转型。
企业可以选择专门用于处理融合建模、模拟和 AI 之类任务的 HPE Cray 百万兆次级超级计算机或 HPE Apollo 系统。对于存储,HPE 提供 HPE 计算 HPC 存储,可容纳唯一的传统全闪存文件存储,该存储仍具备经济高效和可扩展的优点。
需要完整端到端解决方案的企业可以选用适用于 HPC 的 HPE GreenLake,这是一款可扩展的托管解决方案,使任何规模的企业都可以更轻松地获享 HPC 的优势而不必面临部署挑战。适用于 HPC 的 HPE GreenLake 在本地(企业边缘、主机托管位置或数据中心)运行,让您从本地基础设施提供的安全性和控制中获益。此外,企业可以通过消费型计费,放心地知道他们不会为没有使用的资源付费,同时保持灵活性,在新机会出现之时牢牢把握住。