AIスーパーコンピューティング
AIスーパーコンピューティングとは
AIスーパーコンピューティングとは、人工知能 (AI) モデルを採用し、数十万台の強力なマシンで構成された超高速プロセッサーを使用して膨大な量のデータを管理および解釈することです。
AIスーパーコンピューターの仕組み
AIスーパーコンピューターは通常、数十万個のプロセッサー、特殊なネットワーク、そして膨大な量のストレージを含む、きめ細かく調整されたハードウェアで構成されます。
スーパーコンピューターは、ワークロードを分割して複数のプロセッサーに割り当て、各プロセッサーに作業を分担させます。プロセッサーは、担当する作業を実行する際に、他のプロセッサーと頻繁にやり取りします。各プロセッサーは通信グリッドを介してメッセージを送信し、問題に応じて、上下左右や前後などのさまざまな次元で情報が交換されます。この多次元プロセスは、互いに対してワークロードを適切に調整し、処理速度を向上させるのに役立ちます。
意外なことに、AIスーパーコンピューターが運用しているのは、Linuxソフトウェアでアプリケーション、ネットワーク、スケジューリングを実行する、ごく普通のオペレーティングシステムです。実行される分析プログラムは通常、CまたはFortranで書かれており、MPIと呼ばれる通信ライブラリを介してメッセージを渡します。MPIは複数のマシンで使用できます。
回路基板に小型回路が高密度に実装されたAIスーパーコンピューターは、高速化が可能な一方で、発熱量も大きくなります。これは、チップに必要な電力を出し入れする技術がまだ十分に効率化されていないため、チップが非常に高温になることが原因です。しかし、何十万ものマルチコアノードを組み合わせたスーパーコンピューターでは、膨大な冷却が必要になります。これを緩和するために、回路は銅線で作られています。銅線は非常に高い電力密度でエネルギーを伝送できるからです。スーパーコンピューターは、強制空気を利用して熱を放散させ、システム全体に冷媒も循環させています。
AIスーパーコンピューティングが分析ワークロードに対処する方法
AIスーパーコンピューターが複雑な分析ワークロードに対応できる理由は複数あります。
ノード
AIスーパーコンピューターには複数のCPUが搭載されており、非常に高速な計算速度を実現します。これらのCPU (ノード) 内には、タスクを実行するためのコアが10~12個あります。また、スーパーコンピューターはアーキテクチャー内で数千のノードをクラスター化することが多く、1,000ノードあたり12,000のコアが動作していることになります。つまり、1台のスーパーコンピューターに1000ノードあるだけで、その処理性能は数兆サイクル/秒になります。
回路
配線接続も非常に小さいため、従来のコンピューターの回路基板よりも多くの電力を回路基板に詰め込むことができます。これら2つの進歩により、複雑な算術演算と論理演算を順番に解釈して実行することが可能となっています。
処理
また、スーパーコンピューターでは、複数のワークロードを同時に実行できるよう並列処理を採用しています。具体的には、何千ものタスクが同時に処理されるため、作業はミリ秒単位で実行されます。AIスーパーコンピューターにより、業界はこれまで以上に大規模で、正確な優れたモデルをトレーニングすることができます。また、精度が高まることで、チームは、情報の分析を高速化し、重要な学習結果をプロセスに反映させ、より多くの情報源を活用してより多くのシナリオをテストできるため、業界の進歩を加速させることができます。
HPEとAIスーパーコンピューティング
HPEは、幅広いワークロードとスケールの要件に対応できるHPC/AIソリューションを提供しています。HPEのソリューションは、大規模なHPC/AIのアプリケーションとパフォーマンスに最適化され、高性能CPUおよびGPUのサポートに必要な密度と信頼性を備えた、HPC/AIワークロード向けの包括的なモジュール型ソフトウェアポートフォリオの一部です。
さらにHPEは、あらゆる規模の展開に完全に統合され、高密度プラットフォーム向けの高度な冷却オプションを備えた、大規模展開に対応するHPCハードウェアを提供しています。
HPE Crayスーパーコンピューターは、まったく新しいアプローチで画期的な機能を持つスーパーコンピューティングを実現しています。数万から数十万のノードに最適なソリューションを提供するためにインフラストラクチャを選択できる設計となっています。高密度の8ウェイGPU サーバーは、予測可能で信頼性が高く安定したパフォーマンスを提供し、大規模なワークフローで高い生産性を実現します。SlingshotインターコネクトとCrayソフトウェアによってクラウドのようなユーザーエクスペリエンスが実現し、HPE Performance Cluster Managerによって包括的なシステム管理が可能になります。
HPEは、高速コンピューティングのための業界をリードするエンタープライズプラットフォームも提供しています。HPE Apollo 6500 Gen10 Plusシステムは、NVIDIAおよびAMDアクセラレータの前例のないパフォーマンスにより、GPUを多用するワークロードで優れたコストパフォーマンスを実現します。ディープラーニングや複雑なシミュレーションとモデリングに対応する、幅広いCPU:アクセラレータ比、ワークロード、アクセラレータをサポートする柔軟性を備えており、サービスとして、また柔軟な展開 (オンプレミス、オフプレミス、ハイブリッド) に対応するハイブリッドHPCとして利用できます。
HPCをオンプレミスで実行するか、ハイブリッドクラウドで実行するかにかかわらず、HPE HPE GreenLakeを通じて提供されるHPE Pointnext Servicesは、HPC ITを最高のパフォーマンスに維持するのに役立ちます。常駐エンジニアによるガイダンスとHPEソフトウェアおよびハードウェアのカスタマイズされたサポートにより、AI戦略の設計と展開を迅速化し、HPCへの投資を最大限に活用できます。