Calcul pour IA
HPE ProLiant Compute DL384 Gen12
Rendez vos charges de travail mixtes, gourmandes en mémoire et IA, telles que l’ajustement et l’inférence, plus efficaces grâce à la génération augmentée par récupération (RAG).
Déploiements à grande échelle avec des solutions rack pour toute utilisation de l’IA
Partie intégrante de l’offre NVIDIA AI Computing by HPE, le serveur HPE ProLiant Compute DL384 Gen12 avec NVIDIA GH200 NVL2 peut traiter des besoins inédits en performances, ainsi que des processus d’ajustement et d’inférence à évolutivité horizontale, grâce à la génération augmentée par récupération (RAG).
Un passage accéléré à l’IA générative
Mettez l’intelligence artificielle (IA), en particulier les grands modèles de langage (LLM), au service des processus d’ajustement et d’inférence IA, avec la génération augmentée par récupération (RAG). Prenez en charge de nouvelles applications d’IA générative (GenAI) telles que la génération de textes, la traduction de langues, le codage, le contenu visuel, et bien d’autres encore.
Utilisation optimisée du datacenter
Le supercalculateur NVIDIA GH200 NLV2 avec 1,2 téraoctet de mémoire rapide, unifiée et cohérente gère les charges de travail mixtes et gourmandes en mémoire pour offrir des performances très élevées, et optimise l’utilisation du datacenter pour les tâches de calcul d’IA.
Une capacité de calcul accéléré évolutive et la productivité de l’IA d’entreprise
Conçue pour déployer de grands modèles de langage (LLM) pour l’ajustement et l’inférence IA, en s’appuyant sur la génération augmentée par récupération (RAG), avec une capacité 3,5 fois et des performances 2 fois plus élevées, cette plateforme évolutive polyvalente améliore considérablement les capacités de calcul. Pour accélérer le déploiement et les résultats de l’IA en entreprise, choisissez HPE Private Cloud AI.