Vos équipes MLOps et de développement des modèles passent-elles davantage de temps à configurer et à gérer l’infrastructure d’apprentissage automatique plutôt qu’à construire et à déployer des modèles en production ?
HPE Machine Learning Development Environment en mode service géré est une plateforme MLOps entièrement gérée qui permet aux chercheurs et aux développeurs de modèles d’accélérer la création de modèles améliorés en diminuant la complexité et en supprimant la nécessité d’écrire un code passe-partout associé à la gestion de l’infrastructure d’apprentissage automatique. Il s’intègre facilement dans les outils et les structures d’apprentissage automatique et soutient les clients en leur fournissant leurs propres environnements cloud GCP ou AWS.
Notre plateforme facilite également la configuration et le partage de l’infrastructure IA pour les équipes MLOps et IT afin d’améliorer la collaboration et la productivité des équipes d’apprentissage automatique, tout en réduisant les coûts.
Formez les modèles plus rapidement, créez des modèles plus précis, gérez et partagez efficacement l’infrastructure IA, suivez et reproduisez aisément les expérimentations avec HPE Machine Learning Development Environment en mode service géré.
Caractéristiques
Apprenez plus rapidement des modèles avec des stratégies et des techniques d’apprentissage distribué ultra-modernes
Le HPE Machine Learning Development Environment Software s’intègre à DeepSpeed pour l’apprentissage distribué 3D-Parallel (parallèle aux données, aux modèles et aux pipelines), pour accélérer l’apprentissage de modèles de grand format comme GPT-NeoX.
Passez à Horovod et bénéficiez d’un apprentissage distribué en parallèle des données, facile à utiliser.
Faites l’acquisition de PyTorch Distributed Data Parallel (DDP) et profitez de la flexibilité et du choix de stratégies d’apprentissage distribué.
Amélioration efficace des configurations de modèles avec des techniques d’ajustement des hyperparamètres ultra-modernes
Le HPE Machine Learning Development Environment Software inclut une implémentation à un niveau de production des créateurs de l’algorithme d’hyperbande Asynchronous Successive Halving (ASHA) pour la recherche et l’optimisation HPE.
Définissez votre propre logique de coordination par de nombreux essais menés au sein d’une expérimentation.
Implémentez vos algorithmes personnalisés de recherche d’hyperparamètres, d’assemblage, d’apprentissage actif, de recherche d’architecture neuronale et d’apprentissage par renforcement.
Partage facile des GPU et accélérateurs avec la programmation intelligente des flux de machine learning et la gestion des ressources
Avec le HPE Machine Learning Development Environment Software, vous pouvez aisément partager vos processeurs graphiques et vos accélérateurs, sur site ou dans le cloud, avec vos équipes en charge des opérations et du développement de l’apprentissage automatique.
Exécutez les tâches de machine learning et HPC en parallèle sur le même cluster, avec un gestionnaire des charges de travail comme Slurm ou PBS, et des environnements d’exécution en conteneur sécurisés comme Singularity/Apptainer, Podman, ou NVIDIA® Enroot.
Utilisez facilement des instances ponctuelles ou préemptibles pour gérer les coûts du cloud.
Formez des modèles sur carte graphique NVIDIA ou AMD sans aucune modification de code, avec la prise en charge fondamentale de l’hétérogénéité des accélérateurs.
Une expérience utilisateur cohérente pour les déploiements sur votre ordinateur vers un supercalculateur, et tous les outils intermédiaires notamment : sans système d’exploitation, machine virtuelle (dont les solutions IaaS sur le cloud et sur site), Kubernetes, Slurm et PBS.
Suivez et reproduisez vos tâches avec le suivi d’expérimentation intégré et le registre de modèles
Le HPE Machine Learning Development Environment Software fournit un suivi d’expérimentation intégré qui couvre le code de modèle, la configuration, les hyperparamètres, les indicateurs métriques et les points de contrôle.
Créez des versions, ajoutez des annotations et organisez des modèles formés pour une collaboration efficace des équipes MLOps avec les développeurs pour gérer le cycle de vie de vos modèles.
- AMD est une marque commerciale d’Advanced Micro Devices, Inc. GCP est une marque déposée de Google LLC. Linux est la marque déposée de Linus Torvalds aux États-Unis et dans d’autres pays. NVIDIA est une marque commerciale ou déposée de NVIDIA Corporation aux États-Unis et dans d’autres pays. Red Hat est une marque déposée de Red Hat, Inc. aux États-Unis et dans d’autres pays. Toutes les marques de tiers sont la propriété de leur(s) propriétaire(s) respectif(s).
Liens connexes
QuickSpecs
HPE Services
- HPE Financial Services
- Consulting Services
- HPE Managed Services
- HPE Complete Care Service
- HPE Tech Care Service
- HPE Lifecycle Services
- HPE Education Services
HPE Cray AI Development Environment
- Créez plus vite et facilement des modèles de machine learning.
- Conception basée sur la plateforme de formation de modèles open-source Determined.
- Notes de version
HPE Machine Learning Development Environment - Déploiement
- Déployer sur site
- Déployer sur Slurm ou PBS
- Déployer sur Kubernetes
- Déployer sur AWS
- Déployer sur GCP
Determined : Plateforme d’apprentissage approfondi à code source libre