Ajustement
Qu’est-ce que l’ajustement de modèle IA ?
Dans le domaine du machine learning, l’ajustement consiste à modifier les paramètres d’un modèle préentraîné afin de répondre à une tâche ou à un ensemble de données spécifiques. Le modèle est réentraîné sur des données liées à la tâche cible tout en conservant l’expertise antérieure.
- Comment fonctionne l’ajustement ?
- Le processus d’ajustement
- L’ajustement avec HPE
Comment fonctionne l’ajustement ?
L’ajustement s’apparente à l’apprentissage par transfert, où le modèle utilise son expertise pour améliorer ses performances dans une tâche connexe. L’ajustement d’un modèle préentraîné permet d’obtenir de meilleurs résultats avec moins de ressources informatiques et de temps de formation que si l’on partait de zéro. Il s’agit d’un processus essentiel pour les workflows de machine learning contemporains, car il intervient dans le traitement du langage naturel et la vision par ordinateur pour adapter les modèles à de nouvelles tâches ou à de nouveaux ensembles de données.
Le processus d’ajustement
L’ajustement de modèle ML comprend plusieurs étapes :
- Modèles préentraînés : choisissez un modèle qui a été entraîné sur un grand ensemble de données et qui s’est avéré performant dans une tâche ou un domaine pertinent. Les modèles de traitement du langage naturel (comme BERT ou GPT), de vision par ordinateur (comme ResNet ou VGG) et d’autres disciplines sont autant d’exemples de modèles préentraînés.
- Définition de la tâche cible : spécifiez la tâche ou l’ensemble de données pour lesquels vous souhaitez ajuster le modèle. Pensez à l’analyse des sentiments, à la catégorisation d’images ou à la reconnaissance d’entités nommées.
- Préparation des données : collectez et traitez le nouvel ensemble de données correspondant à la tâche. Divisez les données en jeux d’entraînement, de validation et de test, et préparez-les correctement.
- Ajustement du modèle : recourez à la descente de gradient pour initialiser/réentraîner le modèle préentraîné sur le nouvel ensemble de données. Ajustez les hyperparamètres et les taux d’apprentissage pour éviter un surapprentissage ou un sous-apprentissage.
- Évaluation et validation : suivez les performances du modèle ajusté sur le jeu de validation afin d’apporter les modifications requises. Plusieurs cycles d’entraînement et d’évaluation peuvent être nécessaires pour ajuster les performances.
- Test et déploiement : testez le modèle ajusté sur le jeu de test afin de déterminer ses capacités de généralisation. Pour finir, appliquez le modèle d’inférence ajusté en situation réelle.
- En suivant ces étapes, l’ajustement adapte les modèles préentraînés à de nouvelles tâches ou à de nouveaux ensembles de données, améliorant ainsi ses performances et son applicabilité dans de nombreuses applications de machine learning.
L’ajustement avec HPE
HPE (Hewlett Packard Enterprise) permet d’ajuster des modèles via sa plateforme Machine Learning Data Fabric (MLDES), ses services d’IA générative et ses solutions de calcul d’entreprise pour la GenAI. Chacun de ces composants facilite l’ajustement :
- HPE MLDES : MLDES gère et traite des ensembles massifs de données de machine learning. Il rationalise la préparation des données, l’entraînement de modèle et le déploiement des modèles ML pour ajustement. Les sources de données, le contrôle des versions et la collaboration s’intègrent de manière fluide à MLDES pour simplifier l’ajustement.
- HPE AI Services – GenAI : les solutions d’IA générative de HPE permettent aux entreprises de tirer profit de capacités d’analyses et d’IA élaborées. Ces services couvrent le traitement du langage naturel, la vision par ordinateur et les outils et techniques d’analyse prédictive. Les entreprises peuvent utiliser les services d’IA générative pour obtenir des modèles préentraînés et des cadres de personnalisation des tâches ou des ensembles de données.
Offre HPE de calcul pour grande entreprise pour l’IA générative : les solutions de calcul d’entreprise de HPE acceptent les charges de travail d’IA, y compris l’ajustement. Ces solutions conjuguent infrastructure HPC, stockage évolutif et services cloud optimisés pour l’IA. Les capacités de calcul d’entreprise de HPE peuvent appuyer les entreprises dans le développement des opérations d’ajustement pour répondre à l’évolution des besoins et optimiser les performances des modèles IA.
L’ajustement de modèles face à la génération augmentée de récupération (RAG)
Aspect | Ajustement | RAG Génération augmentée par récupération |
---|---|---|
1. Méthodologie | Ajuste les paramètres du modèle préentraîné pour des tâches ou des ensembles de données spécifiques. | Utilise un mécanisme d’extraction pour améliorer les tâches de génération, combinant ainsi des modèles d’extraction et de génération. |
2. Données d’entraînement | Requiert des données d’entraînement spécifiques de la tâche cible pour l’ajustement. | Peut exploiter de grands corpus de textes pour les composants d’extraction et de génération. |
3. Adaptabilité | Plus grande adaptabilité à un large éventail de tâches et de domaines. | Convient principalement aux tâches de génération avec extraction d’informations contextuelles. |
4. Performances | Peut atteindre des performances élevées grâce à un ajustement spécifiquement adapté à la tâche cible. | Les performances dépendent fortement de la qualité et de la pertinence des informations extraites. |
5. Cas d’utilisation | Largement utilisé dans divers domaines tels que le NLP, la vision par ordinateur, etc. | Particulièrement utile pour des tâches comme la réponse à des questions, les systèmes de dialogue et la génération de contenu nécessitant des informations contextuelles. |