Étape 1 : Préparation des données
La première étape consiste à préparer les données d'entraînement. Cela implique de collecter un ensemble de données de paires (entrée, sortie) générées par le modèle professeur. Pour l'extraction de rationnels, il est nécessaire de collecter également les étapes de raisonnement utilisées par le professeur pour prendre ses décisions.
Le format des données doit être adapté à la technique de distillation utilisée. Pour la distillation étape par étape, les données doivent inclure à la fois les entrées, les sorties et les rationnels.
Étape 2 : Choix des modèles
Il est important de choisir des modèles appropriés pour le professeur et l'étudiant. Le professeur doit être un LLM pré-entraîné performant, tandis que l'étudiant doit être un modèle plus petit et plus efficace. Le choix de l'étudiant dépendra des contraintes de ressources et des exigences de performance.
Il existe de nombreux LLM open source disponibles, tels que GPT-4o (mentionné dans la vidéo) et deepseek (mentionné dans la vidéo). Il est également possible d'utiliser des modèles personnalisés ou des modèles disponibles via des API.
Étape 3 : Entraînement du modèle étudiant
L'étape suivante consiste à entraîner le modèle étudiant à l'aide des données préparées. Le processus d'entraînement dépendra de la technique de distillation utilisée. Pour l'extraction de rationnels, l'étudiant sera entraîné à prédire les rationnels générés par le professeur. Pour la distillation étape par étape, l'étudiant sera entraîné à prédire à la fois les rationnels et les sorties finales.
Des outils tels que Hugging Face AutoTrain (mentionné dans la vidéo) peuvent simplifier le processus d'entraînement et permettre d'automatiser certaines étapes.
Étape 4 : Évaluation et optimisation
Une fois l'entraînement terminé, il est important d'évaluer les performances du modèle étudiant. Cela peut être réalisé à l'aide d'un ensemble de données de test distinct. Si les performances ne sont pas satisfaisantes, il est possible d'optimiser les paramètres d'entraînement ou de modifier la technique de distillation.
L'évaluation des performances doit prendre en compte à la fois la précision et l'efficacité du modèle. Il est important de trouver un équilibre entre ces deux aspects pour obtenir un modèle optimal.