La dernière IA de Meta peut entraîner d'autres IA sans intervention humaine

De nos jours, l’intelligence artificielle est partout. La majorité des grandes entreprises technologiques ont adopté l’intelligence artificielle, soit en créant leurs propres modèles, soit en incorporant des modèles tiers dans leurs services ou de nouvelles fonctionnalités. Meta, l'un des principaux acteurs du secteur, a annoncé un nouveau modèle d'IA « Évaluateur autodidacte » qui vise à évaluer et former de manière autonome d'autres modèles d'IA.

L’un des principaux problèmes liés au développement de modèles d’IA réside dans les coûts associés. Dans l’état actuel du secteur, des investissements importants sont nécessaires pour rattraper son retard et être compétitif. De plus, les développeurs utilisent une technique connue sous le nom de « Reinforcement Learning from Human Feedback » (RLAIF) pendant le processus de formation. Comme son nom l’indique, le RLAIF requiert la participation humaine, ce qui peut ralentir le processus. Cela dit, le nouvel évaluateur autodidacte de Meta vise à éliminer une telle exigence.

Le modèle d'IA d'évaluation autodidacte de Meta peut former et évaluer d'autres IA sans intervention humaine

RLAIF fait appel à des experts humains pour garantir que l'IA en développement apporte des réponses solides et fiables. Après tout, peu importe la puissance d’une IA si son taux d’erreur est élevé. Les parties humaines doivent également s’assurer que les données utilisées pour le processus de formation à l’IA sont factuellement exactes. Cela augmente non seulement les délais de développement mais également les coûts associés.

Cependant, le modèle d'évaluation autodidacte de Meta est capable d'évaluer et de former d'autres modèles d'IA. Pour y parvenir, Self-Taught Evaluator utilise la technique de « chaîne de pensée » qu'OpenAI a implémentée dans les modèles o1. Cette technique consiste à résoudre des problèmes complexes en les divisant en étapes logiques plus petites. Cela se traduit par des réponses plus précises dans des domaines avancés tels que les sciences, le codage et les mathématiques.

En fait, Meta a développé lui-même le modèle de l’évaluateur autodidacte avec la technique de la chaîne de pensée. Ils ont utilisé des données purement générées par l’IA pour la former. « Nous espérons, à mesure que l'IA devient de plus en plus surhumaine, qu'elle sera de mieux en mieux capable de vérifier son travail afin qu'elle soit réellement meilleure que l'humain moyen », a déclaré Jason Weston, l'un des chercheurs impliqués.

Taquiner un avenir potentiel plein d’IA autonomes

L’IA capable d’apprendre et d’évaluer par elle-même sans intervention humaine ressemble à un concept futuriste tout droit sorti d’un film de science-fiction. Cependant, les développements récents suggèrent que nous ne sommes peut-être pas très loin d’une telle situation. Les experts en IA suggèrent que la mise en œuvre de tels modèles dans divers domaines pourrait largement éliminer l’intervention humaine.