L’industrie de l’IA évolue à un rythme qui peut sembler épuisant, mais la dernière initiative d’Anthropic est difficile à ignorer. Douze jours seulement après le lancement de leur modèle phare, Claude Opus 4.6, la société a lancé Claude Sonnet 4.6. Ce nouveau modèle de milieu de gamme est conçu pour réaliser quelque chose de remarquable : fournir une intelligence « de niveau Opus » à une fraction du coût.
Claude Sonnet 4.6 apporte des performances de niveau phare
Dans le monde de l’IA, il y a toujours eu un compromis. Si vous vouliez un modèle capable d’un raisonnement complexe et d’un codage impeccable, vous deviez payer un supplément pour les modèles de « classe Opus ». Si vous vouliez quelque chose de moins cher, vous deviez vous contenter de moins de « puissance cérébrale ».
Claude Sonnet 4.6 est conçu pour éliminer efficacement ce compromis. Anthropic a maintenu le prix à 3 $ par million de jetons d’entrée, le même que la version précédente, malgré l’augmentation massive des capacités. Pour mettre cela en perspective, l’exécution d’un agent d’IA hautes performances coûte désormais environ cinq fois moins cher qu’il y a quelques semaines à peine. Pour les entreprises qui exécutent des millions de tâches automatisées par jour, c’est un gros problème.
Mieux « être humain » (sur un ordinateur)
L’une des avancées les plus impressionnantes de cette version est « l’utilisation de l’ordinateur ». Il s’agit de la capacité d’une IA à regarder un écran, à déplacer un curseur et à taper dans des applications comme le ferait une personne. Lorsqu’Anthropic l’a montré pour la première fois fin 2024, c’était expérimental et un peu maladroit.
Sonnet 4.6 a atteint un niveau de compétence quasi humain, selon l’entreprise. Dans les benchmarks conçus pour tester la capacité de l’IA à naviguer dans les applications Web et de bureau, il a obtenu un score de 72,5 %, un bon bond par rapport aux 61,4 % de son prédécesseur. Il est désormais si doué pour utiliser un ordinateur qu’il correspond pratiquement au produit phare Opus 4.6, beaucoup plus cher. Cela change la donne en matière d’automatisation des tâches « héritées » : ces anciennes bases de données et portails d’assurance qui ne disposent pas d’API modernes.
Le nouveau roi du codage ?
Pour les développeurs, Claude est déjà devenu un outil technologique préféré, et Sonnet 4.6 double cette réputation. Lors des tests réels, les développeurs ont préféré ses sorties dans 70 % des cas aux versions précédentes. Il serait moins sujet à la « paresse » et suivrait des instructions complexes en plusieurs étapes avec une cohérence beaucoup plus élevée.
Au-delà de la simple écriture de code, le modèle a montré qu’il pouvait « penser à long terme ». Dans une compétition commerciale simulée appelée « Vending-Bench », l’IA a géré une entreprise pendant une année simulée complète. Elle a développé une stratégie consistant à investir massivement au cours des dix premiers mois pour renforcer ses capacités avant de pivoter pour maximiser les profits. Il a terminé la simulation avec plus du double du solde des modèles précédents, prouvant qu’il peut planifier sur des mois, et pas seulement sur quelques minutes.
Des concurrents comme Google et OpenAI affichent des dates de sortie et des retards imprévisibles. Pendant ce temps, Anthropic s’en tient à un cycle de mise à jour régulier de quatre mois. Cette cohérence permet aux CTO et aux développeurs de planifier leurs feuilles de route avec la certitude qu’un modèle meilleur et plus efficace est toujours à portée de main. Anthropic peut utiliser cela comme un avantage concurrentiel pour le marché des entreprises.
Claude Sonnet 4.6 est désormais la version par défaut pour tout le monde, y compris ceux du niveau gratuit.
