OpenAI présente son modèle de raisonnement le plus puissant nommé o3

OpenAI vient de terminer son événement de 12 jours appelé « Shipmas » au cours duquel il a fait des annonces étonnantes. En guise d'adieu, OpenAI nous a présenté o3, son prochain modèle de raisonnement, et il semble qu'il sera extrêmement intelligent.

Lors de Shipmas, OpenAI a annoncé d'autres excellents cadeaux en matière d'IA. Pour commencer, il a présenté son forfait ChatGPT Pro à 200 $/mois. Cela donnera aux utilisateurs l'accès à la version la plus puissante d'o1 et à d'autres fonctionnalités intéressantes. En outre, la société a lancé Sora, son générateur vidéo IA qui a pratiquement brisé Internet lorsque la société l'a présenté pour la première fois. Vous pouvez l'utiliser si vous êtes membre de ChatGPT Plus.

OpenAI nous donne un aperçu d'o3, son dernier modèle de raisonnement

Qu'est-il arrivé à O2 ? Eh bien, il est à l'état de ferme avec Windows 9, le OnePlus 4 et l'iPhone 9. OpenAI a décidé de passer à o3 car il existe une société de télécommunications britannique nommée O2. C’était donc un moyen d’éviter tout problème juridique à l’avenir.

o3 sera un modèle de raisonnement similaire à un modèle classique. Cependant, la principale différence est qu’au lieu de vous donner la réponse d’un seul coup, un modèle de raisonnement décomposera le processus et vous montrera toutes les étapes nécessaires pour arriver à la conclusion. Gemini 2.0 Flash Thinking de Google est un bon exemple de modèle de raisonnement. Donc, si vous souhaitez examiner de plus près comment un modèle est arrivé à sa réponse, vous devrez alors utiliser des modèles de raisonnement.

Puisqu’il s’agira du magnum opus d’OpenAI, vous savez qu’il sera doté d’une intelligence insensée en matière d’IA. La société a publié des statistiques sur ses performances, qui montrent qu'elle a bien dépassé le stade de rendre l'IA plus intelligente qu'un humain (enfin, surtout).

Par exemple, la société a soumis le modèle aux tests de codage SWE-Bench Verified, et il a battu o1 de 22,8 %. Ensuite, OpenAI a soumis o3 au test scientifique Diamond GPQA (Google-Proof Q&A Benchmark), et il a obtenu un score de 87,7 %. OpenAI a également soumis o3 à l'AIME (American Invitiational Mathematics Examination), et il n'a manqué qu'une seule des 15 questions. L'AIME est un concours de mathématiques extrêmement difficile.

Il semble qu’OpenAI se soit vraiment surpassé cette fois-ci. Nous ne savons pas quand l'entreprise rendra ce modèle public. Ne comptez pas dessus de si tôt, car o1 est encore plutôt nouveau.