Le Sommet mondial des gouvernements vient de se tenir à Dubaï. Sam Alton, PDG d’OpenAI, a pris la parole lors du sommet. Il a donné quelques nouvelles du modèle GPT de nouvelle génération sur lequel la société travaille. Selon certaines informations, Sam Altman a parlé de GPT-5 et de la façon dont il sera « meilleur dans tout ».
Tout récemment, OpenAI a annoncé Sora. Il s’agit du générateur de texte-vidéo IA de l’entreprise. Il a pu créer des vidéos extrêmement réalistes qui pourraient tromper la plupart des gens. Actuellement, il peut produire des clips d’une durée maximale d’une minute basés sur la saisie de texte. À l’heure actuelle, l’entreprise teste uniquement ce système en interne, de sorte que le grand public ne peut pas l’utiliser.
Sam Altman parle de GPT-5
Le Sommet mondial des gouvernements vient d’avoir lieu et nous avons eu un petit aperçu de ce qu’OpenAI prévoit de faire ensuite. La société possède déjà GPT-4 et GPT-4 Turbo. Ce sont les modèles d’IA les plus puissants disponibles au public. Sous ceux-ci, il y a GPT 3.5, auquel les utilisateurs peuvent accéder avec un compte ChatGPT gratuit.
À l’heure actuelle, tous ces modèles sont extrêmement puissants et capables d’une compréhension et d’un raisonnement approfondis. Difficile donc d’imaginer que l’entreprise puisse aller encore plus loin. Cependant, selon Sam Altman, « cela va être meilleur dans tous les domaines ». C’est normal, mais nous nous demandons tous à quel point ce sera mieux. De toute évidence, chaque bond en avant rend l’IA plus comparable à l’intelligence humaine. Une IA aussi intelligente qu’un humain s’appelle AGI (intelligence générale artificielle).
Quant à savoir dans quelle mesure le GPT-5 sera plus puissant que le GPT-4, quand il sortira, où il sera disponible et s’il donnera aux êtres humains une chance pour leur argent, reste à savoir. Nous sommes certains que la société effectue des tests très préliminaires avec ce modèle. Une information dont nous disposons sur ses capacités est que, via Microsoft, GPT-5 peut déchiffrer un langage vieux de 3 000 ans que personne dans la société actuelle ne peut comprendre.
En ce qui concerne les spéculations, nous sommes presque certains que cela inclura la génération d’images via DALL-E, la génération de vidéos via Sora et éventuellement la génération audio. Cependant, cela reste à voir. Nous savons que ce sera multimodal, il est donc possible que ce soit vrai.
Et « Gobi » est son nom-o
Actuellement sous le nom de code « Gobi ». Nous n’avons pas de date de sortie exacte, mais la société prévoit de le publier cette année. Étant donné que chatGPT a été lancé à l’origine en novembre 2022, la société s’en tiendra peut-être à cette période. Cela, ainsi que tout le reste concernant gp5, reste à voir.
