La bataille entre Google et OpenAI est devenue plus intense lorsque Google a finalement publié sa réponse au GPT-4 d’OpenAI. C’est quelque chose que nous attendions, puisque son lancement a en fait été retardé jusqu’en janvier 2024. Eh bien, il semble qu’il n’y ait pas de retard, puisque Google vient d’annoncer Gemini, son dernier modèle d’IA multimodal.

Google Bard est déjà assez puissant, mais la société souhaitait créer quelque chose de beaucoup plus performant. Au début de la course à l’IA générative, il s’agissait de créer le chatbot IA le plus puissant. Cependant, les temps ont changé au cours de l’année depuis le lancement de ChatGPT. Les entreprises cherchent toutes à créer le modèle d’IA tout-en-un le plus performant, capable de créer du texte et des images.

Google vient d’annoncer Gemini, et c’est assez puissant

Gemini est une avancée majeure pour l’IA de Google, et il ne se heurte pas seulement au GPT-4, il se heurte également au cerveau humain – effrayant, non ? Google a soumis Gemini à des critères fondamentaux qui l’opposent à la pensée humaine, et il a pu entrer dans l’histoire. Il s’agit du premier modèle regroupant les meilleurs experts humains du MMLU (référence de compréhension massive du langage multitâche ; il a obtenu un score de 90,0 %).

Ci-dessous, nous voyons un tableau avec huit repères. Le tableau présente les scores de Gemini par rapport aux scores de GPT-4, et nous voyons mieux ces derniers dans la plupart d’entre eux.

Le seul domaine dans lequel le modèle d’OpenAI était concerné était celui du « raisonnement de bon sens pour les tâches quotidiennes ». Même si le score était inférieur, ce n’était pas de beaucoup. Nous pouvons parier que les Gémeaux ont beaucoup de bon sens.

Que peuvent faire les Gémeaux ?

La principale différence entre Gemini et Bard réside dans le fait que le premier est multimodal. Cela signifie qu’il peut comprendre et vous donner des résultats qui sont différentes formes de médias. Il est conçu dès le départ pour être multimodal, de sorte que les modèles d’image, de texte et d’audio communiqueront de manière transparente afin de fournir la réponse la plus pertinente.

Cela signifie également qu’il pourra utiliser différentes formes de médias comme source d’information. La plupart des modèles sont formés uniquement sur le texte. Comme l’a déclaré Nick Clegg, scientifique en chef de l’IA de Meta, lors d’un récent événement Meta, « le texte est une très mauvaise source d’information ». La capacité des Gémeaux à comprendre tant de formes différentes de médias lui permet de comprendre le monde beaucoup plus efficacement.

Trois tailles pour tous

Gemini sera disponible en trois tailles différentes en fonction de l’utilisation que vous comptez en faire. La plus grande taille s’appelle Gémeaux Ultra, et ce sera pour les tâches les plus complexes et les plus exigeantes. Vous vous attendez à ce que les entités au niveau de l’entreprise bénéficient de ce modèle. Ultra devrait avoir accès à toutes les fonctionnalités du modèle.

Ensuite, nous avons Gémeaux Pro. C’est le point idéal des trois niveaux. Vous pouvez donc vous attendre à obtenir une bonne quantité de puissance avec juste le bon nombre de compromis pour le garder suffisamment léger. Il semble que ce soit le plus efficace pour les tâches avancées ; peut-être que les personnes qui créent une start-up pourraient en bénéficier le plus.

Enfin, nous avons Gémeaux Nano. Comme son nom l’indique, il s’agit du modèle le plus petit et le plus économe en énergie. Google affirme qu’il s’agit du modèle le plus efficace pour les tâches d’IA sur appareil. En fait, le Google Pixel 8 aura accès à ce modèle.

Disponibilité

Ce modèle multimodal sera déployé en plusieurs étapes. Aujourd’hui, Google publie une version « affinée » de Gemini Pro pour Bard. Il s’agit de la plus grande mise à jour de Bard depuis son lancement, et les utilisateurs devraient constater une amélioration du chatbot. Celui-ci est lancé en anglais dans plus de 170 pays.

Aujourd’hui également, Google lancera Gemini Nano sur le Pixel 8 Pro. Cela ne fera qu’augmenter la puissance de l’IA du téléphone. Gardez à l’esprit que nous parlons de la version Pro du Pixel 8. La variante standard ne l’obtiendra pas. Cependant, vous pouvez vous procurer un Pixel 8 Pro si vous ne voulez pas manquer cette occasion.

Vous commencerez à voir Gemini accéder à d’autres services tels que Search, Duet AI et Chrome au cours des prochains mois. Le 13 décembre, les développeurs pourront accéder à Gemini Pro.

Enfin, Google lancera Gemini Ultra au début de l’année prochaine. L’entreprise ne nous a pas donné de mois ou de trimestre fiscal spécifique. Nous avons eu des rumeurs selon lesquelles la société aurait retardé l’ensemble du projet Gemini jusqu’en janvier 2024. Cependant, il est possible que seul Gemini Ultra ait été retardé. Quoi qu’il en soit, nous pouvons nous attendre à des changements majeurs dans le paysage de l’IA de Google avec le lancement de Gemini.

A lire également