En mai 2023, lors de la conférence des développeurs Google I/O, le PDG Sundar Pichai a dévoilé Gemini, un prochain système d’IA rival de Google GPT-4. La division Google DeepMind, comprenant la Brain Team et DeepMind, développe ce grand modèle de langage (LLM). Selon des sources, Gemini pourrait être lancé très prochainement.

Gemini, configuré pour être multimodal, peut gérer du texte, des images et d’autres types de données pour des conversations plus naturelles. Le PDG Sundar Pichai a également fait allusion à des capacités potentielles telles que la mémoire et la planification de tâches nécessitant un raisonnement.

ChatGPT est un nom bien connu dans le domaine de l’IA générative. Google développe sa version, Gemini, pour rivaliser. The Information rapporte que Google offre à certains développeurs un accès anticipé à Gemini via son API. Cela leur permet d’intégrer Gemini dans diverses applications. Alors que ces développeurs utilisent une version limitée de Gemini, Google est toujours en train de former la version complète, qui devrait concurrencer GPT-4 et sa date de sortie n’est pas loin.

Google Gemini pourrait bientôt être lancé au public

Dans une interview avec Wired quelques jours plus tard, Pichai a donné l’indication la plus claire du rôle de Gemini dans la feuille de route de Google. Il a déclaré que les systèmes d’IA conversationnelle comme Bard sont une transition et non une destination finale, conduisant à des chatbots avancés. Pichai a souligné que Gemini et ses futures versions évolueront vers des assistants personnels universels profondément intégrés dans la vie quotidienne des gens, y compris les voyages, le travail et les divertissements. Il a réitéré que Gemini mélangerait le texte et les images, ce qui rendrait les chatbots actuels insignifiants en comparaison d’ici quelques années.

Google propose des outils d’IA générative via Vertex AI pour ses clients Cloud. Les Gémeaux feront probablement partie de cette offre. Les utilisateurs professionnels peuvent également accéder à Duet AI, qui est intégré aux applications Workspace, pour 30 $ supplémentaires par mois. Cependant, Duet AI s’appuie sur les modèles d’IA existants de Google et gère principalement les requêtes textuelles.

Il est important de noter que Gemini a le potentiel de générer différents types de données, notamment du texte, des images et du code. Cela le différencie des modèles précédents de Google comme PaLM 2, qui se limitent à l’entrée et à la sortie textuelles. Bien que nous n’ayons pas encore tous les détails, les efforts de Google dans ce domaine sont prometteurs, et nous pouvons nous attendre à des outils d’IA générative plus sophistiqués de la part de l’entreprise à l’avenir.

A lire également