Dites bonjour à Google Gemini 2.0 !

Nous devrions être assez familiers avec Gemini de nos jours, car Google l'a intégré à tous ses produits. Bien que Google ait fait des progrès significatifs avec ses modèles d'IA, nous utilisons tous les versions 1 et 1.5 de Gemini. Eh bien, Google vient d'annoncer la prochaine génération de Gemini, Gemini 2.0.

Il est important de savoir qu'il ne s'agissait que d'une annonce. Nous n’allons pas encore voir Gemini 2.0 implémenté dans aucun service. Cependant, nous allons le voir dans l'un des outils d'IA les plus attendus présentés par Google.

Google vient d'annoncer Gemini 2.0.

L'annonce de l'entreprise montre que nous sommes véritablement à l'ère de l'automatisation de l'IA. Google a publié une courte et agréable vidéo détaillant une partie de ce que l'entreprise a en réserve. Nous y voyons que Gemini 2.0 se concentrera sur des agents d'IA capables d'effectuer des tâches au nom de l'utilisateur. D'autres sociétés comme Motorola travaillent également sur des modèles capables d'effectuer des actions sur plusieurs applications.

Les ambitions de Google sont plus grandes, comme vous pouvez l'imaginer. En utilisant Gemini 2.0 comme base, l’entreprise pourrait développer des outils permettant de créer un agent capable de faire à peu près tout. La multimodalité est la clé pour que cela fonctionne, car Gemini 2.0 sera capable de recueillir des informations provenant de plusieurs formes d'entrée. Imaginez pouvoir pointer votre téléphone vers un objet du monde réel et poser des questions à ce sujet.

Cela vous semble-t-il familier ? C'est ce que Google a montré en révélant le projet Astra. Eh bien, selon la vidéo, Gemini 2.0 alimentera le projet Astra. Au cas où vous auriez oublié de quoi il s'agit, il vous permettra de pointer votre téléphone vers un objet du monde réel et de poser des questions à ce sujet. Vous pourrez parler directement à l'agent et vous recevrez une réponse vocale.

Les gens attendent cet outil depuis Google I/O. Nous ne savons pas quand l'entreprise publiera cela au public, mais nous sommes sûrs que ce sera un succès auprès des utilisateurs.

Cela pourrait être un modèle très utile

Sachez simplement que cette vidéo présente ce que Google prévoit. Ce n'est pas une représentation de ce que l'entreprise va lancer. Une chose que Google a montré dans la vidéo était le concept de Gemini 2.0 aidant quelqu'un à jouer à Clash of Clans. Le joueur a demandé à Gemini où attaquer la base ennemie, et il a pu obtenir le contexte à partir de ce qui était sur l'écran du joueur.

Ensuite, nous avons entendu une voix expliquant d’où attaquer la base et pourquoi. Bien que cela semble plutôt paresseux de la part du joueur, cela montre que Google souhaite que son IA s'étende assez profondément dans votre expérience smartphone.

Projet Marin

Google nous a donné un aperçu de son prochain plus gros projet. Project Mariner permettra à Gemini d'effectuer des tâches complexes avec une simple commande. Disons simplement que vous souhaitez que Gemini trouve le peintre post-impressionniste le plus célèbre, trouve une de ses peintures sur Google Arts and Culture, puis ajoute des peintures colorées à votre panier Etsy. Cela semble plutôt spécifique, mais vous pourrez peut-être le faire lorsque Google aura pleinement réalisé le projet Mariner.

À l'heure actuelle, le seul modèle dont parle Google s'appelle Gemini 2.0 Flash Experimental. Cela signifie que l’entreprise est en train de le tester. Nous ne savons donc pas quand la société proposera une version finale au grand public.