La prochaine conférence Google I/O 2024 aura lieu demain. Cependant, l’entreprise souhaite montrer au public certaines de ses grandes avancées dans le domaine de l’IA. Avant l'événement, Google présentait un prototype conversationnel Gemini qui répond en temps réel à la vidéo.

Les chatbots basés sur l'IA ont commencé en répondant à des invites écrites. Quelque temps plus tard, ils ont acquis la capacité de reconnaître les images. Depuis, ils peuvent répondre à des questions ou formuler des commentaires sur une image ou un élément d’image en particulier. Ils peuvent même générer de nouvelles images à partir d'autres. Désormais, la prochaine grande étape semble être liée à la vidéo.

Google présente un prototype Gemini conversationnel utilisant la vidéo avant les I/O 2024

Avant I/O 2024, Google présente une courte vidéo d'une interaction entre Gemini et un utilisateur. Ce qui est frappant, c’est que toute l’interaction est basée sur une vidéo capturée en temps réel. Le « teaser » montre comment Gemini est capable de reconnaître ce qui se passe dans la scène. Il peut également se concentrer spécifiquement sur certains éléments de la scène, comme le logo Google I/O. Ensuite, le chatbot alimenté par l'IA répond aux questions de l'utilisateur et propose même de nouvelles questions à « discuter ».

La combinaison de la reconnaissance vidéo en temps réel et du naturel de la conversation est assez impressionnante. Il faut cependant noter que ce qui est présenté est un prototype qui semble fonctionnel. Ainsi, même si l'entreprise fournira plus de détails demain, il est possible qu'une version finale destinée à un usage massif mette un peu plus de temps à être disponible.

Le teaser pourrait être une réponse directe à Open AI, l'équipe derrière ChatGPT. Il y a quelques heures, la société a organisé un événement pour annoncer de nouvelles avancées et fonctionnalités. L'une des annonces était GPT-4o, une version plus rapide du modèle GPT-4 qui est également capable de répondre à la vidéo en direct. Ainsi, le timing choisi par Google pour lancer le teaser ne semble pas être une coïncidence.

A lire également