Lorsque Google a présenté Gemini, son nouvel assistant alimenté par AI, il y avait encore beaucoup de travail à faire. L'assistant Google classique était de loin supérieur en fonctionnalité, mais cela a changé au fil du temps. L'un des plus grands ajouts aux Gémeaux était en direct, l'expérience «conversationnelle». Maintenant, Google déploie une mise à jour qui rendra Gemini Live « plus dynamique et engageant. « 

Google met à jour Gemini Live pour une expérience «plus dynamique et engageante»

Comme repéré par 9to5google, certains utilisateurs en direct de Gemini ont commencé à recevoir un e-mail les informant d'une expérience mise à jour. Google dit que les améliorations déroulant sont alimentées par un sans nom « dernier modèle.  » Il est probable que la société fait référence à l'une des versions de sa série Gemini 2.0 AI.

Selon The Mountain View Giant, les améliorations aideront les Gémeaux à vivre à «mieux comprendre plusieurs langues, dialectes ou accents dans un seul chat en direct.  » Il peut aussi « Aidez à vos besoins de traduction», Indique l'e-mail.

Il semble que la société intégre les capacités multimodales améliorées annoncées avec Gemini 2.0. Cela permet à l'assistant alimenté par AI d'obtenir des entrées de texte, d'audio et de vidéo tout en produisant des sorties de texte et audio. Cependant, les améliorations seront d'abord remarquées dans toutes les tâches liées au traitement audio. Des fonctionnalités comme le partage d'écran et le streaming vidéo en direct seront disponibles « Dans les mois à venir. « 

Capacités multimodales arrivant »Dans les mois à venir« 

Google travaille depuis un certain temps sur les capacités multimodales de Gemini Live. La société a taquiné la fonctionnalité l'année dernière sous le nom de «Project Astra». Depuis lors, les utilisateurs attendent avec impatience les capacités avancées de reconnaissance des articles en temps réel, entre autres fonctionnalités indiquées. L'e-mail suggère que 2025 sera l'année où Gemini Live fera un pas en avant. L'assistant pourrait offrir de loin l'expérience conversationnelle la plus avancée sur les smartphones.

L'intégration des nouvelles fonctionnalités apporte également une modification des politiques de traitement des données. Une mise à jour était nécessaire étant donné que l'entreprise se prépare en direct pour traiter l'audio et la vidéo. « Vos audio, vidéo et carreaux d'écran sont stockés dans votre activité d'applications Gemini (si c'est allumé)», Lit l'e-mail. La version précédente disait: « Les données vocales et audio en direct ne sont pas enregistrées sur les serveurs Google pour le moment. Nous serons transparents sur tout changement. « 

Enfin, l'e-mail ne détaille pas si les améliorations seront disponibles dans toutes les langues ou simplement l'anglais en premier. Espérons que Google fournira plus d'informations à ce sujet dans les prochains jours.

A lire également