Google a introduit « Help Me Write » dans Gmail en juin 2023, et Gmail Voice Compose cherche désormais à améliorer cette commodité basée sur l’IA. Les outils d’IA ont fait leur apparition dans toutes sortes de services et d’industries, et pour cause. L’époque de la reconnaissance vocale bancale et des assistants mobiles au comportement inapproprié est révolue depuis longtemps. La reconnaissance vocale basée sur l’IA fait naturellement des merveilles ; car il s’agissait de l’une des premières utilisations proposées des grands modèles linguistiques. La dernière fonctionnalité à venir de Gmail vous permettra de l’utiliser pour créer des e-mails professionnels simplement en parlant dans votre téléphone.

Gmail Voice Compose fonctionne comme « Aidez-moi à écrire »

La fonctionnalité « Aidez-moi à écrire » dans les applications Gmail sur Android et iOS permet aux utilisateurs de rédiger des e-mails à partir d’extraits de texte. Les utilisateurs écrivent les principaux points du sujet de leur e-mail et l’IA s’occupe du reste. « Help Me Write » permet non seulement de gagner du temps, mais il rédige un e-mail complet et professionnel à partir de quelques lignes de texte informel. Voice Compose semble fonctionner de la même manière, mais en écoutant un utilisateur parler au lieu de le laisser écrire.

Comme découvert par TheSpAndroid, la version 2023.12.31.599526178 de l’application Gmail Android contient une nouvelle fonctionnalité accessible en basculant une valeur d’indicateur. Cette fonctionnalité vous permet de vous enregistrer lors de la rédaction d’un e-mail en appuyant sur un bouton du microphone. Lorsque vous avez terminé l’enregistrement, appuyez sur « Créer » pour inviter l’IA à créer votre e-mail à partir de votre enregistrement. Bien que très similaire à la fonctionnalité « Aidez-moi à écrire », Voice Compose est nettement plus rapide et plus pratique.

Comment fonctionne la synthèse vocale par IA ?

La synthèse parole-texte de l’IA est beaucoup plus précise pour déchiffrer ce que quelqu’un dit que les anciens modèles de reconnaissance vocale. L’augmentation des capacités était presque choquante, mais aussi très compréhensible une fois que l’on comprend le fonctionnement des LLM. Les grands modèles linguistiques, de manière très simplifiée, sont considérés comme des « prédicteurs de mots ». Comme dans, ce qu’ils font, c’est prédire quel mot devrait venir après le dernier.

Cette définition ne rend pas service au réseau neuronal complexe que possèdent les LLM, mais elle aide à comprendre comment fonctionne leur reconnaissance vocale. Les anciens modèles de reconnaissance vocale analysaient chaque son et essayaient de déterminer de quel mot il s’agissait. Cela conduirait très souvent à des phrases complètement absurdes. La reconnaissance vocale de l’IA ne se contente pas d’écouter et d’analyser chaque mot individuellement. Il le compare à tout ce qui a été dit auparavant et devine ce qui vient le plus probablement d’être dit. C’est pourquoi la reconnaissance vocale de l’IA est bien en avance sur les anciens modèles ; il y a une certaine intelligence derrière lui.

Gmail Voice Compose devrait être déployé très prochainement car il est censé être en préparation depuis octobre de l’année dernière. Si cela fonctionne aussi bien que d’autres modèles de synthèse vocale d’IA, ce sera un énorme pas en avant en termes de commodité pour ceux qui utilisent l’application Gmail.

A lire également