À l’heure actuelle, on peut affirmer sans se tromper que la technologie de l’IA progresse à un rythme rapide. Microsoft est l'une des entreprises leaders en matière d'IA avec l'aide d'OpenAI. Eh bien, le dernier outil de Microsoft s'appelle VASA-1, un outil puissant pour générer des visages parlants réalistes qui fonctionnent en temps réel.

Cela témoigne de la capacité croissante de l’IA à imiter les êtres humains sur la base d’un minimum d’apports. Par exemple, TikTok travaille sur un outil qui permettra aux utilisateurs de créer un clone de leur voix généré par l’IA avec seulement 10 secondes d’entrée audio. Au moment de la rédaction de cet article, cet outil n’est pas accessible au public. Cependant, nous nous attendons à ce qu'il soit publié relativement prochainement.

Le VASA-1 de Microsoft permet aux utilisateurs de créer des visages parlants réalistes en temps réel

Nous en avons vu des exemples à travers des centaines de publicités d'applications qui vous permettent d'animer un portrait pour donner l'impression que vous chantez une chanson de Billie Eilish. Cependant, la technologie derrière VASA-1 est beaucoup plus avancée et beaucoup plus raffinée. Vous pouvez utiliser une image unique pour cet outil. À l’aide de cette image, l’outil sera capable de générer un mouvement réaliste pour donner l’impression que la personne parle.

C’est impressionnant tel quel, mais cela va plus loin que cela. VASA-1 peut réellement créer des mouvements subtils du visage et transmettre un large éventail d’émotions. C’est quelque chose qui a manqué à des outils similaires au fil des années. Son objectif principal est le réalisme, et il s’en rapproche vraiment.

L'entreprise a présenté quelques exemples de cette technologie sur son site Web, et c'est très impressionnant. En dehors de cela, les visages parlants peuvent se synchroniser sur les lèvres avec l’audio en temps réel. C'est une autre grande qualité de cet outil.

Microsoft VASA-1 peut générer des vidéos 512 × 512 jusqu'à 40 FPS. De plus, sur son mode streaming en ligne, Microsoft affiche une latence de seulement 170 ms.

À ce stade, nous ne savons pas quand Microsoft envisage de rendre cette fonctionnalité accessible au grand public. Cependant, lorsque ce sera le cas, nous sommes presque sûrs que Microsoft le monétisera. Il pourrait éventuellement s'agir d'une fonctionnalité de l'un des services d'abonnement de l'entreprise. Il faudra attendre sa sortie pour en être sûr.

A lire également