De nombreuses personnes ont découvert l'IA générative en voyant les images étranges produites par les premiers DALL-E. De nos jours, les entreprises se concentrent sur la diffusion de vidéos générées par l’IA. Google a présenté sa plateforme de génération vidéo appelée Veo au Google I/O plus tôt cette année, et elle est désormais disponible en avant-première.
Google a tenté de réparer les dégâts causés avec sa plateforme de génération d'images Imagen. L’entreprise a cessé de générer des images d’êtres humains et ne permet toujours pas cette fonctionnalité pour la plupart des gens. Il semble donc étrange que l’entreprise opte pour un modèle de génération vidéo.
Google a publié Veo en avant-première privée
Nous n'avons rien vu de Sora d'OpenAI depuis la grosse fuite survenue il n'y a pas si longtemps. Les clips que nous avons vus de ce modèle étaient d’une qualité troublante. Nous ne savons pas quand Sora sera officiellement lancé, mais nous sommes sûrs que ce sera avant le modèle Nova Reels d'Amazon.
Avant que ces modèles ne soient disponibles gratuitement pour mettre les cinéastes dans la rue, Google a publié son modèle de génération vidéo. Sachez simplement que la plupart des gens ne pourront pas l'utiliser. Google n'a publié qu'un aperçu privé du modèle. Vous pouvez l'utiliser si vous êtes abonné au service cloud Vertex de l'entreprise. Nous ne savons pas combien de temps il restera à l’état d’aperçu. Connaissant Google, nous verrons une sorte de publication publique plus tard. L'entreprise n'a pas hésité à offrir aux utilisateurs un accès gratuit à ses outils.
Pour le moment, nous ne savons pas combien de temps peuvent durer les clips vidéo. Cependant, nous savons que Veo crache des vidéos à une résolution de 1080p.
Alors, quelle est la qualité des vidéos ?
Tout comme d'autres vidéos que nous avons vues générées avec l'IA, les résultats sont extrêmement réalistes. On est loin de ces vidéos de Will Smith mangeant des spaghettis, c'est sûr. Ils en sont au point où il faudrait examiner attentivement les vidéos pour remarquer des indices.
Par exemple, le clip vidéo avec le chiot est presque impossible à distinguer d'une vraie vidéo. La seule chose qui le révèle est le fait que la patte du chien ne se comprime pas lorsqu'elle entre en contact avec le sol. Aussi, avec la vidéo du concert, la main de la personne du côté gauche est un peu bizarre.
Cependant, 99 % des gens ne seront pas capables de faire la différence. Donc, si ces clips étaient intégrés dans un film ou une émission de télévision hollywoodienne, la plupart des gens penseraient qu'ils sont réels. Cela vaut également pour le clip du vieil homme souriant ou des guimauves.
C’est une chose assez effrayante à laquelle penser, car nous pouvons voir que les PDG de certaines grandes sociétés cinématographiques ont le doigt sur le bouton « Licencier tout le monde et pomper le contenu IA ». Espérons simplement que Google fera preuve de prudence lors de la diffusion de ces modèles auprès du grand public.
