La vidéo Gemini de Google a été mise en scène, ce qui est une sorte de soulagement

Ainsi, Google vient de lancer son mastodonte multimodal nommé Gemini. Il s’agit du nouveau modèle d’IA extrêmement puissant de la société, destiné à rivaliser avec des modèles comme GPT-4. Dans le cadre de toutes les festivités de lancement, nous avons visionné une vidéo pratique présentant les capacités du Gemini. Eh bien, Google a admis que sa vidéo pratique Gemini avait été mise en scène.

Ainsi, pour vous rattraper, lorsque Google a lancé Gemini, il a montré une vidéo pratique dans laquelle la personne montrait certaines des capacités de Gemini. Cela donnait l’impression que Gemini traitait des données audio et vidéo en temps réel. Lorsque la personne mettait un objet dans la caméra, elle posait des questions aux Gémeaux sur ce qu’elle « voit » et fournissait des réponses. Nous entendrions une réponse vocale générée par l’IA.

C’est une excellente vitrine des capacités de Gemini… ou ce le serait si c’était RÉEL.

Google admet que sa vidéo pratique Gemini a été mise en scène

Un article d’opinion de Bloomberg a renversé ce peu de thé. Il indique que Google a révélé que la vidéo n’était pas réelle à 100 %. Les interactions vocales en temps réel entre le présentateur et Gemini n’étaient pas là. Tout cela grâce à la magie du montage vidéo. De plus, les interactions ont été accélérées dans la publication, ce qui donne l’impression que cela est plus rapide qu’il ne l’est en réalité.

Mais même si la vidéo n’était pas réelle à 100 %, nous ne pouvons pas dire qu’elle était fausse à 100 %. C’est une vitrine des capacités des Gémeaux, et nous voyons toujours ses capacités. Google utilisé «des images fixes provenant des images et des invites via du texte». Ainsi, plutôt que d’avoir une conversation informelle avec Gemini, la société a inséré des images fixes dans le modèle et a tapé ce qu’elle voulait que Gemini produise.

Essentiellement, nous voyons toujours les capacités de Gemini ; nous voyons encore ce que cela peut produire compte tenu de la contribution. Google a utilisé la magie hollywoodienne pour la faire paraître plus puissante qu’elle ne l’est. Quant à la rapidité des réponses, Google a indiqué dans la description que les réponses avaient été accélérées par souci de concision.

L’entreprise a-t-elle tort de faire cela ? Qui sait? C’est un débat pour la section des commentaires de YouTube.

La vidéo a été mise en scène, et c’est un peu un soulagement

Que la vidéo soit ou non truquée, elle reste bien plus puissante que Bard. Le modèle est plus intelligent avec plus de jetons et de paramètres, bla bla bla. Quoi qu’il arrive, les entreprises disposeront toujours d’outils pour accélérer leur production et leur efficacité. Il existe également plusieurs façons d’accéder à Gemini.

Cependant, la vidéo est devenue assez effrayante pour tous les créateurs qui la regardaient. Nous avons littéralement vu Gemini créer une chanson tropicale cool en quelques secondes, ce qui prendrait beaucoup plus de temps à un compositeur. Nous l’avons également vu créer des images en quelques secondes à partir de fil. Depuis que DALL-E est enfin devenu performant et que ChatGPT est arrivé sur le marché, les créateurs humains sont sur le point d’être obsolètes. La situation ne s’améliore pas et la vidéo pratique donne vraiment l’impression que Google a enfin mis le dernier clou dans le cercueil des créateurs.

Cependant, le fait qu’il s’agisse d’une mise en scène montre que la technologie n’est pas encore là. Les créateurs ont juste un peu plus de temps. C’est tout ce que nous pouvons demander à ce stade.