L'engagement de Google en faveur des services basés sur l'IA en tant qu'élément clé de son activité continue de porter ses fruits. La société a annoncé Google Whisk comme générateur d'images, mais différent des autres produits similaires. Google Whisk vous permet de générer des images en utilisant d'autres images au lieu de simples invites textuelles.

La plupart des générateurs d'images IA actuels sont basés sur une zone de texte dans laquelle vous pouvez écrire vos invites. Cependant, que se passe-t-il si vous souhaitez générer une image avec certains éléments en particulier, mais que vous ne savez pas comment les décrire correctement ? Il peut être frustrant d’essayer plusieurs invites et de ne jamais obtenir le résultat souhaité. Dans cet esprit, Google Whisk vous permet de décrire ce que vous voulez en utilisant d'autres images, ce qui pourrait rendre les choses beaucoup plus faciles.

Google Whisk utilise d'autres images pour générer des images

Les images générées par Google Whisk ont ​​trois paramètres principaux : le sujet, la scène et le style. Le nouveau service du géant de Mountain View permet d'utiliser une image – voire plusieurs – pour définir chacune d'entre elles. Si vous souhaitez être encore plus précis, Whisk propose également une zone de texte que vous pouvez utiliser pour ajouter un contexte supplémentaire. Fondamentalement, les images sont l'élément principal de Whisk pour générer du contenu, tandis que le texte n'est qu'un élément complémentaire.

Fait intéressant, Whisk inclut une invite de texte dans chaque image qu'il génère. Cela vous donnera une idée plus claire de la façon d'obtenir une image similaire en utilisant uniquement du texte sur d'autres plates-formes Gen IA. Le service vous permet même d'utiliser des invites textuelles pour apporter des modifications aux images générées.

Whisk est alimenté par Imagen 3, le dernier modèle de génération d'images IA de Google. C'est un outil amusant et peut aussi être utile, mais il n'est pas parfait. Google dit qu'il a été conçu pour « exploration visuelle rapide, pas de modifications parfaites au pixel près.» Le géant de Mountain View prévient également que l’outil pourrait «rater la cible » parfois. Heureusement, la possibilité de modifier les images avec des invites textuelles permet d'atténuer ce problème. Vous pouvez vous attendre à des améliorations majeures à l’avenir, car Whisk porte actuellement le label « expérimental ».

Disponible uniquement aux États-Unis dans un premier temps

Google Whisk n'est actuellement disponible qu'aux États-Unis. Vous obtiendrez un « Whisk n'est pas encore disponible dans votre pays» message si vous essayez d’y accéder depuis un autre pays. Quoi qu’il en soit, si vous vivez en dehors des États-Unis et disposez d’un VPN fiable, vous pourrez peut-être contourner la limitation et accéder à l’outil.

Dans le même ordre d’idées, Google a également annoncé Veo 2 comme son nouveau modèle de génération vidéo AI. Veo possède moins d'« hallucinations » que d'autres modèles similaires, selon la firme. Google prévoit d'intégrer prochainement les fonctionnalités de Veo 2 dans les outils génératifs de YouTube Shorts.

A lire également