Dire que le chemin parcouru par Google vers la domination de l’IA a été semé d’embûches serait un euphémisme. Les outils d'IA de l'entreprise ont donné lieu à plusieurs controverses, et l'une d'entre elles concernait le modèle de génération d'images de l'entreprise nommé Imagen. Quoi qu’il en soit, cela avance. Google vient de publier le nouveau modèle d'image Imagen 3.
Si vous avez vu Google I/O, alors vous attendez probablement ce modèle depuis plusieurs mois. La société a annoncé le modèle lors de l'événement. Entre-temps, tous les utilisateurs ont dû faire face à une grande controverse concernant le modèle produisant des représentations racialement inexactes de personnages historiques. Eh bien, ce problème a depuis été résolu. Les personnes utilisant Gemini Advanced peuvent générer des images de personnes.
Google lance enfin Imagen 3
Comme pour tout modèle de génération d’images, l’accent est mis sur le réalisme, et Google a atteint cet objectif depuis longtemps, ce qui en fait une excellente alternative au DALL-E. Cependant, cela ne veut pas dire qu’il ne peut pas se surpasser. Comme vous pouvez le deviner, Imagen 3 peut créer des images avec plus de détails et moins d'artefacts que son prédécesseur. Les images n'auront pas autant de caractère IA, comme des figures amorphes traumatisantes apparaissant partout dans l'image, comme nous l'avons vu dans les anciennes images générées par l'IA. De plus, vous pouvez vous attendre à des images HD de meilleure qualité. C'est au cas où vous souhaiteriez zoomer sur les images pour quelque raison que ce soit.
L’un des principaux problèmes des images IA est la génération de texte. Nous sommes habitués à voir des images d'enseignes « STTOP » et de magasins « Bookk ». Eh bien, Imagen 3 apporte une meilleure génération de texte. Vous n'aurez pas à vous soucier du texte foiré en arrière-plan.
Ne détestez-vous pas lorsque vous tapez quelque chose comme « statue en verre » et que vous obtenez l'image d'une statue derrière une feuille de verre ? Eh bien, Imagen 3 est livré avec une compréhension rapide améliorée. Cela signifie qu’il sera mieux à même de comprendre les invites que vous écrivez.
En matière de sécurité, Google a fait un effort supplémentaire pour filtrer les contenus potentiellement dangereux, vous n'aurez donc pas à vous soucier de produire des images inappropriées par accident. De plus, l’entreprise dispose d’un outil de filigrane qui permet d’identifier facilement que les images sont générées par l’IA.
Vous pouvez essayer Imagen 3 dès maintenant gratuitement en utilisant Gemini. Accédez simplement au site ou à l'application Gemini et saisissez le type d'image que vous souhaitez faire apparaître.
