Google Bard adopte Imagen comme outil de génération d'images

Google étend ses offres d’IA générative avec un prochain générateur d’images pour Google Bard, comme révélé dans un changelog inédit daté du 18 janvier.

Sur les traces d’outils tels que Search Generative Experience (SGE) et Slides, les utilisateurs pourront créer des images en saisissant quelques mots qui décrivent l’image. Cette nouvelle fonctionnalité devrait être alimentée par la famille de modèles Imagen de Google. Imagen est connu pour sa capacité à produire des images photoréalistes de haute qualité.

En décembre, Google a présenté Imagen 2, offrant une qualité d’image considérablement améliorée. La technologie est destinée aux cas d’utilisation en entreprise, tels que la génération de logos ou la création d’images avec superpositions de texte.

Le générateur d’images de Google Bard devrait suivre des fonctionnalités de sécurité similaires à celles de SGE. Ce dernier, introduit en octobre, permet aux utilisateurs de « dessiner » ou « esquisser » des invites directement dans le champ de recherche, générant quatre images à la fois.

Tout comme SGE, Google Bard bloquera également les résultats avec des personnes notables et du contenu explicite.

SGE garantit la sécurité en bloquant la génération de contenu nuisible, trompeur ou explicite. Bard restreindra également les invites mettant en vedette des personnes notables ou des visages photoréalistes, rapporte 9to5Google. De plus, chaque image générée recevra un étiquetage de métadonnées et un filigrane invisible à l’aide du SynthID de Google.

Google Slides et Meet, ce dernier pour les arrière-plans personnalisés, intègrent déjà la génération d’images destinées à l’utilisateur via Duet AI. L’ajout prochain d’un générateur d’images à Bard étend l’accessibilité du contenu généré par l’IA à divers services Google.

En ajoutant des descriptions supplémentaires aux légendes d’images dans l’ensemble de données de formation d’Imagen 2, Google améliore la compréhension des légendes d’images. Cela permettra une génération d’images plus précises et contextuellement nuancées.

De plus, Imagen 2 répond aux défis courants rencontrés par les outils de conversion texte-image, tels que le rendu réaliste des mains et des visages humains. La technologie intègre un modèle spécialisé d’esthétique de l’image. Il est basé sur les préférences humaines, garantissant que les images générées correspondent aux qualités préférées des utilisateurs. Ces avancées contribuent collectivement à la capacité améliorée d’Imagen 2 à générer des images réalistes et de haute qualité.

Cette décision s’aligne sur la stratégie plus large de Google consistant à intégrer des technologies avancées d’IA dans sa suite de services.