Stability AI a annoncé un accès élargi pour les développeurs à son générateur de texte en image de nouvelle génération, Stable Diffusion 3, avec la sortie de la dernière API pour les développeurs. Cette décision souligne l'engagement de l'entreprise en faveur de l'IA générative open source, avec l'intention de publier prochainement les poids des modèles pour l'auto-hébergement.

Selon The Verge, Stable Diffusion 3 utilise une architecture appelée Multimodal Diffusion Transformer. Cette architecture permet au modèle de combiner efficacement la saisie textuelle avec sa compréhension visuelle, ce qui aboutit à une génération d'images plus réalistes et cohérentes.

Une puissante génération de texte en image désormais à la portée des développeurs

Auparavant disponible uniquement via des canaux limités, Stable Diffusion 3 est désormais largement accessible via l'API Developer Platform de Stability AI. Cela donne aux développeurs la possibilité d'intégrer le modèle puissant dans leurs applications. Stable Diffusion 3 a reçu des éloges pour ses performances exceptionnelles par rapport à des modèles similaires, notamment pour sa capacité à traduire avec précision des invites textuelles en images de haute qualité.

Le communiqué de presse de Stability AI met en évidence les atouts du modèle dans trois domaines clés : la typographie, le respect des invites et la compréhension du texte. Ceux-ci permettent aux développeurs de créer des images qui correspondent précisément à leurs descriptions, même lorsque ces descriptions incluent des éléments complexes tels que des polices ou des styles spécifiques. Stability AI affirme même que Stable Diffusion 3 égale ou surpasse les autres principaux générateurs de texte en image comme DALL-E 3 et Midjourney v6 d'OpenAI dans ces domaines.

Une nouvelle plateforme « Stable Assistant Beta » arrive également

En plus de la version API, Stability AI a introduit Stable Assistant Beta, une nouvelle plate-forme conçue pour rationaliser la création de contenu. Décrit comme un « chatbot convivial », Stable Assistant Beta permet aux abonnés payants d'interagir avec Stable Diffusion 3 et d'autres modèles d'IA de manière conversationnelle. Les utilisateurs peuvent simplement décrire l'image souhaitée, demander du contenu écrit ou même demander au modèle de trouver des descriptions textuelles correspondant aux photos existantes.

Dans l’ensemble, la sortie de Stable Diffusion 3 via l’API Developer Platform constitue une évolution significative dans le domaine de l’IA générative. En permettant aux développeurs d'accéder à ce nouveau modèle puissant, Stability AI libère le potentiel d'applications révolutionnaires qui repoussent les limites de l'expression créative.

A lire également