Microsoft lance son premier modèle interne de génération d'images IA

Microsoft a enfin présenté son premier modèle interne de génération d'images IA : appelé MAI-Image-1. Le premier modèle d'IA texte-image du géant de la technologie basé à Redmond a fait ses débuts sur le forum public de classement des modèles LMArena, qui l'a classé parmi les 10 meilleurs modèles d'IA texte-photo. Grâce à ce modèle, le géant de la technologie de Redmond cessera de s'appuyer uniquement sur des partenaires externes comme OpenAI.

Microsoft dispose enfin d'un modèle interne de génération d'images IA

Depuis le début de cette année, Microsoft a investi des ressources dans la création de modèles internes d'intelligence artificielle générative sous le label Microsoft AI (MAI). Plus récemment, la marque a introduit MAI-Voice-1, un modèle de génération vocale capable de créer une sortie vocale expressive et naturelle. Le MAI-Image-1, le premier modèle de génération d'images IA de Microsoft, est la dernière étape dans cette direction.

Microsoft a souligné qu'il avait créé le modèle pour répondre à des tâches créatives pratiques et réelles plutôt que d'être un système vaste et polyvalent. L’entreprise a déclaré qu’elle «permettre des expériences plus immersives et dynamiques au sein de ses produits.» Microsoft s'éloigne des autres acteurs de l'IA qui créent de grands modèles à usage général.

Les premiers benchmarks montrent un fort potentiel

LMArena a placé le MAI-Image-1 de Microsoft à la neuvième place de sa liste des 10 meilleurs modèles de génération d'IA texte-image. Bien que préliminaires, les premiers tests préliminaires montrent un avenir prometteur pour le modèle. Actuellement, Nano Banana de Google, Imagen 4 et GPT-image-1 d'OpenAI se classent au-dessus de la première offre de Microsoft dans le segment.

Microsoft n'a pas encore divulgué publiquement les spécifications techniques du modèle MAI-Image-1. Cependant, la marque a souligné les atouts du modèle dans la création d'images photoréalistes, notamment des éclairages, des paysages et d'autres visuels complexes.

La société affirme que son premier modèle d’image d’IA interne produit des résultats plus rapidement que de nombreux autres modèles d’IA plus grands et plus lents. Microsoft va intégrer ce modèle dans Copilot et Bing Image Creator dans les semaines à venir.