OpenAI a dévoilé son générateur texte-vidéo révolutionnaire, Sora, le mois dernier, mais il n’a pas encore rendu Sora accessible au public. Actuellement, Sora est au stade de l’équipe rouge et n’est disponible que pour certains artistes et créateurs qui testent l’outil. Pour ceux qui ne sont pas familiers, l’équipe rouge est le processus par lequel les gens testent l’outil pour s’assurer qu’il est sûr, sécurisé et fiable. L’objectif est d’identifier les vulnérabilités, les préjugés et autres problèmes nuisibles.

Dans une interview avec le Wall Street Journal (paywalled), la directrice de la technologie d’OpenAI, Mira Murati, a révélé que Sora serait disponible au public « cette année », avec une sortie potentielle d’ici « quelques mois ». Cet outil, Sora, permet aux utilisateurs de créer des scènes hyperréalistes à partir de simples invites textuelles.

Sora est époustouflant, mais pas encore parfait

Les vidéos générées par Sora ne contiennent actuellement aucun son. Cependant, interrogé à ce sujet, Murati a déclaré qu’OpenAI prévoyait de l’intégrer à un moment donné. Ce n’est peut-être pas Sora, mais au moins ils ont des plans pour l’ajout.

Comme de nombreux outils de génération de texte en image, les vidéos de Sora seront également filigranées pour éviter toute utilisation abusive. Cependant, un filigrane n’est pas non plus une solution parfaite au problème. C’est une autre raison pour laquelle la société n’a pas encore rendu public le modèle et ne le fera apparemment pas à moins qu’elle ne le considère comme sûr.

Interrogée sur le point de vue du CTO sur la manière dont cela pourrait affecter les emplois à l’avenir, elle a déclaré que l’objectif n’était pas de remplacer les gens mais de leur servir de Sora comme d’un outil qu’ils peuvent utiliser pour « éditer et créer ». L’édition du contenu généré par Sora peut être importante, surtout compte tenu des incohérences dans les vidéos. Le Wall Street Journal a montré quelques vidéos qu’ils ont générées, soulignant certaines incohérences telles que des mains et des doigts bizarres.

Interrogé sur les données utilisées pour entraîner Sora, Murati est resté vague, déclarant qu’il utilisait des données accessibles au public ou sous licence. Bien qu’il reste incertain si des vidéos de plateformes comme YouTube, Facebook ou Instagram ont été utilisées, Murati a confirmé que Sora intègre du contenu de Shutterstock, qui est partenaire d’OpenAI.

OpenAI vise à rendre Sora disponible à un coût similaire à son modèle texte-image DALL-E

Murati a souligné un aspect notable, l’augmentation du coût d’alimentation de Sora par rapport aux modèles d’intelligence artificielle précédents comme DALL-E ou ChatGPT. Elle note que, contrairement aux modèles de génération de texte ou d’images, Sora est à ce stade un projet de recherche dont le fonctionnement coûte beaucoup plus cher. OpenAI devra organiser l’équipement informatique dont il aura besoin avant de le proposer au public.

Malgré les dépenses plus élevées, OpenAI vise à rendre Sora accessible au public à des coûts « similaires » à ceux de DALL-E, en mettant l’accent sur l’accessibilité à sa technologie révolutionnaire.

A lire également