Le modèle texte-vidéo d'OpenAI, Sora, est à la fois impressionnant et effrayant selon la perspective. Cela peut vous aider à transformer vos idées en un clip vidéo sans même une caméra. Mais cela peut aussi supprimer ces emplois. Pour ceux qui ne sont pas familiers, le modèle d’intelligence artificielle génère des clips vidéo d’une minute maximum basés sur de simples descriptions textuelles.

La startup soutenue par Microsoft vient de publier le premier clip vidéo majeur généré par Sora. Il est important de noter que le modèle est encore en phase de test et n’est pas encore disponible au public. Il y a donc encore place à l’amélioration sur différents aspects.

OpenAI a-t-il formé Sora sur les vidéos YouTube ?

Le mois dernier, le PDG de YouTube a déjà mis en garde OpenAI contre l'utilisation de ses vidéos pour entraîner Sora. Dans une interview plus récente au Bloomberg Technology Summit, le COO Brad Lightcap a parlé des applications commerciales potentielles de leurs produits d'IA. Sora, l'un des produits notables de la startup ayant des applications commerciales potentielles, est également apparu dans la conversation. En parlant de Sora, l'intervieweur a soulevé la question : « Quelles données d'entraînement ont été utilisées pour entraîner le modèle ?

Plus précisément, l'intervieweur a pressé le responsable d'OpenAI de préciser définitivement s'il avait formé Sora sur des vidéos YouTube. Cependant, Lightcap semblait réticent à fournir une réponse directe. Au lieu de cela, il a discuté de divers aspects, notamment la génération de contenu, l'utilisation de ce contenu comme données pour la formation de modèles, la garantie de la transparence concernant l'utilisation des données, les avantages potentiels pour les créateurs de contenu, etc. Cependant, il n'a pas mentionné YouTube une seule fois dans sa « non-réponse » descriptive quant à savoir si OpenAI a formé Sora sur les vidéos de la plateforme ou non.

Le COO Brad Lightcap a refusé de répondre à la question

« Alors oui, nous examinons ce problème, c'est vraiment difficile. Nous n'avons pas encore toutes les réponses », a-t-il conclu. OpenAI a en effet partagé quelques informations sur « la compréhension de la source de ce que nous voyons et entendons en ligne ». Cependant, il s’agissait principalement de l’authenticité du contenu et de la manière dont ils envisagent de maintenir la transparence sur la source du contenu. Cependant, le message ne parle pas vraiment des données qu'ils ont utilisées ou utilisent pour former les modèles de langage. Sans oublier qu’il ne parlait pas non plus de l’utilisation du contenu de YouTube.

Pour rappel, la CTO de la société, Mira Murati, s'est également vu poser la même question à propos de Sora au début du mois dernier. Elle ne pouvait pas non plus donner une réponse claire à la question.

Selon des rapports du début de cette année, OpenAI a utilisé des vidéos YouTube pour entraîner GPT-4, ce qui est contraire aux règles de la plateforme. Cependant, Google aurait également fait de même. En parlant des données d'entraînement de Sora, la non-réponse compliquée fait allusion à la possibilité d'utiliser des vidéos YouTube. Le modèle pourrait être rendu public au second semestre 2024, éventuellement en août.

A lire également