Runway, une autre société d'IA qui évolue dans le secteur technologique, dispose d'un puissant modèle de génération de vidéos appelé Gen-3 Alpha. Bien qu'il soit puissant, certains ne sont pas satisfaits de la manière dont l'entreprise a obtenu les vidéos pour l'entraîner. Selon un nouveau rapport, Runway aurait piraté une tonne de vidéos pour entraîner son modèle d'IA, et cela inclut des vidéos YouTube.
Ne faisons pas les idiots : presque tous les éléments médiatiques que nous voyons sur Internet ont probablement été récupérés et utilisés pour former un modèle d'IA. Cela comprend les articles, les livres, les publications sur les réseaux sociaux, les images, les podcasts, les vidéos, etc. Les entreprises récupèrent tout ce contenu sous notre nez, et personne ne le sait jusqu'à ce que des histoires comme celles-ci fassent surface. C'est assez triste.
Il y a quelques mois, il y a eu un petit scandale autour de la question de savoir si OpenAI a récupéré YouTube pour entraîner Sora, son outil de génération de vidéos. Cela montre simplement que YouTube et Google ne toléreront pas que des entreprises récupèrent des données de YouTube. Depuis lors, la querelle est restée silencieuse.
Runway aurait piraté des vidéos pour entraîner son modèle d'IA
Le modèle de Runway est impressionnant, mais il faudrait une tonne de données vidéo pour l'entraîner. Ces données vidéo devaient bien provenir de quelque part, et 404 Media a révélé d'où elles pouvaient provenir. L'entreprise a découvert une feuille de calcul contenant des liens vers une tonne de chaînes YouTube. Ces chaînes incluent Mr. Beast, MKBHD, The Try Guys, Nintendo, BuzzFeed, Netflix, Linus Tech Tips, Sam Kolder et bien d'autres.
Runway ne s'est pas arrêté à YouTube. La feuille de calcul contient également des liens vers des sites comme KissCartoon, un site de piratage. Au total, la feuille de calcul contient près de 4 000 liens. Chaque ligne de la feuille de calcul contient des informations sur les chaînes YouTube, comme le nombre de vidéos et le contenu qu'elles produisent.
Selon certaines informations, la société aurait utilisé un robot d'exploration pour télécharger ces vidéos et les insérer dans le modèle. Comme si cela ne suffisait pas, Runway aurait utilisé un proxy pour éviter d'être détecté par Google. La société savait donc que Google serait vexé de la voir récupérer des données vidéo.
Nous ne savons pas exactement quelle quantité de données de la feuille de calcul a réellement été utilisée pour entraîner le modèle. Nous ne le saurons peut-être jamais, malheureusement.
Les ramifications juridiques
Ce genre de situation pourrait avoir des conséquences juridiques assez lourdes. Des entreprises comme Microsoft et OpenAI sont déjà traînées devant les tribunaux pour avoir récupéré des données du New York Times. YouTube pourrait avoir le droit de poursuivre Runway en justice, en fonction de la quantité de données vidéo brutes récupérées par l’entreprise.
En outre, les chaînes YouTube de la liste incluent des chaînes de grandes entreprises comme Disney, Netflix et Nintendo. Nous sommes sûrs que ces entreprises ont des vidéos protégées par le droit d'auteur sur leurs chaînes. L'histoire nous a appris que si vous vous en prenez à Nintendo, vous ne faites que demander des poursuites judiciaires.
Enfin, il ne faut pas oublier que l'utilisateur a peut-être téléchargé des vidéos à partir d'un site pirate. Si c'est le cas, il s'agirait d'une violation directe de la loi.
Maintenant que cette information est publique, il ne nous reste plus qu'à voir ce qu'il advient de l'entreprise et de son modèle vidéo.
