L’un des principaux sujets affectant l’IA aujourd’hui est le grattage de données. Afin de former des modèles d’IA, les entreprises doivent extraire des données de sources en ligne pour les intégrer dans des modèles d’IA. Eh bien, nous avons appris qu'OpenAI avait récupéré des tonnes de données sur YouTube. Cependant, nous avons également appris que même Google récupérait les données des vidéos YouTube.
À l'heure actuelle, YouTube protège les données sur sa plateforme. Récemment, le PDG de YouTube, Neal Mohan, a mis en garde OpenAI contre l'utilisation de ses vidéos pour entraîner Sora. Il s'agit du générateur vidéo IA extrêmement réaliste d'OpenAI.
Eh bien, selon un rapport du New York Times, OpenAI a récupéré des données de l'énorme plateforme de partage de vidéos, mais il ne s'agissait pas de données vidéo. La société a utilisé un outil appelé « Whisper » qui transcrit automatiquement l’audio des vidéos YouTube et l’utilise pour entraîner le modèle. Le modèle en question est GPT-4. Le rapport indique qu'OpenAI a pu récupérer les transcriptions de plus d'un million de vidéos YouTube.
OpenAI a fait valoir qu'il utilise des informations provenant de vidéos YouTube accessibles au public. Cela devrait donc apparemment être justifié. Cependant, YouTube déclare qu'il interdit tout téléchargement ou suppression non autorisé de vidéos YouTube. Cela signifie qu'OpenAI pourrait éventuellement enfreindre les conditions d'utilisation de YouTube. Si cela devient un problème majeur, nous verrons certainement les entreprises se battre devant les tribunaux à un moment donné.
Google supprime également les vidéos YouTube
Dans une tournure assez importante, il semble que Google récupère également les données des vidéos YouTube. Ce qui est important, c'est le fait que Google est la société mère de YouTube. Donc, ça pose des questions. Est-ce que YouTube est au courant ? Google dit-il à YouTube de se taire à ce sujet ? YouTube intentera-t-il une action en justice contre sa société mère ?
Ces questions resteront longtemps sans réponse. En tout cas, il semblerait que Google ait apporté une petite modification à ses conditions de service. Ce changement, selon le rapport, permet à l'entreprise de récupérer des données provenant de sources visibles publiquement telles que Google Docs, les fichiers Google Sheet, les avis Google Maps, etc. Cela signifie que l'entreprise souhaite intensifier sa collecte de données, et cela ne le fait pas. de bon augure pour les utilisateurs qui souhaitent préserver leurs données.
Les gens lisent les conditions de service des entreprises pour savoir ce qui se passe avec leurs données. Cependant, savoir ce qui se passe avec vos données ne sert à rien si les entreprises peuvent modifier leurs conditions pour leur permettre de les supprimer.
