Reddit est l’une des plateformes sociales les plus populaires, avec des millions d’utilisateurs actifs quotidiens. Par conséquent, elle peut être une source de données très précieuse à l’ère de l’IA. Cependant, l’entreprise ne veut pas que les grandes entreprises profitent de ses données gratuitement. Le PDG de Reddit a déclaré publiquement qu’il souhaitait que Microsoft et d’autres paient pour l’utilisation de son contenu.
Reddit a déjà conclu des accords avec des grands noms comme Google et OpenAI pour l’utilisation des données dans le cadre de formations LLM. Cela permet à l’entreprise de recevoir une compensation, tandis que les services tiers basés sur l’IA ont accès à une gigantesque bibliothèque de données. Cependant, les choses n’ont pas été aussi simples avec Microsoft, qui semble avoir un point de vue différent.
Microsoft devrait payer pour l'utilisation du contenu Reddit dans la formation de l'IA, déclare le PDG de Reddit
Il est notoire que Microsoft considère la plupart des contenus disponibles sur Internet en matière d'intelligence artificielle comme étant gratuits. Mustafa Suleyman, PDG de la division IA de Microsoft, l'a clairement indiqué lors d'une interview publique. Suleyman a déclaré que Microsoft ne prend pas de contenu dont l'auteur demande explicitement de ne pas l'utiliser pour la formation de l'IA. Cependant, le dirigeant considère le reste du contenu sur Internet comme étant « gratuit ». Bien entendu, cela va complètement à l'encontre de l'intention de Reddit de faire payer Microsoft pour l'utilisation du contenu de la plateforme.
Le PDG de Reddit, Steve Huffman, a critiqué non seulement Microsoft pour avoir récupéré des données sans payer, mais aussi d’autres entreprises d’IA comme Anthropic et Perplexity. Un porte-parole de Reddit a déclaré à The Verge que Microsoft et Reddit avaient tenté de négocier sur la question. Cependant, ils n’ont pas réussi à trouver un accord satisfaisant pour toutes les parties. En attendant, Huffman prévient qu’ils mettront en place des blocages pour les entreprises récupérant des données de Reddit sans autorisation ni compensation.
Reddit a bloqué l'accès au contenu de la plateforme à Bing
En fait, l'entreprise a déjà mis en place certains blocages. Par exemple, en ne parvenant pas à un accord avec Microsoft, Reddit a bloqué l'accès de Bing à ses données dans les résultats de recherche. L'équipe de développement de Reddit a même conçu un protocole d'exclusion des robots (robots.txt) à cet effet. Huffman admet néanmoins que l'application de blocages à des entreprises aussi importantes est « une vraie galère », et qu'il préférerait donc probablement ne pas avoir à le faire.
Le PDG de Reddit a déclaré que l'entreprise « choisit soigneusement les personnes avec lesquelles elle travaille et à qui elle confie un accès à grande échelle au contenu de Reddit ». Seul le temps nous dira si Reddit et Microsoft résoudront leur différend et parviendront à un accord, ou si nous assisterons à des blocages à plus grande échelle dans un avenir proche. Après tout, les points de vue de Huffman et Suleyman concernant l'utilisation du contenu disponible sur Internet semblent totalement antagonistes, et il faudra bien que quelqu'un cède.
