Reddit poursuit Perplexity AI pour des allégations de grattage de données et de vol de contenu

Considérez l’IA comme un enfant qui grandit. L'enfant ne sait pas grand-chose, mais plus vous lui apprenez, plus il devient intelligent. C’est la même chose pour l’IA, où plus elle reçoit d’informations et de données, plus elle devient intelligente. Reste cependant la question de savoir d’où proviennent ces données. Malheureusement, Perplexity s'est retrouvé dans des ennuis juridiques puisque Reddit a intenté une action en justice contre la société d'IA pour avoir prétendument arraché son contenu.

Reddit porte plainte contre Perplexity AI

Selon le procès, Reddit était au courant de fournisseurs de services de récupération de données qui récupéraient des données sur Internet, qui étaient ensuite utilisées pour former des modèles d'IA. Le procès révèle également que Reddit a contacté Perplexity en mai 2024, exigeant que la société d'IA cesse de supprimer ses données.

Mais selon Perplexity, l’entreprise n’a pas utilisé le contenu de Reddit pour entraîner ses modèles d’IA. La société a également déclaré qu'elle respecterait le fichier robots.txt de Reddit. Cependant, après la lettre envoyée par Perplexity à Reddit, la société a constaté que le volume de citations Reddit utilisées par Perplexity avait en réalité augmenté. L'entreprise l'a testé en créant une publication qui ne pouvait être explorée que par Google. En quelques heures, Perplexity a produit le contenu de ce message.

Reddit déclare : « La seule façon pour Perplexity d'obtenir ce contenu Reddit et de l'utiliser ensuite dans son « moteur de réponse » est si elle et/ou ses coaccusés ont récupéré les SERP de Google pour ce contenu Reddit et que Perplexity a ensuite rapidement incorporé ces données dans son moteur de réponse.

Jesse Dwyer, responsable de la communication de Perplexity, a depuis répondu avec sa propre déclaration. S'adressant à The Verge, Dwyer a déclaré : « Perplexity n'a pas encore reçu le procès, mais nous lutterons toujours vigoureusement pour les droits des utilisateurs à accéder librement et équitablement aux connaissances publiques. Notre approche reste fondée sur des principes et responsable car nous fournissons des réponses factuelles avec une IA précise, et nous ne tolérerons pas les menaces contre l'ouverture et l'intérêt public. «

Pas la première fois

Perplexity n'est pas la première entreprise à se retrouver en difficulté après avoir prétendument utilisé des données provenant d'autres plateformes pour entraîner ses modèles d'IA. Le New York Times a intenté plusieurs poursuites contre des sociétés d'IA telles qu'OpenAI et même Microsoft. De grandes publications ont également appelé le gouvernement à mettre fin à ce vol de données par les sociétés d'IA.

Cependant, toutes les entreprises ne sont pas coupables de ce soi-disant vol. D’autres sociétés, comme Amazon, ont signé des accords avec des publications comme le New York Times pour utiliser leurs données. La perplexité a également fait quelque chose de similaire. La société n’a peut-être pas d’accord avec Reddit, mais elle a un accord avec d’autres éditeurs. Cela fait partie de son abonnement Comet Plus.

Pour ceux qui ne le connaissent pas, Comet Plus est un abonnement au prix de 5 $ par mois. Il donne aux utilisateurs accès à du « contenu premium » provenant d’éditeurs et de journalistes de confiance. À partir de cet abonnement, Perplexity donnera une part à ces éditeurs.