Apparemment, des millions de Redditors étaient inclus dans une expérience artificielle secrète. Les chercheurs n'ont pas obtenu les connaissances ou le consentement des Redditors pour cette expérience. Un fil sur Reddit a récemment exposé cette expérience et a déclenché l'indignation sur Internet et a ravivé un débat assez féroce sur l'éthique de l'IA, le consentement des données et les responsabilités des chercheurs en technologie.

Cette étude a été menée par des chercheurs de Stanford et de l'Université de Pennsylvanie. Qui a utilisé Reddit comme terrain d'essai en direct pour évaluer comment le contenu généré par l'IA influencerait les vrais utilisateurs. Il y a eu plus de 47 millions de messages et de commentaires analysés dans cette étude et les réponses générées par l'AI ont été secrètement injectées dans des threads Reddit pour observer comment les utilisateurs ont interagi avec eux.

Selon personne, il y a beaucoup de contrecoups sur cette expérience, les critiques affirmant qu'il représente une violation claire des normes éthiques, en particulier autour du consentement éclairé et de l'autonomie des utilisateurs.

« Une expérience inappropriée et très contraire à l'éthique qui est profondément erronée à la fois au niveau moral et juridique. »

-Ben Lee, directeur juridique de Reddit

Il s'agit d'une situation complexe en raison de la zone grise entre les données publiques et l'utilisation d'IA éthique

Nous rendons compte depuis des mois, comment les entreprises d'IA utilisent tout ce qui est publié n'importe où sur Internet pour former leurs chatbots. Y compris le vol de contenu de sites comme celui-ci. Et cela fait partie de ce qui en fait une situation complexe.

Vous voyez, il existe des données d'IA éthiques qui peuvent être utilisées, mais il existe également des données publiques, dont les publications Reddit sont considérées comme. Cependant, cela ne signifie pas que les Redditors ont consenti à faire partie d'une expérience comportementale. Particulièrement pas celui qui implique une manipulation générée par l'AI.

Les chercheurs de cette étude ont publié une déclaration et ont également fourni une description de la recherche:

Au cours des derniers mois, nous avons utilisé plusieurs comptes pour des publications publiées sur CMV. Notre expérience a évalué la persuasion de LLM dans un scénario éthique, où les gens demandent des arguments contre les opinions qu'ils détiennent. En commençant, nous n'avons pas révélé qu'une IA a été utilisée pour écrire des commentaires, car cela aurait rendu l'étude impossible. Bien que nous n'ayons pas écrit de commentaires nous-mêmes, nous avons examiné manuellement chaque commentaire publié pour nous assurer qu'ils n'étaient pas nocifs.

Nous reconnaissons que notre expérience a enfreint les règles de la communauté contre les commentaires générés par l'AI et les excuses. Nous pensons cependant que, compte tenu de l'importance sociétale élevée de ce sujet, il était crucial de mener une étude de ce type, même si cela signifiait désobéir les règles.

Ce groupe de chercheurs a demandé à rester anonyme. Nous avons également appris que les comptes créés pour publier ces contenus générés par l'IA se faisaient passer pour des victimes de viol, des conseillers en traumatologie spécialisés dans les abus, un homme noir opposé à Black Lives Matter, entre autres personnages. Tous ces comptes ont été suspendus et de nombreux commentaires ont été supprimés de Reddit.

«C'est l'une des pires violations de l'éthique de la recherche que j'aie jamais vue.»

-Casey Fiesler, scientifique de l'information à l'Université du Colorado

Fiesler a continué à déclarer sur Bluesky que «la manipulation des gens dans les communautés en ligne utilisant la tromperie, sans consentement, n'est pas« à faible risque »et, comme en témoigne le discours de ce poste Reddit, a causé des dommages.»

Comme vous l'avez peut-être pu s'y attendre, le thème principal du fil Reddit à ce sujet est une question de confiance.

A lire également