Google DeepMind lance un outil pour détecter le texte généré par l'IA

À l’ère de l’IA, les sujets du droit d’auteur et de la légitimité du contenu ont reçu une attention considérable. Qu'il s'agisse de déterminer si un élément de contenu a été utilisé avec autorisation pour la formation en IA ou si une image/vidéo réaliste a été générée par l'intelligence artificielle, les outils de détection de la légitimité du contenu sont essentiels dans l'industrie. Google DeepMind a maintenant introduit un outil de filigrane IA axé sur le texte.

SynthID, l'outil de filigrane de Google DeepMind axé sur la détection du texte généré par l'IA

Le nouvel outil, appelé SynthID, a été conçu pour détecter le texte généré par les modèles Gemini de Google. Cependant, DeepMind, la division de la société entièrement axée sur les développements basés sur l'IA, l'a ouverte aux développeurs tiers. Cela signifie que toute entreprise externe axée sur l'IA peut exploiter les ressources et les API de SynthID pour permettre la détection de texte via ses propres développements.

SynthID rejoint des outils DeepMind similaires développés pour identifier les images, la musique et les vidéos générées par l'IA. Il fonctionne en apportant de légères modifications au texte analysé pour modifier la sortie probabiliste du modèle. Ensuite, il compare directement le texte original à la version modifiée pour produire un résultat. Fondamentalement, il détermine la probabilité qu'un modèle d'IA particulier (comme Gemini) génère certaines chaînes de mots, phrases et paragraphes présents dans le texte.

Google DeepMind affirme que son outil de filigrane AI veille à ne pas apporter trop de modifications au texte original. Une entrée qui diffère considérablement de l’originale peut potentiellement fausser les résultats de la comparaison. Franchir cette fine ligne pourrait potentiellement affecter la validité du résultat. Cependant, la division IA de Google prétend l'avoir sous contrôle.

Tests DeepMind pour garantir l’authenticité des résultats

Pour s'assurer que SynthID n'est pas allé trop loin dans la modification du contenu du texte original, DeepMind a effectué des tests avec une contribution humaine. La division IA de Google a envoyé environ 20 millions de passages de texte générés par Gemini aux gens. Certaines personnes ont reçu le contenu textuel généré dans sa forme originale, tandis que d'autres ont reçu le même contenu modifié par SynthID pour les tests de détection. Les résultats ont montré que tous les passages de texte, originaux et modifiés, étaient pratiquement impossibles à distinguer.

Le fait que SynthID soit open source est formidable, mais il présente également certains inconvénients à prendre en compte. Par exemple, les mauvais acteurs pourraient l’utiliser pour apprendre à contourner les outils de détection de contenu générés par l’IA. Ils pourraient utiliser ces connaissances pour développer des outils d’IA générant du texte indétectable par les outils de filigrane. Cependant, nous supposons que DeepMind en est également conscient et qu’il est préparé.