L’intelligence artificielle est le mot à la mode en 2023, en partie grâce aux efforts des entreprises technologiques qui s’efforcent de développer les systèmes d’IA les plus avancés. Aujourd’hui, dans le cadre de ces efforts, Meta a annoncé un nouveau modèle d’IA appelé SeamlessM4T, qui vise à briser les barrières linguistiques en traduisant et en transcrivant efficacement près de 100 langues sous forme écrite et orale.
Selon Meta, contrairement aux outils de traduction traditionnels, qui ont des problèmes avec une couverture linguistique limitée, le modèle d’IA open source SeamlessM4T gère sans effort les traductions parole-texte et texte-texte en reconnaissant et en traitant les entrées de 100 langues et en les convertissant. en 35 langues de sortie distinctes. De plus, le fait que le modèle de langage exécute toutes les tâches ci-dessus en une seule étape facilite la conversation dans différentes langues.
De plus, pour garantir la sensibilité des traductions, Meta a mis en place des mécanismes conçus pour filtrer les mots potentiellement nuisibles qui pourraient provoquer de la négativité ou des abus.
«Nous avons filtré une toxicité déséquilibrée dans les données d’entraînement. Si l’entrée ou la sortie contenaient des quantités différentes de toxicité, nous supprimions cette séquence d’entraînement », a déclaré Meta.
Prévenir les préjugés sexistes
Bien que les fonctionnalités du nouveau système d’IA SeamlessM4T soient louables, des inquiétudes subsistent quant aux préjugés sexistes inhérents qui ont tourmenté divers traducteurs de langues, y compris Google Translate. Consciente de ces préoccupations, Meta a mis en place des systèmes pour identifier et rectifier les préjugés sexistes présents dans les traductions. Ceci est particulièrement crucial dans les langues où les formes de genre sont prédominantes, comme l’espagnol.
Malgré ses capacités impressionnantes, le modèle d’IA a encore du mal à reproduire les nuances lexicales complexes inhérentes aux traductions humaines, un élément essentiel dans des conversations significatives. De plus, Meta a mis en garde contre le recours à ce modèle pour des traductions longues et a souligné son inadaptation aux contextes médicaux ou juridiques.
« Cette approche système unique réduit les erreurs et les retards, augmentant ainsi l’efficacité et la qualité du processus de traduction, nous rapprochant ainsi d’une traduction transparente. À l’avenir, nous souhaitons explorer comment ce modèle fondamental peut permettre de nouvelles capacités de communication, nous rapprochant ainsi d’un monde où tout le monde peut être compris », a déclaré Juan Pino, chercheur scientifique à la division de recherche en IA de Meta.