Un guide pour 61 termes que tout le monde devrait savoir

Si vous avez passé du temps en ligne ces derniers temps, vous avez probablement entendu beaucoup de «nouveaux» mots liés à l'IA lancés: LLM, AI génératif, réseau neuronal et bien d'autres. Ces termes peuvent ressembler à quelque chose de tout droit sorti d'un film de science-fiction. Cependant, ils font en fait partie d'une nouvelle langue qui devient aussi courante que de parler d'applications et de médias sociaux.

L'intelligence artificielle n'est plus un sujet uniquement pour les chercheurs et les initiés de l'industrie. De plus en plus d'utilisateurs «normaux» souhaitent sauter dans le train de l'IA. Que vous essayiez de comprendre un article de presse, vous voulez essayer un nouvel outil d'IA, ou que vous êtes simplement curieux de savoir l'avenir, savoir que les bases sont d'une grande aide.

Nous décomposerons 61 des termes les plus importants, passant des principes fondamentaux que tout le monde devrait connaître le langage plus spécifique pour ceux qui veulent creuser un peu plus profondément.

Les concepts principaux: les éléments constitutifs de l'IA

Commençons par la vue d'ensemble. Ce sont les termes que vous verrez presque partout.

Intelligence artificielle (IA): Le terme le plus large et le plus général. L'IA est une technologie qui peut «simuler» l'intelligence humaine, permettant des systèmes avec des capacités d'apprentissage, de résolution de problèmes et de prise de décision.

Apprentissage automatique (ML): Un élément clé de l'IA. ML est le processus de formation d'un ordinateur pour apprendre des données sans être explicitement programmé pour chaque scénario possible. Vous lui donnez des données, et elle comprend en soi les modèles et les règles.

Deep Learning (DL): Une forme spécialisée de ML. Il utilise des structures complexes appelées réseaux de neurones pour traiter les données dans de nombreuses couches, un peu comme un cerveau humain. Le Deep Learning est à l'origine de certains des outils d'IA les plus impressionnants que nous ayons aujourd'hui.

Réseau neuronal: La structure sous-jacente d'un modèle d'apprentissage en profondeur. Il s'agit d'une série de couches interconnectées de «nœuds» qui fonctionnent ensemble pour traiter les informations, chaque couche affinant les données. Il est basé sur le fonctionnement du cerveau humain.

AI génératif (Genai): Une IA qui peut créer un nouveau contenu original. Cela comprend tout, des essais et des histoires aux images, à la musique et au code informatique.

AI prédictif: Une IA qui utilise des données pour faire une prédiction sur l'avenir. Par exemple, une IA prédictive pourrait analyser les données d'achat pour prédire quels produits seront populaires la saison prochaine.

Traitement du langage naturel (PNL): Le domaine de l'IA qui permet aux ordinateurs de comprendre, d'interpréter et de générer un langage humain. Chaque fois que vous utilisez un chatbot ou un assistant vocal, vous vivez la PNL en action. Il supprime la barrière de la «langue robotique» qui nécessite des commandes rigides.

Vision par ordinateur: Le domaine de l'IA qui permet aux ordinateurs de «voir» et d'interpréter les informations visuelles à partir d'images et de vidéos. Ceci est utilisé dans tout, de la reconnaissance faciale aux voitures autonomes.

Rapide: C'est essentiellement ce que vous dites à une IA. C'est le texte ou la commande que vous tapez dans un chatbot pour le faire générer une réponse. Une bonne invite est souvent la clé pour obtenir une bonne réponse.

Modèle de grande langue (LLM): La technologie derrière de nombreuses AIS génératives. Un LLM est un puissant modèle d'IA qui a été formé sur une quantité massive de données de texte. Des outils comme Chatgpt et Gemini sont des exemples de LLMS. Les utilisateurs finaux recourent principalement au cloud computing pour les exécuter, car les LLM nécessitent des logiciels assez puissants et coûteux pour s'exécuter localement.

Modèle de petite langue (SML): Semblable à LLM, mais formé avec beaucoup moins de paramètres et moins de données. Ils sont conçus pour fonctionner localement sur des appareils basse puissance. Par exemple, le Gemini Nano est présent sur plusieurs téléphones Android. Les SML permettent des fonctionnalités alimentées par AI telles que la résumé de texte, l'assistance de l'écriture et l'édition générative d'image de base, entre autres.

Hallucination: Un terme original mais important. Lorsqu'une AI «hallucine», elle donne une réponse à consonance confiante qui est complètement fausse ou absurde.

Deepfake: Une vidéo, un audio ou une image synthétiques d'une personne qui semble ou sonne si réelle qu'il peut être difficile de dire qu'il est faux.

Le terrain d'entraînement: comment les modèles IA sont construits

Ces termes expliquent le processus de création et de formation d'un modèle d'IA.

Modèle: L'algorithme entraîné lui-même. C'est le fichier ou le programme qui contient les «connaissances» de l'IA et est prêt à faire des prédictions ou à générer du contenu. Il existe des modèles pour des tâches spécifiques, comme l'imagen de Google (Genai pour les images) et Veo (Genai pour les vidéos).

Ensemble de données: Toute la collecte de données de formation utilisée pour enseigner une IA. C'est la bibliothèque d'informations que le modèle apprend.

Formation du modèle: L'ensemble du processus d'alimentation d'un modèle d'IA avec des données pour lui enseigner une tâche spécifique.

Apprentissage supervisé: Une méthode de formation où l'IA obtient un ensemble de données étiqueté. C'est comme un élève avec un enseignant: les données ont des réponses, et l'IA apprend en faisant correspondre ses prédictions aux bonnes.

Apprentissage non surveillé: Une méthode de formation où l'IA obtient des données non marquées et doit trouver des modèles cachés seuls. C'est comme donner à un élève une pile de photos et leur demander de les organiser en groupes.

Apprentissage du renforcement: Une méthode de formation où l'IA apprend par essais et erreurs. Il reçoit ensuite des «récompenses» pour les actions correctes et les «pénalités» pour les mauvais. C'est comme ça que l'IA peut apprendre à jouer à un jeu, comme les échecs ou partir, et s'améliorer avec la pratique.

Apprentissage zéro-shot: La capacité d'un modèle d'IA à effectuer une tâche sur laquelle il n'a pas été explicitement formé, basé uniquement sur sa large compréhension à partir de ses données de formation.

Apprentissage à quelques coups: La capacité d'un modèle d'IA à apprendre une nouvelle tâche à partir d'un petit nombre d'exemples.

Distillation des données: Une technique utilisée pour transférer des connaissances d'un modèle large et complexe («l'enseignant») à un modèle plus petit et plus efficace («l'élève»). Il permet aux modèles plus petits de reproduire les performances de plus grandes, mais avec une meilleure efficacité et moins de ressources.

Données synthétiques: Informations générées artificiellement qui imite les propriétés statistiques des données du monde réel mais ne contient aucune information réelle. Il est utile de former, de tester et de valider les modèles d'IA, en particulier lorsque les données réelles sont rares ou coûteuses / impossibles à obtenir.

Réglage fin: Le processus de prise d'un modèle pré-formé et de la formation sur un ensemble de données plus petit et plus spécifique pour l'améliorer dans une tâche particulière.

Sur-ajustement: Un problème qui se produit lorsqu'un modèle apprend les données de formation «trop bien», mémorisant des exemples spécifiques au lieu de comprendre les modèles généraux. Cela entraîne une mauvaise performance du modèle sur les nouvelles données.

Inférence: Le processus d'utilisation d'un modèle d'IA formé pour faire une prédiction ou générer un nouveau contenu à partir de nouvelles données invisibles.

Biais: Une erreur systématique dans un système d'IA qui conduit à des résultats injustes ou inexacts. Cela se produit souvent lorsque les données de formation ne sont pas représentatives du monde réel.

GÉNÉRATION AUGMENTÉE (RAGE) de la récupération: Une technique qui permet à un LLM d'accéder et d'utiliser des bases de connaissances externes pour fournir des informations plus précises et à jour, en réduisant les hallucinations.

Lingo chatbot: parler à l'IA

Ces termes sont particulièrement utiles lorsque vous interagissez avec une IA conversationnelle.

Ingénierie rapide: L'art et la science de l'élaboration des invites efficaces pour obtenir la meilleure réponse possible d'un modèle d'IA.

Chaînage rapide: Capacité à relier plusieurs invites dans une séquence. La sortie d'une invite est utilisée comme entrée pour la suivante.

Fenêtre de contexte: La quantité d'informations qu'un modèle d'IA peut «se souvenir» ou considérer en même temps lors de la génération d'une réponse. Si une conversation dure trop longtemps, l'IA pourrait oublier ce que vous avez dit au début.

Jeton: La plus petite unité de données et les processus du modèle AI. Dans le texte, un jeton peut être un mot, une partie d'un mot ou même une marque de ponctuation.

Température: Un paramètre qui contrôle à quel point la réponse d'une IA est «créative» ou aléatoire. Une température élevée conduit à des réponses plus variées et imprévisibles, tandis qu'une basse température rend la réponse plus prévisible et conservatrice.

Agents: Les systèmes d'IA qui peuvent effectuer des tâches complexes et en plusieurs étapes par eux-mêmes, souvent sans surveillance humaine constante. Par exemple, un agent pourrait réserver un vol pour vous en interagissant avec plusieurs sites Web.

Aller plus loin: les termes techniques et avancés

Si vous voulez comprendre ce qui se passe sous le capot, ces termes vous donneront un aperçu de la mécanique des modèles d'IA.

Paramètres: Les paramètres internes ou variables qu'un modèle AI ajuste pendant la formation. Vous pouvez généralement mesurer la taille d'un LLM par son nombre de paramètres. Un LLM avec moins de 10 milliards de paramètres est considéré comme un SML.

Emballages vectoriels: Un moyen de représenter des mots, des images et d'autres données en tant que vecteurs numériques. Cela permet à une IA de comprendre les relations et les similitudes entre les différentes informations.

Algorithme: L'ensemble des règles ou des instructions qu'un modèle suit pour apprendre des données.

Rétropropagation: Un algorithme de base utilisé dans l'apprentissage en profondeur pour former un réseau neuronal. Il s'agit de travailler en arrière à travers le réseau pour ajuster les poids des connexions, améliorant la précision.

Poids: Les valeurs qu'un réseau neuronal attribue à ses connexions. Ces poids déterminent l'importance des intrants et sont ajustés pendant l'entraînement.

Couches: Les différents niveaux d'un réseau neuronal. Les informations circulent d'une couche d'entrée, via une ou plusieurs couches cachées, à une couche de sortie.

Mécanisme d'attention: Une technique qui permet à un modèle de se concentrer sur les parties les plus importantes des données d'entrée lors de la génération d'une réponse. Il est crucial pour les performances des modèles de grande langue.

Transformateur: Un type spécifique d'architecture de réseau neuronal qui utilise le mécanisme d'attention pour gérer les données séquentielles. C'est incroyablement efficace pour des tâches comme la traduction du langage et la génération.

Apprentissage du renforcement avec rétroaction humaine (RLHF): Une méthode de formation qui utilise les préférences humaines pour affiner le comportement d'un modèle d'IA. Cela le rend plus utile et aligné avec les valeurs humaines.

Réseaux adversaires génératifs (GAN): Un type d'IA génératif qui utilise deux réseaux neuronaux concurrents – un pour créer du contenu et un autre pour essayer de repérer s'il est faux – pour créer des images et des vidéos incroyablement réalistes.

Latence: Le temps nécessaire à un modèle d'IA pour traiter une demande et générer une réponse. La latence plus faible signifie des résultats plus rapides.

Drift du modèle: Un phénomène où les performances d'un modèle d'IA se dégradent lentement au fil du temps à mesure que les données réelles qu'elle rencontre changent.

AI explicable (xai): Un domaine de l'IA dédié à rendre les processus décisionnels des modèles d'IA plus transparents et compréhensibles pour les humains.

Génération d'images: Le processus d'utilisation de l'IA pour créer de nouvelles images à partir de zéro, souvent à partir d'une invite de texte.

Texte à l'image: Un type spécifique d'IA génératif qui crée une image basée sur une invite de texte.

Text-vocation (TTS): La technologie qui convertit le texte écrit en discours synthétisé.

Reconnaissance de la parole (STT): La technologie qui convertit la langue parlée en texte.

Analyse des sentiments: Le processus d'utilisation de l'IA pour déterminer le ton émotionnel ou l'opinion exprimé dans un texte, comme dans un commentaire sur les réseaux sociaux ou une revue client.

Robotique: Un champ qui combine l'IA avec des machines physiques pour créer des robots qui peuvent effectuer des tâches dans le monde réel.

Compréhension du langage naturel (NLU): Un sous-ensemble de PNL (traitement du langage naturel) qui se concentre spécifiquement sur la capacité d'un ordinateur à comprendre le sens du langage humain, y compris le contexte et l'intention.

Génération du langage naturel (NLG): Un sous-ensemble de PNL qui se concentre sur la capacité d'un ordinateur à générer du texte de type humain à partir de données.

Interface de programmation d'application (API): Un ensemble de règles et de protocoles qui permet à deux logiciels différents, comme un site Web et un modèle d'IA, de communiquer entre eux.

GPU (unité de traitement graphique): Un processeur spécialisé qui est incroyablement bon pour gérer les calculs parallèles nécessaires à la formation des modèles d'IA.

Algorithme: L'ensemble des règles ou des instructions qu'un modèle suit pour apprendre des données.

Intelligence générale artificielle (AGI): Une forme hypothétique d'IA qui posséderait la capacité de comprendre, d'apprendre et d'appliquer des connaissances dans un large éventail de tâches à un niveau humain, similaire à un cerveau humain.

Tokenisation: Le processus de décomposition d'une séquence de texte en unités plus petites et gérables appelées jetons pour un modèle d'IA à traiter.

Chatbot: Une application logicielle qui peut tenir une conversation avec un humain utilisant du texte ou de la voix.

Bienvenue, et profitez de votre voyage IA

Avec ces termes, vous êtes plus que prêt à naviguer dans le monde rapide de l'IA. Cette technologie est un outil puissant, et comprendre son langage est la première étape vers son utilisation efficace et responsable.