OpenAI a GPT, Google a Gemini et xAI a Grok. Toutes les plus grandes sociétés d'IA du secteur ont leurs modèles phares, et celui de Meta est Llama. Mercredi, Meta a annoncé son nouveau modèle d'IA nommé Llama 3.2, et cette mise à jour donne au modèle une paire d'yeux.

Meta a annoncé des choses assez excitantes lors de son événement hier, comme ses nouvelles lunettes Orion. Les fans de l’entreprise seront certainement ravis de voir comment l’entreprise souhaite combiner l’IA et l’AR (réalité augmentée) de manière inventive. Nous avons également jeté un œil aux nouveaux Meta Quest 3, un casque VR plus abordable de la société.

Meta a annoncé le nouveau modèle Llama 3.2, et il peut comprendre les images

L’une des étapes les plus importantes qu’une entreprise d’IA doit franchir est de rendre ses modèles multimodaux. Cela signifie qu’il peut comprendre et créer différents types de médias. Ainsi, un modèle capable de traiter à la fois du texte et des vidéos est considéré comme multimodal.

La capacité à comprendre les images confère à un modèle des avantages majeurs. Pour commencer, le modèle pourra voir un flux vidéo en direct et comprendre ce qu'il voit. C’est quelque chose qui peut grandement améliorer l’expérience AR. Comme l'a souligné The Verge, les développeurs pourront utiliser le modèle lors du développement d'applications AR nécessitant une compréhension en temps réel de son environnement.

Il existe différents modèles associés à Llama 3.2, et ils auront différentes applications. Deux d’entre eux sont des modèles de vision, l’un comportant 11 milliards de paramètres et l’autre 90 milliards. Parallèlement à ceux-ci, il existe deux modèles textuels uniquement, l’un avec 1 milliard de paramètres et l’autre avec 3 milliards. Tout comme Gemini, les plus petits modèles Llama sont conçus pour être intégrés aux téléphones.

Cela signifie que les Gémeaux pourraient avoir une certaine concurrence à l'avenir si ces modèles commencent à échanger des coups. Seul le temps nous dira si le modèle de Meta correspondra à ce que Google a déjà établi.

A lire également