Au sommet de la hiérarchie des modèles d'IA, nous avons des modèles comme Gemini 1.5 Pro et GPT-4o avec d'autres acteurs majeurs comme Llama 3, Claude 3 et d'autres. Quelque part dans le mix, nous avons le modèle Grok de xAI. Il a gagné en fonctionnalités au cours des deux derniers mois et Elon Musk vient d'annoncer une nouvelle capacité pour le modèle qui semble sortir d'un film de science-fiction. Grok peut désormais comprendre les images et même expliquer les blagues.

Grok a quelques ennuis depuis qu'il a acquis la capacité de générer des images. Bien entendu, il ne manquait aucune garantie pour empêcher les gens de générer du matériel problématique. Quoi qu’il en soit, cela se développe. Si vous souhaitez utiliser ce mode, vous devrez être abonné X Premium+. Il s’agit du niveau de paiement le plus cher proposé par l’entreprise. Cela coûte 16 $/mois (22 $/mois si vous vous inscrivez via l'application).

Grok peut désormais comprendre les images

Pour qu’un modèle d’IA nous amène à l’ère de l’AGI (Artificial General Intelligence), il doit être multimodal. Cela signifie qu’il a la capacité de comprendre et de générer plusieurs formes de médias. Grok a acquis la capacité de générer des images, mais les comprendre est une autre histoire.

Elon Musk a posté sur X à propos de la nouvelle capacité de Grok. Dans l'exemple, il montre qu'il peut fournir une explication d'une image qui y a été téléchargée. Pour son exemple, il a montré Grok expliquant un mème. Le mème montrait deux soldats repérant des soldats faisant semblant d'être morts (qui se trouvent également être des physiciens).

Grok donne une explication en six points de ce qui se passe dans l'image et se termine par une déclaration finale. Alors, quelle était sa précision ? Disons simplement que Grok ne prendra prochainement la parole dans aucun atelier de comédie. Le modèle a pu identifier ce qui se passait sur la scène, comme les soldats, la colline et les personnes au sol.

Cependant, il est écrit «L'humour vient de la punchline du deuxième panneau, où un garde dit : « Isaac Newton a inventé la gravité », ce qui implique que la raison pour laquelle les physiciens ne bougent pas (et semblent donc morts) est à cause de la gravité, que Newton est célèbre pour décrire mathématiquement. , sans inventer.»

On dit aussi que l’humour vient du fait que les physiciens «seraient tellement dévoués à leur travail qu'ils s'allongeraient pour étudier ou « découvrir » la gravité,« . Donc, il a clairement mal compris le sens de la blague.

Cela signifie-t-il que Grok est mauvais ?

Non, cela signifie que l’IA elle-même a quelques améliorations à apporter. Nous parlons de former un modèle pour comprendre humourl'une des créations les plus humaines de tous les temps. Non seulement cela, mais nous avons donné la même image aux Gémeaux pour qu'ils comprennent, et ils se sont également trompés.

Les modèles comprennent les éléments individuels de l’image et ont une compréhension superficielle de la comédie ; quoique très analytique. Cependant, ils ne comprennent pas le problème que l'artiste doit résoudre avec les scientifiques qui s'efforcent de corriger les gens sur des détails plus fins du discours. Nous ne savons pas comment les entreprises pourront enseigner cela aux modèles d’IA.

A lire également