Sans surprendre personne, Google a annoncé une tonne de cadeaux IA lors du premier jour de Google I/O. Le spectacle est terminé maintenant, mais nous sommes tous encore sous le choc des incroyables annonces faites par Google. Sans aucun doute, 2024 a été une grande année pour les Gémeaux, et cette annonce ne fait que souligner ce fait. Alors, quelles ont été les plus grandes annonces en matière d’IA lors de Google I/O ? Voici un aperçu.

Avant de commencer, si vous souhaitez un aperçu d’autres annonces, grandes et petites, vous devriez consulter notre récapitulatif Google I/O. Il plonge dans le vif du sujet de ce que la société a annoncé.

Les plus grandes annonces d'IA lors de Google I/O 2024

Si nous répertorions chaque annonce faite par l'entreprise en matière d'IA, cet article sera si long que vous le liriez jusqu'à Google I/O 2025 ! Nous allons donc lister les annonces les plus révolutionnaires que Google nous a faites. Il s'agit de fonctionnalités qui seront largement accessibles au grand public et qui auront un impact significatif sur la façon dont vous utilisez les produits Google, sur l'augmentation de la productivité ou sur toute combinaison de celles-ci.

Gémeaux 1.5 Pro/Flash

Dès l'annonce, Google nous a présenté son dernier modèle appelé Gemini 1.5 Pro. Il s'agit du modèle le plus avancé de l'entreprise, et il est déployé sur plusieurs des produits basés sur l'IA de l'entreprise.

Gemini 1.5 Pro améliore l'ancienne version de Gemini dans tous les domaines clés. Son traitement est plus rapide, plus intelligent et beaucoup plus puissant. Ce qui est le plus remarquable, c'est la fenêtre contextuelle étendue. Gemini 1.5 Pro peut accepter jusqu'à un million de jetons. C'est du jamais vu, et cela signifie qu'il peut absorber beaucoup plus d'informations par invite. Nous parlons d'une série entière de livres contenant du texte, des heures d'audio, une heure complète de vidéo, etc. Imaginez télécharger un podcast entier et obtenir un résumé succinct de ce qui a été discuté. Parallèlement à cela, Google teste également une version de 2 millions de jetons de Gemini 1.5 Pro.

Parallèlement à cela, Google a également annoncé Gemini 1.5 Flash. Il s'agit essentiellement d'une version allégée de Gemini 1.5 Pro. C'est plus rapide, plus compact et plus efficace. Quoi qu’il en soit, il a toujours cette limite de 1 million de jetons.

Ajouts d'IA à l'application Gmail

Gmail est l'un des clients de messagerie les plus populaires au monde, et Google vient de l'améliorer grâce à une incroyable intégration Gemini. Premièrement, Gmail bénéficie d'une fonctionnalité de synthèse. C'est simple. Si vous recevez une longue menace d'e-mails et que vous n'avez pas envie de tous les lire, vous pouvez utiliser la fonction de résumé pour obtenir un résumé concis et facile à lire de tous les e-mails. Évidemment, si vous souhaitez voir tous les moindres détails du fil de discussion, vous pouvez lire les e-mails. Cependant, dans la plupart des cas, il suffit d’obtenir un résumé rapide de tout.

Les utilisateurs gratuits seront déçus, car vous ne pourrez utiliser cette fonctionnalité que si vous êtes client Workspace ou si vous utilisez l'abonnement Google One AI Premium.

Une autre fonctionnalité intéressante est la fonctionnalité Q&A de Gmail. Cela vous permettra de poser des questions à Gemini sur le contenu des fils de discussion par courrier électronique. Ensuite, les Gémeaux pourront répondre à ces questions pour vous. Si vous avez une conversation sur la comparaison des prix des logements, vous pouvez demander à Gemini quelque chose comme « Quel acheteur potentiel m'a fait la meilleure offre ? » Les Gémeaux devraient être en mesure de répondre à cette question pour vous.

Demandez des photos à Google

À l'heure actuelle, Google Photos dispose d'une IA assez folle, mais cela ne signifie pas que l'entreprise ne peut pas l'améliorer. Avec Gemini, l'intelligence artificielle qui alimente Google Photos est désormais beaucoup plus avancée.

La société a dévoilé la fonctionnalité Ask Photos, et elle est assez impressionnante. Fondamentalement, vous pouvez poser à Gemini certaines questions générales qui pourraient concerner les images et les vidéos que vous avez capturées. Google a donné l'exemple d'une question consistant à demander comment un enfant s'est amélioré en natation au fil des ans. Gemini sera en mesure de parcourir vos photos, d'identifier l'enfant, d'identifier toutes les photos et vidéos de lui en train de nager et de vous donner une chronologie de sa progression. Ce n'est qu'un exemple de l'utilité de cette fonctionnalité.

Cette option sera épinglée sur la barre inférieure de l'application Google Photos.

Projet Astra

Il s'agit d'une démonstration extrêmement impressionnante de la puissance des Gémeaux. Lors de la présentation, la société a présenté le projet Astra, un outil qui donne à Gemini une paire d'yeux. Google implémentera cela dans l'application Gemini à un moment donné.

Lorsque vous activez la fonctionnalité, vous verrez un viseur dans l'application. Les Gémeaux seront capables d'identifier ce qu'il y a dans le viseur. Dans un exemple donné par Google, un ingénieur de Google a demandé à Gemini quel élément sur son bureau faisait du bruit. L’ingénieur a ensuite pointé du doigt un haut-parleur et Gemini a pu identifier que le haut-parleur faisait du bruit. Ils ont également dessiné une flèche sur l'écran pointant vers le tweeter de l'enceinte. Après que l'ingénieur ait demandé ce que c'était, Gemini a pu identifier qu'il s'agissait du tweeter du haut-parleur et a décrit de quoi il s'agissait.

Ce n'est qu'un exemple. L’ingénieur a également pu demander à Gemini d’identifier son emplacement en pointant la caméra vers l’extérieur. Les Gémeaux ont pu identifier dans quelle partie de la ville ils se trouvaient.

Puisque nous parlons des Gémeaux, vous pouvez lui demander à peu près tout ce que vous voulez. Vous pouvez lui poser des questions sur les éléments qui se trouvent dans le viseur, lui demander de créer du contenu basé sur ceux-ci, etc.

La société a déclaré que certaines fonctionnalités du projet Astra seraient intégrées à l'application Gemini plus tard cette année. Cependant, nous n'avons aucune idée de ces fonctionnalités, nous devrons donc attendre.

Image 3

Au cas où vous ne le sauriez pas, toutes les images générées à l'aide de Gemini utilisent le modèle d'image propriétaire de Google nommé Imagen. Eh bien, la société a dévoilé Imagen 3, son modèle le plus avancé. Grâce à lui, les gens peuvent produire des images beaucoup plus réalistes avec des détails fins ajoutés. Donc, si vous aimez la génération d'images IA, alors c'est quelque chose qui vous passionne. Il aspire au photoréalisme et y parvient.

Véo

Pour aller plus loin, Google a également présenté sa plateforme de génération vidéo. Cela va rappeler aux gens la plateforme de génération vidéo d'OpenAI appelée Sora. Sora est capable de créer des clips vidéo très réalistes.

Lors de Google I/O, la société a dévoilé sa propre vision de la génération vidéo. Il s'agit d'une plateforme capable de créer des clips vidéo incroyablement réalistes. Il est capable de créer des clips 1080p de haute qualité qui dépassent la limite de 60 secondes de Sora. À ce stade, nous ne savons pas quand il sera rendu public. Cependant, lorsque cela se produira, nous sommes certains que nous verrons beaucoup de vidéos générées par l'IA sur Internet.

Questions vidéo pour la recherche Google

Considérez cette fonctionnalité comme Google Lens pour les vidéos. Vous pouvez envoyer un enregistrement à Google et poser des questions à Gemini concernant cette vidéo. La question peut porter sur n'importe quoi. Les Gémeaux seront capables d'identifier ce qui se passe dans la vidéo et de répondre à la question en fonction de cela.

Google a donné un exemple lors de Google I/O où le présentateur a posé à Google une question basée sur une vidéo d'une platine vinyle cassée. Gemini a pu identifier quelle partie du plateau tournant était cassée et lui donner des informations sur la marche à suivre pour la réparer. Cette fonctionnalité est fidèle à la vision originale de Google consistant à laisser Gemini raisonner à travers le texte, l'audio, la vidéo et les images.

Les possibilités sont infinies avec cette fonctionnalité et elle rendra Google beaucoup plus accessible aux personnes qui ne savent pas vraiment taper une question.

Pierres précieuses

Cette nouvelle fonctionnalité est un excellent moyen de personnaliser votre expérience Gemini. Une Gem est une version personnalisée de Gemini que vous pouvez utiliser pour des raisons très spécifiques. Par exemple, si vous souhaitez créer une version personnalisée de Gemini spécialement conçue pour créer des histoires de fantômes, vous pouvez créer une gemme à cet effet.

Dans le créateur de gemmes, vous pouvez décrire le type de chatbot que vous souhaitez créer. Vous pouvez taper quelque chose comme « Un créateur d’histoires de fantômes qui crée des histoires avec des personnages mystérieux et des rebondissements ». Lorsque vous faites cela, Gemini se mettra au travail pour créer le jeu d’instructions pour ce chatbot.

Cela va plus loin, car vous pouvez également autoriser Gemini à accéder à vos fichiers sur d'autres produits Google. Par exemple, si vous donnez à Gemini l'accès à vos documents Google et que vous avez des brouillons d'histoires de fantômes, Gemini pourra lire ces brouillons afin d'avoir une idée du type d'histoires que vous souhaitez qu'il écrive.

Vous êtes capable de créer plusieurs gemmes, vous pourrez donc les utiliser pour différentes raisons. Cette fonctionnalité sera déployée plus tard cette année.

Détecteur d'appels frauduleux alimenté par Gemini

Il s’agit d’une fonctionnalité intéressante à avoir si vous souhaitez vous protéger contre les arnaques. Nous sommes tous habitués à recevoir des notifications d'arnaque dès qu'un appel arrive. Cependant, certains appels parviennent et Google pourra vous avertir lors d'un appel s'il s'agit d'une arnaque.

Les Gémeaux pourront écouter votre appel et déterminer si la personne qui vous appelle essaie de vous arnaquer d’une manière ou d’une autre. Par exemple, si vous êtes appelé par une banque et que celle-ci vous demande de transférer votre argent sur un compte sécurisé (ce que les banques ne font JAMAIS), Gemini pourra signaler cet appel et vous dire qu'il s'agit probablement d'un appel. arnaque.

Ce qui est intéressant, c'est que tout le traitement s'effectue sur l'appareil. Ainsi, vous n’aurez pas à craindre que Google écoute votre conversation. Toutes les données restent stockées localement sur votre appareil.

Mise à niveau du Notebook LM

Notebook LM est un outil pédagogique qui aide les enfants à apprendre et à faire des recherches. Cela a été annoncé lors de Google I/O en 2023. Maintenant, Notebook LM reçoit une mise à jour assez importante.

Cette fonctionnalité est appelée aperçus audio. Il lira le matériel que vous y chargez et proposera une discussion éducative basée sur celui-ci. La discussion éducative se déroulera sous forme de podcast avec deux personnes parlant. Il émulera une vraie conversation afin que les enfants puissent mieux s'y associer.

Non seulement cela, mais vous pouvez suggérer des modifications à la discussion, et Gemini apportera les modifications en temps réel. Par exemple, si vous créez une discussion sur les lunes de Jupiter, mais que vous souhaitez la modifier pour qu'elle utilise des analogies avec le basket-ball, vous pouvez la saisir. Après cela, les Gémeaux reconstruiront la discussion éducative en fonction de cela.

Intégration plus étroite entre les applications Workspace

À l'heure actuelle, les applications Workspace de Google telles que Docs, Sheets, Slides, Gmail, etc. peuvent s'intégrer les unes aux autres. Cependant, Google renforce cette intégration, et Gemini est l'étau utilisé pour la renforcer. Vous pourrez demander à Gemini d'effectuer certaines actions avec vos fichiers dans Workspace.

Par exemple, si vous souhaitez que Gemini examine vos e-mails, examine une facture pour un service que vous avez effectué et colle les informations de cette facture dans un document Google, vous pourrez le faire. Ce n'est qu'un exemple de cette intégration étroite.

A lire également