Google se prépare déjà à lancer un nouveau système d'IA Gemini

Le lancement de ChatGPT à la fin de l’année dernière a incité de nombreux géants de la technologie, tels que Google, à développer leurs propres chatbots IA comme Bard. Cependant, selon un nouveau rapport de The Information, il semble que Google se prépare déjà à lancer le successeur de Bard nommé Gemini.

Développé en collaboration avec Google et DeepMind, le nouveau chatbot pourrait être lancé dès cet automne et potentiellement remodeler le paysage des chatbots IA. En effet, une source privilégiée a révélé que Gemini de Google vise à fusionner les capacités textuelles des grands modèles de langage (LLM) avec le potentiel créatif des images générées par l’IA. Cette approche innovante a le potentiel d’ouvrir un monde de nouvelles possibilités, car Gemini fonctionnera non seulement comme un générateur de texte mais aussi comme un créateur d’images contextuelles. En outre, la vision de Google comprend également des fonctionnalités telles que l’analyse graphique, la création de graphiques accompagnés de descriptions textuelles et la possibilité de manipuler des logiciels à l’aide de commandes textuelles ou vocales.

Bien que les détails spécifiques sur la manière dont Google prévoit d’implémenter Gemini dans ses services restent flous, la société pourrait s’inspirer de la stratégie de Microsoft en intégrant Gemini dans Google Docs et Sheets pour aider les utilisateurs qui manquent d’expertise technique.

De plus, pour aider à faire de Gemini le prochain bond en avant dans le monde de l’IA générative, Google a réuni une équipe de personnalités de Google Brain et DeepMind. Parmi eux figurent Paul Barham, un chercheur senior de Google, le visionnaire Tom Hennigan de DeepMind et le co-fondateur de Google, Sergey Brin, qui joue un rôle central dans l’évaluation et le raffinement des modèles d’IA.

Comment Google entraîne-t-il Gemini ?

Au lieu d’utiliser les méthodes traditionnelles de formation des modèles d’IA, qui impliquent souvent la collecte de données à partir de plateformes de médias sociaux, Google a choisi une voie unique en utilisant des transcriptions vidéo YouTube pour former son modèle Gemini AI. Cette approche puise dans la vaste bibliothèque de contenu de YouTube, permettant au modèle de Google d’accumuler des connaissances dans un large éventail de domaines.

Néanmoins, le chemin vers Gemini ne sera pas sans défis en raison des récentes luttes juridiques de Google liées à l’utilisation de données protégées par le droit d’auteur pour la formation de modèles d’IA. Cependant, pour résoudre ce problème, la société s’est engagée à maintenir la conformité avec les réglementations en matière de droits d’auteur et a également proposé une nouvelle fonctionnalité de « désactivation », offrant aux éditeurs la possibilité d’empêcher que leurs œuvres soient utilisées à des fins de formation à l’IA.