Meta Platforms, la société mère de Facebook, prévoit de déployer cette année une puce personnalisée de deuxième génération dans ses centres de données, selon un document interne obtenu par Reuters. Cette décision fait partie des efforts continus de Meta pour améliorer ses capacités d’intelligence artificielle (IA) et réduire sa dépendance aux puces Nvidia.
Meta vise à réduire sa dépendance à l’égard de Nvidia pour les puces axées sur l’IA
La nouvelle puce, connue en interne sous le nom de « Artemis », fait suite à l’annonce d’une ligne de silicium personnalisée par Meta l’année dernière. L’objectif est non seulement de réduire les coûts associés à l’exécution des charges de travail d’IA, mais également de réduire la dépendance à l’égard de Nvidia pour les puces axées sur l’IA, alors que Meta intensifie sa poussée vers les produits d’IA générative sur Facebook, Instagram, WhatsApp et les appareils matériels comme les lunettes intelligentes Ray-Ban.
Le déploiement de la propre puce de Meta pourrait potentiellement conduire à des économies significatives, réduisant ainsi les coûts énergétiques annuels et les milliards de dépenses d’achat de puces. Dylan Patel, fondateur du groupe de recherche sur le silicium SemiAnalysis, suggère qu’à l’échelle de Meta, le déploiement réussi de sa puce personnalisée pourrait entraîner des avantages financiers substantiels. Cette décision signifie la tentative de Meta d’établir un plus grand contrôle sur son infrastructure d’IA.
Meta s’attend à une amélioration des performances et de l’efficacité sur ses charges de travail spécifiques avec « Artemis »
Le projet de Meta visant à compléter les GPU axés sur l’IA disponibles dans le commerce avec ses puces Artemis développées en interne vise à optimiser les performances et l’efficacité des charges de travail spécifiques à Meta. Le PDG de la société, Mark Zuckerberg, a récemment présenté son intention d’acquérir environ 350 000 processeurs Nvidia H100 d’ici la fin de l’année, soulignant l’importante capacité de calcul que Meta souhaite accumuler.
La nouvelle puce, Artemis, est conçue pour le traitement d’inférence, où les modèles utilisent des algorithmes pour générer des réponses aux invites des utilisateurs. Malgré un revers en 2022 lorsque les dirigeants ont décidé d’abandonner la première itération de la puce, l’accent renouvelé de Meta sur le silicium IA interne marque une évolution positive. La société avait initialement choisi d’acheter les GPU de Nvidia, qui dominent actuellement le processus de formation à l’IA. Bien qu’actuellement axée sur l’inférence, la puce Artemis indique l’exploration par Meta de puces plus ambitieuses capables de gérer la formation et l’inférence, comme indiqué l’année dernière.
