Avec l’essor des intelligences artificielles et la fascination exercée par les IA génératives, les composants permettant de donner vie à ces intelligences numériques deviennent très demandés et font les beaux jours de certains concepteurs de puces.
Nvidia, parti tôt sur ce nouveau segment, vend des charrettes de composants Nvidia H100 (et bientôt Nvidia H200, tous deux sous architecture graphique Hopper) et A100 (sous Ampere), ce qui donne des ailes à ses revenus et son bénéfice, même si la redescente risque d’être rude avec le contre-coup du durcissement des restrictions commerciales US contre la Chine, immense marché très demandeur de ces solutions que le pays ne sait pas encore produire lui-même.
Nvidia domine largement le segment des accélérateurs IA mais commence à voir arriver plus sérieusement le concurrent AMD et ses composants Instinct MI300X et MI300A, parti plus tard mais avec des arguments pour se faire une place confortable sur le segment.
Avec Gaudi3, des ambitions dans les accélérateurs IA
Il faudra aussi compter sur Intel qui sait également produire des accélérateurs IA avec les puces Gaudi conçues par Habana Labs. Même si le coeur des dernières présentations du groupe ont porté sur l’arrivée des processeurs Meteor Lake gravés en 7 nm (procédé Intel 4) représentatifs de la famille Intel Core de 14ème génération et de la nouvelle famille Intel Xeon de 5ème génération, son CEO Pat Gelsinger n’a pas résisté au plaisir d’évoquer Gaudi3, le prochain accélérateur IA attendu l’an prochain.
Le composant IA Gaudi 3 d’Intel se montre pour la première fois
Composant conçu pour « l’apprentissage profond et les modèles d’IA génératifs à grande échelle », Gaudi3 a été brièvement montré pour la première fois lors d’un événement officiel.
Il s’agit surtout ici de montrer que la firme reste au contact du marché et il ne faudra pas trop espérer en savoir plus pour le moment, sinon qu’il sera forcément plus performant que l’actuelle plate-forme Gaudi2.
Capter une partie du marché des composants IA
Elle semble comporter un plus grand nombre de modules de mémoire rapide HBM3 ou HBM3E et offrirait quatre fois plus de performance en précision BF16 que Gaudi2, avec des capacités réseau doublées et une bande passante 50% supérieure.
Gaudi2 montre déjà de jolies performances le rapprochant de celles de la référence Nvidia H100 sur certains aspects et Gaudi3 devrait donc poursuivre cette tendance pour répondre aux besoins de modèles d’IA toujours plus vastes.
En 2024, le produit d’Intel devrait toutefois croiser sur sa route les premiers GPU B100 ou GB100 Blackwell de Nvidia avec gravure affinée (on parle de 3 nm chez TSMC) qui devraient pousser les performances encore plus haut.
Comme AMD, Intel ne cherchera sans doute pas dans un premier temps à conquérir le marché mais plutôt à s’y implanter solidement et gagner des parts de marché pour assurer la pérennité de ses solutions et la constitution d’un écosystème sur lequel prospérer.