A côté des processeurs et des cartes graphiques, le groupe Intel veut aussi compter dans les accélérateurs IA, de plus en plus demandés avec l’essor des IA génératives.
La firme développe depuis plusieurs années une gamme Gaudi conçue par Habana Labs et la nouvelle génération Gaudi 3 annoncée en décembre 2023 offre désormais des qualités de nature à concurrencer la référence du marché : l’accélérateur IA Nvidia H100.
Plusieurs raisons peuvent expliquer l’intérêt d’Intel pour les accélérateurs IA : de nouveaux débouchés pour Intel alors que d’autres secteurs sont malmenés, le fait que Nvidia ne pourra pas répondre à la totalité de la demande et laisse ainsi de l’espace pour d’autres acteurs (AMD est aussi sur le coup avec ses accélérateurs Instinct MI300) ou la volonté de démontrer son savoir-faire dans ce domaine porteur.
Gaudi 3 vs H100
Après avoir évoqué Gaudi 3 et affiché sa confiance dans sa capacité à rivaliser avec les meilleurs produits du marché, Intel en a détaillé les caractéristiques lors de son événement Vision 2024.
L’accélérateur IA s’appuie donc sur une gravure en 5 nm chez TSMC avec 128 Go de mémoire rapide HBM2e assurant une bande passante de 3,7 To/s et il revendique une puissance de traitement de 1835 TFLOPS en précision FP8, le tout avec une consommation de 900W.
Sans surprise, Intel met l’accélérateur IA Gaudi 3 en confrontation directe avec le module H100 de Nvidia et annonce que son produit est 1,7 fois plus rapide sur l’entraînement IA et 50% plus performant sur l’inférence.
Ya-t-il de la place pour un nouvel acteur ?
Le groupe met également en avant les gains en matière d’efficacité énergétique qui seraient de 40% à l’avantage de Gaudi 3, ce qui reste un point sensible alors que les datacenters IA sont de problématiques gouffres énergétiques. Intel proposera d’ailleurs des versions de son accélérateur IA utilisant un refroidissement liquide.
Les accélérateurs IA Gaudi 3 d’Intel seront disponibles sous forme d’échantillons durant le premier semestre 2024 tandis que la production de masse sera lancée sur la deuxième moitié de l’année. Reste maintenant à convaincre les entreprises de choisir cette solution plutôt que les H100, par dépit faute de pouvoir y accéder ou pour disposer d’un fournisseur alternatif, ce qui réussit déjà plutôt bien à AMD.