Nvidia annonce son premier supercalculateur exascale pour dominer le monde des IA

Nvidia annonce son premier supercalculateur exascale pour dominer le monde des IA


Taillé pour les LLM comme ChatGPT, le DGX GH200 est un monstre dont tous les composants clés – CPU, GPU mais aussi les puces réseaux – sont conçues par Nvidia. Et promettent de donner un énorme boost de puissance aux IA génératives.

Un monstre de puissance et d’efficacité énergétique : c’est ce que promet Nvidia pour son premier supercalculateur qu’elle a annoncé au Computex de Taipei. Une machine appelée DGX GH200 et qui promet d’atteindre la puissance dite exascale pour seulement une fraction de la consommation énergétique des machines concurrentes en x86… Et à une vitesse promise sans pareille. Présentée en grande pompe par le fondateur et PDG de Nvidia, le truculent Jensen Huang, cette machine est une concrétisation pour Nvidia.

© Adrian BRANCO / 01net.com

Archi-leader dans le domaine du calcul sur GPU, Nvidia est un nain côté processeur. Si le californien a bien un savoir-faire connu en matière de CPU, on le connaît surtout au travers de ses processeurs Tegra. Des SoC qu’on a déjà rencontré dans des PC Windows 8 ou encore la célèbre Nintento Switch. La puce que Nvidia a développé pour les centres de données et ici son supercalculateur est cependant d’une toute autre magnitude de puissance. La puce principale appelée Grace Hopper Superchip est en fait un duo : d’un côté la puce « Grace », un CPU 72 cœurs ARM Neoverse V2 et, en face de lui, un GPU « Hopper » H100. Les deux profitent de 96 Go de mémoire ultra-rapide HBM3 (GPU) et 512 Go de LPDDR5X (CPU).

Le CPU comme le GPU sont tous les deux fabriqués à Taïwan par TSMC. © Adrian BRANCO / 01net.com

Prenez 256 de ces cartes GH200 combinant CPU, GPU et RAM et vous vous retrouvez avec autant de GPU, 18432 cœurs CPU ARM et 144 To de mémoire DDR5 partagée. La force de cet ensemble qui forme le DGX GH200 tenant dans le fait que Nvidia est devenu un champion de la mise en réseau à haute vitesse.

Un supercalculateur qui fonctionne comme un seul GPU

© Adrian BRANCO / 01net.com

Depuis le rachat de Mellanox en 2019 (aux nez et à la barbe d’Intel qui voulait, lui aussi, racheter ce fleuron israélien), Nvidia a dans sa manche des produits réseaux ultraperformants taillés pour les supercalculateurs. Sans trop rentrer dans les détails, ces 256 cartes GH200 combinant CPU, GPU et mémoires sont pilotées et interconnectées par des puces réseaux spécialisées (des DPU appelées BlueField-3 et des adaptateurs réseau ConnectX-7). D’une part, le CPU et le GPU « parlent » entre eux deux à très grande vitesse avec une technologie appelée NVLink-C2C (oui, il y a plein de noms et d’acronymes !) qui leur permet d’échanger des données à 900 Go/s (oui, vous avez bien lu). Mais surtout, les autres puces réseaux permettent un échange de données sans pertes, là encore à très haute vitesse.

Lire aussi : Nvidia dévoile Grace, son premier processeur ARM, taillé pour l’intelligence artificielle (avril 2021)

Sur scène, le patron de Nvidia, Jensen Huang, explique que son mastodonte dispose de nombreuses forces (logique, il est là pour vendre). Dont une qui est, dans les faits, assez exceptionnelle : ce supercalculateur tout entier se pilote comme un seul accélérateur. Une prouesse, quand on sait que la distribution des informations et les différents goulets d’étranglements que sont les nœuds réseaux, sont les principaux freins à la pleine exploitation de la puissance brute des puces. Le bénéfice étant ici que les développeurs n’ont rien à faire de spécial : pas d’adaptation de code pour le distribuer de manière efficace. Ce titan se programme et fonctionne comme un unique GPU. Et déploie une puissance affolante.

© Adrian BRANCO / 01net.com

Si on sait bien que les marques communiquent toujours sur les mesures de performances qui les arrangent (on appelle ça le « cherry picking » dans le jargon anglophone), certains graphs de Nvidia donnent le tournis. Ce monstre de 256 Grace Hopper Superchips envoie 1 ExaFLOPS de puissance de calcul et s’avère jusqu’à x244 plus puissant dans certains usages que des appareils équivalents. Le diable étant dans les détails, il faut détailler un peu ce que sont ces « certains usages ».

Une bête taillée pour l’IA

Le DGX GH200 a suffisamment de jus pour faire bien des calculs mais aves ses unités dites « transformers » c’est surtout un king de l’exécution des IA et plus particulièrement des Large Language Models. Ces fameux LLM dont le plus célèbre est le déjà incontournable ChatGPT. Dans ce domaine, son très grand nombre de cœurs et sa capacité à gérer un énorme pool de mémoire semblent être des avantages critiques face à la concurrence… Dans ce domaine. Il reste encore à voir comment se comporte la machine dans d’autres domaines comme le calcul scientifique pour pouvoir le comparer à ce que peuvent proposer Intel ou AMD.

Déjà ultra-dominant dans le domaine des GPU pour les tâches techniques et scientifiques « classiques », Nvidia, qui vendait déjà ses produits à la pelle, semble désormais seul dans le monde des IA dites génératives. Alors que tous les industriels du domaine se jetaient déjà sur ses GPU, le DGX GH200 semble avoir les armes d’enterrer la concurrence (dans ce domaine) avant même qu’elle ne soit partie. Google Cloud, Meta et Microsoft seront ainsi les premiers clients de ce supercalculateur qui sera ensuite vendu aux autres. Et le patron de Nvidia a même annoncé que l’entreprise allait se doter elle-même de son propre bébé pour continuer de le peaufiner. Et le rendre plus redoutable au fil du temps.

Nvidia maîtrise tout et sa valeur explose

© Adrian BRANCO / 01net.com

Le DGX GH200 a ceci d’impressionnant que Nvidia maîtrise tous les composants importants. À savoir le CPU, le GPU mais aussi le processeur réseau. Alors qu’Intel arrive à peine sur le marché des GPU professionnels (avec Ponte Vecchio) et qu’AMD a pour l’heure du mal à imposer ses solutions face à Nvidia, la marque au logo vert conçoit tous les maillons de chaîne pour son supercalculateur. Ce qui est une petite revanche pour l’entreprise qui ne dispose pas de licence x86 et ne pouvait, jusqu’à présent, pas lutter face à Intel et AMD (et IBM dans certaines applications où l’architecture Power brille encore).

Son bébé de 40 tonnes, comptant 240 km de câbles de fibre optique ou encore 2112 ventilateurs de 60 mm devrait rentrer en service dans l’année. Et si les résultats sont au rendez-vous et que la vague IA se renforce (mais comment parier le contraire), l’entreprise qui pèse désormais plus de 1000 milliards de dollars en bourse pourrait continuer d’exploser. Pour, qui sait, rejoindre le club très sélect des entreprises à plus de 2000 milliards. Pas mal pour une entreprise qui a fait son succès initial en vendant des cartes graphiques 3D aux joueurs PC !



Source link

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.