Selon CNBC, Amazon Web Services (AWS) annoncera une mise à jour de son processeur (CPU) pour serveurs, Graviton 4, dans le courant du mois.
Cette évolution inclura une bande passante réseau de 600 gigabits par seconde (Gbit/s). Il s’agit du débit le plus élevé parmi les services cloud publics, qu’AWS compare à la lecture de 100 CD en une seconde.
Graviton 4 est une puce conçue par Annapurna Labs, la filiale d’AWS spécialisée dans la conception de semi-conducteurs, qui rivalise avec les processeurs d’Intel et d’AMD. Mais la véritable concurrence est celle de Nvidia, qui domine le marché des infrastructures d’IA.
Jouer sur le rapport prix-performance pour contrer Nvidia
À la fin de l’année dernière, AWS a dévoilé Project Rainier, un superordinateur d’IA pour son partenaire Anthropic. AWS a investi 8 milliards de dollars dans cette entreprise, et le projet comprend plus de 500 000 puces Trainium2 pour l’entraînement à l’IA.
« L’objectif est de réduire le coût de l’entraînement à l’IA et de fournir une alternative aux GPU Nvidia », a déclaré Gadi Hutt, directeur principal de l’ingénierie client et produit chez AWS. « Bien que Trainium2 soit encore inférieur à Nvidia Blackwell en termes de performances absolues, il est compétitif en termes de rapport prix/performances. »
« Trainium3 sera disponible cette année et permettra de doubler les performances et de réduire la consommation d’énergie de 50 % supplémentaires », promet AWS.
Avec Graviton, AWS concrétise sa stratégie visant à construire toutes les couches de l’infrastructure d’IA, du réseau à l’apprentissage en passant par l’inférence, avec sa propre technologie.
La demande dépasse l’offre. « Nous disposons de très grandes quantités de puces, mais la demande des clients est liée à tous nos services », a déclaré Rami Sino, directeur de l’ingénierie chez Anapurna Labs.