L’IA manque de puissance de calcul, pour IBM la réponse réside dans les puces

Gros plan sur la puce de l’unité d’intelligence artificielle d’IBM. Image : IBM

Le battage médiatique laisse entendre que l’intelligence artificielle (IA) est déjà partout, mais en réalité, la technologie qui la sous-tend est encore en développement. De nombreuses applications d’IA sont alimentées par des puces qui n’ont pas été conçues pour l’IA. Au lieu de cela, elles s’appuient sur des CPU et des GPU polyvalents créés pour les jeux vidéo. Cette inadéquation a entraîné une vague d’investissements – de la part de géants de la technologie tels qu’IBM, Intel et Google, ainsi que de start-ups et de sociétés de capital-risque – dans la réalisation de nouvelles puces expressément conçues pour les charges de travail de l’IA.

À mesure que la technologie s’améliore, les investissements des entreprises suivront sûrement. Selon Gartner, les revenus des puces d’IA ont totalisé plus de 34 milliards de dollars en 2021 et devraient atteindre 86 milliards de dollars en 2026. En outre, selon le cabinet d’études, moins de 3 % des serveurs de centres de données en 2020 comprenaient des accélérateurs de charge de travail, alors que plus de 15 % devraient en faire autant d’ici 2026.

IBM Research, pour sa part, vient de dévoiler l’Artificial Intelligence Unit (AIU), un prototype de puce spécialisée dans l’IA.

« Nous sommes en train de manquer de puissance de calcul. Les modèles d’IA connaissent une croissance exponentielle, mais le matériel nécessaire pour former ces mastodontes et les faire fonctionner sur des serveurs dans le cloud ou sur des appareils périphériques comme les smartphones et les capteurs n’a pas progressé aussi rapidement », a déclaré IBM.

Exécuter des modèles de deep learning

L’AIU est le premier SoC de l’IBM Research AI Hardware Center conçu expressément pour exécuter des modèles de deep learning d’IA d’entreprise.

IBM fait valoir que le « cheval de bataille de l’informatique traditionnelle », autrement dit le CPU, a été conçu avant l’arrivée du deep learning. Si les CPU conviennent bien aux applications générales, ils ne sont pas aussi performants pour former et exécuter des modèles de deep learning qui nécessitent des opérations d’IA massivement parallèles.

« Il ne fait aucun doute dans notre esprit que l’IA va être un moteur fondamental des solutions informatiques pendant très, très longtemps », a déclaré à ZDNET Jeff Burns, directeur de AI Compute pour IBM Research. « Elle va être infusée dans le paysage informatique, dans ces infrastructures et solutions informatiques d’entreprise compliquées, de manière très large et diffuse. »

Pour IBM, il est plus judicieux de construire des solutions complètes qui sont effectivement universelles, selon Jeff Burns, « afin que nous puissions intégrer ces capacités dans différentes plateformes de calcul et prendre en charge une très, très grande variété d’exigences d’IA d’entreprise. »

Economiser les ressources

L’AIU est un circuit intégré spécifique à une application (ASIC), mais il peut être programmé pour exécuter tout type de tâche de deep learning. La puce comporte 32 cœurs de traitement construits avec la technologie 5 nm et contient 23 milliards de transistors. La disposition est plus simple que celle d’un processeur, conçue pour envoyer les données directement d’un moteur de calcul à l’autre, ce qui la rend plus économe en énergie. Elle est conçue pour être aussi facile à utiliser qu’une carte graphique et peut être branchée sur n’importe quel ordinateur ou serveur doté d’un emplacement PCIe.

Pour économiser l’énergie et les ressources, l’AIU utilise le calcul approximatif, une technique développée par IBM pour troquer la précision des calculs contre l’efficacité. Traditionnellement, le calcul s’appuie sur une arithmétique à virgule flottante de 64 et 32 bits, qui offre un niveau de précision utile pour la finance, les calculs scientifiques et d’autres applications où la précision du détail est importante. Toutefois, ce niveau de précision n’est pas vraiment nécessaire pour la grande majorité des applications d’IA.

« Si vous pensez à tracer la trajectoire d’un véhicule de conduite autonome, il n’y a pas de position exacte dans la voie où la voiture doit se trouver », explique Jeff Burns. « Il y a une gamme d’endroits dans la voie ».

Les réseaux neuronaux sont fondamentalement inexacts – ils produisent une sortie avec une probabilité. Par exemple, un programme de vision artificielle peut vous dire avec 98 % de certitude que vous regardez la photo d’un chat. Malgré cela, les réseaux neuronaux étaient initialement formés avec une arithmétique de haute précision, ce qui consommait beaucoup d’énergie et de temps.

Verticales

La technique de calcul approximatif de l’AIU lui permet de passer d’une arithmétique à virgule flottante de 32 bits à des formats de bits contenant un quart de la quantité d’informations.

Pour que la puce soit véritablement universelle, IBM ne s’est pas contentée d’innovations matérielles. IBM Research a mis l’accent sur les modèles de base, avec une équipe de 400 à 500 personnes travaillant sur ces modèles. Contrairement aux modèles d’IA qui sont conçus pour une tâche spécifique, les modèles de base sont formés sur un large ensemble de données non étiquetées, créant ainsi une ressource semblable à une gigantesque base de données. Ensuite, lorsque vous avez besoin d’un modèle pour une tâche spécifique, vous pouvez ré-entraîner le modèle de base en utilisant une quantité relativement faible de données étiquetées.

Grâce à cette approche, IBM entend s’attaquer à différents secteurs verticaux et à différents cas d’utilisation de l’IA. Il y a une poignée de domaines pour lesquels la société construit des modèles de base – ces cas d’utilisation couvrent des domaines tels que la chimie et les données de séries chronologiques. Les données chronologiques, qui désignent simplement les données recueillies à intervalles réguliers, sont essentielles pour les entreprises industrielles qui doivent observer le fonctionnement de leurs équipements. Après avoir construit des modèles de base pour une poignée de domaines clés, IBM peut développer des offres plus spécifiques, axées sur des secteurs verticaux. L’équipe a également veillé à ce que le logiciel de l’AIU soit totalement compatible avec la pile logicielle de Red Hat, propriété d’IBM.

Source : ZDNet.com

Source link

Exécuter des modèles de deep learning

Economiser les ressources

Verticales

Laisser un commentaire Annuler la réponse