Red Hat, le géant du logiciel libre détenu par IBM, a finalisé son acquisition de Neural Magic, une startup qui œuvre dans l’optimisation de l’intelligence artificielle (IA). Initialement annoncée en novembre 2024, la transaction a été finalisée le 13 janvier 2025, marquant une étape importante dans la stratégie de Red Hat visant à améliorer ses capacités en matière d’IA dans les environnements de cloud hybride.
Bien que le prix n’ait pas été divulgué, Neural Magic avait déjà levé 50 millions de dollars en capital-risque auprès de divers investisseurs. Nous pouvons donc supposer sans risque que l’accord n’a pas été conclu pour des cacahuètes. Surtout que le PDG de Neural Magic avant la conclusion de l’accord était Brian Stevens, l’ancien directeur technique et vice-président exécutif de Red Hat.
Stevens a déclaré : « Chez Neural Magic, notre vision est que l’avenir de l’IA est ouvert. Les modèles, les algorithmes d’optimisation et les systèmes d’inférence open-source sont au cœur de cette démarche. Cela permet aux entreprises de posséder leurs propres modèles d’IA, de les personnaliser en fonction de leurs données et de les déployer sur leur infrastructure privée multifournisseur – cloud, centre de données ou edge computing ».
Permettre aux modèles d’IA complexes de s’exécuter sur du matériel de base, y compris des CPU et des GPU standard
Neural Magic, une spin-off du MIT fondée en 2018, a développé des logiciels et des algorithmes innovants qui accélèrent les charges de travail d’inférence d’IA générative.
La technologie de l’entreprise permet aux modèles d’IA complexes de s’exécuter sur du matériel de base, y compris des CPU et des GPU standard, réduisant le besoin d’accélérateurs d’IA spécialisés et coûteux.
Que signifie cette capacité ? Neural Magic apporte plusieurs technologies clés à Red Hat par le biais de l’acquisition :
- Expertise vLLM : Neural Magic est l’un des principaux contributeurs à vLLM, un projet open-source pour l’utilisation efficace de grands modèles de langage (LLM). vLLM est déjà le moteur d’inférence de Red Hat Enterprise Linux (RHEL) AI et de Red Hat OpenShift AI.
- DeepSparse : Un moteur d’exécution d’inférence qui offre des performances de classe GPU sur des CPU de base grâce à des algorithmes qui réduisent les besoins en calcul et en mémoire pour l’exécution des réseaux neuronaux. Outre les LLM, DeepSparse est également utile pour la vision artificielle (CV) et le traitement du langage naturel (NLP).
- SparseZoo : Si vous utilisez DeepSparse, Neural Magic fournit déjà un référentiel de modèles CV, NLP et LLM pré-optimisés.
- Techniques de compression de modèles : Neural Magic a développé des méthodes de quantification et de sparsification des modèles, qui permettent de réduire considérablement la taille des modèles et les besoins de calcul, sans perte substantielle de précision.
- Optimisation multiplateforme : La technologie de Neural Magic permet d’optimiser les modèles d’IA pour les déployer dans les environnements de cloud, de centre de données et de edge computing.
De l’IA dans votre cloud hybride
Ces technologies s’alignent sur la vision de Red Hat qui consiste à rendre les charges de travail d’IA plus accessibles, efficaces et déployables dans des environnements de cloud hybride.
De quoi réduire le besoin de matériel d’IA spécialisé et coûteux dans les cloud. En bref, la technologie de Neural Magic permet à ses utilisateurs de faire de l’IA à moindre coût. Il s’agit également, au cœur de vLLM, d’une approche de l’IA open source.
Pour Red Hat, comme l’a déclaré Matt Hicks, PDG de l’entreprise, dans un communiqué : « Nous sommes ravis de compléter notre portefeuille d’IA axé sur les cloud hybrides avec l’innovation de Neural Magic en matière d’IA. Nous voulons être non seulement le ‘Red Hat’ de l’open source, mais aussi le ‘Red Hat’ de l’IA ».
Améliorer l’efficacité des charges de travail d’IA sur RHEL AI, OpenShift AI et InstructLab
D’un point de vue stratégique, Red Hat espère que son acquisition de Neural Magic renforcera sa position dans sa capacité à déployer des charges de travail d’IA dans divers environnements informatiques, des centres de données sur site aux clouds publics. Et à améliorer l’efficacité des charges de travail d’IA déjà exécutées sur RHEL AI, OpenShift AI et InstructLab, un projet communautaire open-source de Red Hat. Et IBM AI visant à améliorer les IBM Granite LLMs sous licence open-source.
Cette approche fonctionnera-t-elle ? Dave McCarthy, vice-président de la recherche sur les services Cloud et Edge chez IDC, le pense.
« L’acquisition de Neural Magic par Red Hat est une amélioration stratégique de ses capacités d’IA, facilitant le déploiement de l’IA dans les cloud hybrides en tirant parti de l’expertise de Neural Magic en matière d’optimisation des modèles et d’accélération de l’inférence. »