Red Hat et l’intelligence artificielle open source : le pragmatis …

Red Hat et l'intelligence artificielle open source : le pragmatis ...



L’IA open source est en train de changer tout ce que l’on pensait savoir sur l’intelligence artificielle. Pour s’en convaincre, il suffit de regarder DeepSeek, le programme open source chinois qui a fait exploser les portes financières du secteur de l’IA. Red Hat, leader mondial sur Linux, comprend mieux que quiconque la puissance de l’open source et de l’IA.

L’approche pragmatique de l’entreprise en matière d’IA open source reflète son engagement de plusieurs décennies tout en s’attaquant aux complexités des systèmes d’IA modernes. Au lieu de poursuivre les rêves d’intelligence artificielle générale (AGI), Red Hat cherche un point d’équilibre entre les besoins pratiques des entreprises et ce que l’IA peut offrir aujourd’hui.

Une tension sur l’opacité des données

Dans le même temps, Red Hat reconnaît l’ambiguïté qui entoure « l’IA open source ». Lors du Linux Foundation Members Summit en novembre 2024, Richard Fontana, principal conseiller commercial de Red Hat, a souligné que si les logiciels open source traditionnels s’appuient sur un code source accessible, l’IA présente des défis liés à l’opacité des données d’entraînement et des pondérations de modèles.

Au cours d’une table ronde, Richard Fontana a déclaré : « Quel est l’analogie [avec le code source] pour l’IA ? Ce n’est pas clair. Certaines personnes pensent que les données d’entraînement doivent être ouvertes, mais c’est très peu pratique pour les LLM [grands modèles de langage]. Cela suggère que l’IA open source peut être un objectif utopique à ce stade. »

Cette tension est évidente dans les modèles publiés sous des licences restrictives mais étiquetées « open source ». Parmi ces faux programmes open source, on trouve LLama de Meta. Une tendance que Richard Fontana critique, soulignant que de nombreuses licences discriminent certains domaines d’activité ou groupes tout en revendiquant l’ouverture.

Concilier transparence et concurrence

L’un des principaux défis consiste à concilier la transparence avec les réalités concurrentielles et juridiques. Alors que Red Hat prône l’ouverture, Fontana met en garde contre les définitions rigides exigeant la divulgation complète des données de formation : la divulgation de données de formation détaillées risque de cibler les créateurs de modèles dans l’environnement litigieux actuel. L’utilisation équitable des données accessibles au public complique les attentes en matière de transparence.

Le CTO de Red Hat, Chris Wright, met l’accent sur les étapes pragmatiques vers la reproductibilité, en préconisant des modèles ouverts comme Granite LLM et des outils comme InstructLab, qui permettent un réglage fin piloté par la communauté. Wright écrit : « InstructLab permet à quiconque d’apporter des compétences aux modèles, ce qui rend l’IA véritablement collaborative. C’est ainsi que l’open source a gagné dans le domaine des logiciels et maintenant nous le faisons pour l’IA. »

Pour Chris Wright, cela s’apparente à une évolution de l’héritage Linux de Red Hat : « Tout comme Linux a standardisé l’infrastructure informatique, RHEL AI fournit une base pour l’IA d’entreprise ouverte, flexible et hybride par conception. »

Un développement inspiré de l’esprit collaboratif

Red Hat envisage un développement de l’IA qui reflète l’esprit collaboratif des logiciels open source. « Les modèles doivent être des artefacts open source. Le partage des connaissances est la mission de Red Hat. C’est ainsi que nous évitons la dépendance vis-à-vis d’un fournisseur et que nous garantissons que l’IA profite à tous », estime Chris Wright.

Mais cela ne sera pas facile. Chris Wright admet que « l’IA, en particulier les grands modèles de langage qui pilotent l’IA générative, ne peuvent pas être considérés de la même manière que les logiciels open source. Contrairement aux logiciels, les modèles d’IA se composent principalement de pondérations de modèle, qui sont des paramètres numériques qui déterminent la manière dont un modèle traite les entrées, ainsi que les connexions qu’il établit entre différents points de données. Les pondérations de modèle sont le résultat d’un processus intensif impliquant de vastes quantités de données d’entraînement qui sont soigneusement préparées, mélangées et traitées. »

Bien que les modèles ne soient pas des logiciels, Wright poursuit :

« À certains égards, ils remplissent une fonction similaire à celle du code. Il est facile de comparer les données au code source du modèle, ou à des données analogues à celui-ci. Les données d’entraînement seules ne remplissent pas ce rôle. La majorité des améliorations et des perfectionnements apportés aux modèles d’IA actuellement en cours dans la communauté n’impliquent pas l’accès ou la manipulation des données d’entraînement d’origine. Elles sont plutôt le résultat de modifications des pondérations du modèle ou d’un processus de réglage fin, qui peut également servir à ajuster les performances du modèle. La liberté d’apporter ces améliorations au modèle exige que les pondérations soient publiées avec toutes les autorisations que les utilisateurs reçoivent dans le cadre des licences open source. »

Cependant, Richard Fontana met en garde contre toute exagération dans la définition de l’ouverture, en prônant des normes minimales plutôt que des idéaux utopiques. « La définition de l’open source (OSD) a fonctionné parce qu’elle a fixé un plancher, et non un plafond. Les définitions de l’IA devraient d’abord se concentrer sur la clarté des licences, et non sur la charge des développeurs avec des mandats de transparence peu pratiques. »

Éviter une approche idéologique

Cette approche est similaire à celle de l’Open Source AI Definition (OSAID) 1.0 de l’Open Source Initiative (OSI), mais ce n’est pas la même chose. Si la Fondation Mozilla, la Fondation OpenInfra, Bloomberg Engineering et SUSE ont approuvé l’OSAID, Red Hat n’a pas encore donné sa bénédiction au document. « Notre point de vue à ce jour est simplement notre point de vue sur ce qui rend l’IA open source réalisable et accessible au plus grand nombre de communautés, d’organisations et de fournisseurs », détaille Chris Wright. Il conclut : « L’avenir de l’IA est ouvert, mais c’est un cheminement. Nous nous attaquons à la transparence, à la durabilité et à la confiance, un projet open source à la fois. »

L’approche prudente de Richard Fontana fonde cette vision, selon laquelle l’IA open source doit respecter les réalités concurrentielles et juridiques. La communauté doit affiner les définitions progressivement, et non imposer des idéaux à une technologie immature.

L’OSI, tout en se concentrant sur une définition, est d’accord. OSAID 1.0 n’est que la première version imparfaite. Le groupe planche déjà sur une autre version. En attendant, Red Hat poursuivra son travail visant à façonner l’avenir ouvert de l’IA en établissant des ponts entre les communautés de développeurs et les entreprises tout en naviguant dans l’éthique épineuse de la transparence de l’IA.



Source link

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.