Les intelligences artificielles agentiques sont la nouvelle marotte du secteur et Hugging Face ne veut pas rester à la traîne La société franco américaine spécialisée dans l’intelligence artificielle a donc présenté cette semaine sa démonstration d’Open Computer Agent, un service hébergé dans le cloud qui permet d’interagir avec une machine virtuelle sous Linux au travers d’un LLM. Les utilisateurs peuvent demander à l’agent d’effectuer des tâches simples, comme rechercher certaines informations sur le web.
Interactions écrites
Si la machine est utilisable normalement, l’intérêt de l’expérience est de donner des consignes sous forme textuelle et de le voir réaliser les tâches de façon autonome pour parvenir au résultat demandé. Open Computer Agent peut utiliser un ordinateur virtuel fonctionnant sur Linux et qui embarque plusieurs applications comme Firefox.
OpenAI avait présenté au début du mois de janvier un outil similaire, OpenAI Operator, qui permet lui aussi d’interagir avec un modèle de langage pour réaliser certaines tâches via un navigateur internet. La démonstration gratuite de Hugging Face ne rivalise pas vraiment avec l’Operator d’OpenAI mais montre des technologies similaires.
Comme le relève TechCrunch et plusieurs autres testeurs, Open Computer Agent souffre de nombreuses limites : le système est très lent à réagir, et rencontre parfois des difficultés à résoudre les captchas présentés par certains services en ligne. Et on comprend vite qu’il est de toute façon beaucoup plus lent d’interagir avec un système informatique en lui parlant en langage naturel plutôt qu’en utilisant des instructions codées ou une interface graphique classique clavier/souris.
Pour la démonstration et l’open source
Mais il s’agit ici d’une preuve de concept avant tout : Open Computer Agent a été construit uniquement avec des technologies open source proposées sur la plateforme Hugging Face. Le modèle de langage utilisé pour permettre à l’agent de comprendre les instructions est issu de la famille Qwen, développée par les équipes d’Alibaba Cloud.
L’outil s’appuie également sur la librairie Smolagents, une bibliothèque logicielle développée par les équipes de Hugging Face et dévoilée en fin d’année 2024. Smolagents permet aux modèles de langage d’interagir avec certains programmes et de prendre des actions en fonction des consignes reçues ou des informations obtenues. Et enfin la machine virtuelle utilisée fonctionne grâce au projet E2B Desktop Sandbox, un projet de machine virtuelle sous Linux spécialement conçu pour être utilisé au travers d’un LLM
Enjeux de transparence
Les outils d’intelligence artificielles « agentiques », c’est à dire capable d’interagir avec une plus ou moins grande autonomie et de réaliser des actions, se développent chez les différents acteurs du secteur : on peut citer OpenAI ou encore GoogleCloud, qui a récemment présenté une gamme d’IA agentiques à disposition de ses clients.
Comme le reste du secteur, ces solutions font miroiter des gains de productivités, mais posent aussi de nombreuses questions, comme celle de savoir qui portera la responsabilité en cas d’erreur ou d’incident provoqué par une intelligence artificielle. Sur ce sujet, les éditeurs de solution open source, qui permettent une plus grande transparence sur le fonctionnement des modèles et leurs raisonnements, ont une carte à jouer face aux entreprises qui s’appuient sur des solutions propriétaires.