Jeudi 22 mai, Google et Salesforce tenaient leurs conférences annuelles. L’occasion pour les géants américains de couvrir largement la thématique de l’IA agentique. Durant le Google Cloud Summit, le californien est ainsi revenu sur ses dernières annonces dans ce domaine avec des agents prêts à l’emploi et sa couche d’orchestration Agentspace.
Mistral AI, à l’image du reste du marché de l’IA générative, se positionne lui aussi sur le segment très hype des agents. Avec Devstral, la startup tricolore dispose donc désormais de son premier LLM agentique.
Codestral et Devstral sur le coding
Pour ses débuts, la licorne opte pour le développement logiciel avancé. Elle était déjà présente sur ce domaine d’application de l’IA depuis le lancement il y a un an de son modèle Codestral. Concurrent notamment de Gemini Code Assist et Github Copilot, Codestral est un LLM spécialisé dans le code logiciel.
Devstral apparaît donc comme un complément dans le portefeuille de Mistral AI. Selon Mistral, l’agent est une réponse aux limitations des LLM classiques en matière d’ingénierie logicielle. Les modèles traditionnels sont adaptés à “l’écriture de fonctions autonomes ou la complétion de code”.
En revanche, justifie la startup, “ils peinent actuellement à résoudre les problèmes de génie logiciel du monde réel.” La solution passe d’après elle par la contextualisation du code au sein d’une vaste base de code.
L’agentique pour les tâches plus complexes
Un LLM performant doit aussi pouvoir “identifier les relations entre des composants disparates” ainsi que des “bugs subtils dans des fonctions complexes.” Vous l’aurez compris, c’est justement ces capacités que fournit Devstral.
Et si avec Medium 3, annoncé tout récemment, Mistral AI renonçait à l’open source, il y revient cette fois avec Devstral. Le LLM agentique est ainsi distribué sous licence Apache 2.0, soit donc bien en open source.
Du côté des performances, et sans grande surprise, la startup française souligne ses résultats face à une sélection de concurrents, notamment open source. “Devstral dépasse des modèles beaucoup plus grands tels que Deepseek-V3-0324 (671B) et Qwen3 232B-A22B.”
Un modèle agentique plus grand à venir
En comparaison d’alternatives propriétaires comme GPT-4.1-mini, Mistral revendique également “des performances nettement supérieures”. Devstral surclasserait ainsi le récent modèle de son concurrent OpenAI de plus de 20%.
Devstral reste cependant au stade de la préversion de recherche.
Mistral AI fait savoir qu’il travaille “d’arrache-pied à la construction d’un modèle de codage agentique plus grand qui sera disponible dans les semaines à venir.”