Il y a de fortes chances que, à moins que vous ne soyez déjà plongé dans la programmation de l’IA, vous n’ayez jamais entendu parler de Model Context Protocol (MCP). Mais, croyez-moi, vous en entendrez parler.
Le MCP s’impose rapidement comme une norme fondamentale pour la prochaine génération d’applications alimentées par l’IA. Développé en tant que norme ouverte par Anthropic fin 2024, MCP est conçu pour résoudre un problème central dans l’écosystème de l’IA : Comment connecter de manière transparente et sécurisée de grands modèles de langage (LLM) et des agents d’IA au vaste paysage en constante évolution des données, des outils et des services du monde réel.
La société d’IA Anthropic explique qu’au fur et à mesure que les assistants d’IA et les LLM qui les sous-tendent s’améliorent, « même les modèles les plus sophistiqués sont limités par leur isolement par rapport aux données – piégés derrière des silos d’information et des systèmes hérités. Chaque nouvelle source de données nécessite sa propre implémentation personnalisée, ce qui rend les systèmes réellement connectés difficiles à mettre à l’échelle ».
MCP est la réponse d’Anthropic
MCP est la réponse d’Anthropic. L’entreprise affirme qu’elle fournira un « standard universel et ouvert pour connecter les systèmes d’IA aux sources de données, en remplaçant les intégrations fragmentées par un protocole unique ».
C’est bien beau. Mais de nombreuses entreprises ont prétendu que leur norme universelle serait la réponse à tous vos problèmes technologiques. Cependant, comme le souligne XKCD, si vous avez 14 normes différentes et que vous essayez ensuite de fournir une norme unique pour résoudre les problèmes de tout le monde, vous aurez au final 15 normes différentes.
Ce n’est pas si grave, nous avons déjà des protocoles d’intégration pour l’IA, les programmes et les interfaces de programmation d’applications (API). Pour l’instant, les autres rivaux importants des MCP sont le protocole Agent-to-Agent (A2A) de Google, les outils d’automatisation du flux de travail tels que Zapier et Pica et, bien sûr, des API et de kits de développement logiciel (SDK) propres à chaque fournisseur. Cependant, je pense que MCP deviendra rapidement la norme d’interopérabilité de l’IA.
Entrons dans le vif du sujet.
Qu’est-ce que MCP ?
Je considère MCP comme un adaptateur universel de données d’IA. Comme le dit l’entreprise Aisera, vous pouvez considérer MCP comme un « port USB-C pour l’IA. Tout comme l’USB-C a normalisé la façon dont nous connectons les appareils, le MCP normalise la façon dont les modèles d’IA interagissent avec les systèmes externes. En d’autres termes, Jim Zemlin, directeur exécutif de la Fondation Linux, décrit MCP comme « une couche de communication fondamentale pour les systèmes d’IA, un peu comme HTTP pour le web ».
Plus précisément, MCP définit un protocole standard, basé sur JSON-RPC 2.0. Il permet aux applications d’intelligence artificielle d’invoquer des fonctions, de récupérer des données et d’utiliser des prompts à partir de n’importe quel outil, base de données ou service, par le biais d’une interface unique et sécurisée.
Pour ce faire, il suit une architecture client-serveur avec plusieurs composants clés. Ces composants sont les suivants
- Hôte: L’application alimentée par l’IA (par exemple, Claude Desktop, un environnement de développement intégré (IDE), un chatbot) qui a besoin d’accéder à des données externes.
- Client: Gère une connexion dédiée, avec état, à un seul serveur MCP, s’occupant de la communication et de la négociation des capacités.
- Serveur: Expose des capacités spécifiques – outils (fonctions), ressources (données) et invites – via le protocole MCP, en se connectant à des sources de données locales ou distantes.
- Protocole de base: La couche de messagerie standardisée (JSON-RPC 2.0) garantit que tous les composants communiquent de manière fiable et sécurisée.
Cette architecture transforme le « problème d’intégration M×N » (où M applications d’IA doivent se connecter à N outils, ce qui nécessite M×N connecteurs personnalisés) en un « problème M+N » beaucoup plus simple. Ainsi, chaque outil et application n’a besoin de prendre en charge MCP qu’une seule fois pour assurer l’interopérabilité. C’est un véritable gain de temps pour les développeurs.
Comment fonctionne MCP ?
Tout d’abord, lorsqu’une application d’intelligence artificielle démarre, elle lance des clients MCP, chacun se connectant à un serveur MCP différent. Ces derniers négocient les versions et les capacités du protocole. Une fois la connexion établie avec le client, l’application interroge le serveur pour connaître les outils, les ressources et les invites disponibles.
Une fois la connexion établie, le modèle d’IA peut accéder en temps réel aux données et aux fonctions du serveur, en mettant à jour son contexte de manière dynamique. Cela signifie que le MCP permet aux chatbots d’IA d’accéder aux données les plus récentes en temps réel au lieu de s’appuyer sur des ensembles de données pré-indexés, des embeddings ou des informations mises en cache dans un LLM.
Ainsi, lorsque vous demandez à l’IA d’effectuer une tâche (par exemple, « Quels sont les derniers prix pour un vol de Paris à Nice ? »), l’IA transmet la demande au serveur concerné par l’intermédiaire du client MCP. Le serveur exécute alors la fonction, renvoie le résultat et l’IA intègre ces nouvelles données dans votre réponse.
MCP permet aux modèles d’IA de découvrir et d’utiliser de nouveaux outils en cours d’exécution
En outre, MCP permet aux modèles d’IA de découvrir et d’utiliser de nouveaux outils en cours d’exécution. Cela signifie que vos agents d’intelligence artificielle peuvent s’adapter à de nouvelles tâches et à de nouveaux environnements sans avoir à modifier leur code ou à se recycler dans l’apprentissage automatique.
En bref, MCP remplace les intégrations fragmentées et personnalisées par un protocole unique et ouvert. Cela signifie que les développeurs n’ont besoin d’implémenter MCP qu’une seule fois pour connecter les modèles d’IA à n’importe quelle source de données ou outil conforme. Cela réduit considérablement la complexité de l’intégration et les frais de maintenance. La vie des développeurs s’en trouve grandement facilitée.
Pour rendre les choses encore plus simples, vous pouvez utiliser l’IA pour générer le code MCP et relever les défis de la mise en œuvre.
Les fonctionnalités de MCP
Voici ce que MCP offre :
- Intégration unifiée et standardisée: MCP sert de protocole universel, permettant aux développeurs de connecter leurs services, API et sources de données à n’importe quel client d’IA (comme les chatbots, les IDE ou les agents personnalisés) par le biais d’une interface unique et standardisée.
- Communication bidirectionnelle et interactions riches: MCP prend en charge la communication bidirectionnelle sécurisée et en temps réel entre les modèles d’IA et les systèmes externes, permettant non seulement la récupération de données, mais aussi l’invocation d’outils et l’exécution d’actions.
- Évolutivité et réutilisation de l’écosystème: Une fois que vous avez mis en œuvre MCP pour un service, celui-ci devient accessible à tout client d’IA conforme à MCP, ce qui favorise un écosystème de connecteurs réutilisables et accélère l’adoption.
- Cohérence et interopérabilité: MCP applique un format de requête/réponse JSON cohérent. Cela facilite le débogage, la maintenance et l’évolution des intégrations, quel que soit le service sous-jacent ou le modèle d’IA. Cela signifie également que les intégrations restent robustes même si vous changez de modèle ou si vous ajoutez de nouveaux outils.
- Sécurité et contrôle d’accès renforcés: MCP est conçu dans un souci de sécurité, prenant en charge le cryptage, les contrôles d’accès granulaires et l’approbation des utilisateurs pour les actions sensibles. Vous pouvez également héberger vous-même les serveurs MCP, ce qui vous permet de conserver vos données en interne.
- Réduction du temps de développement et de la maintenance : En évitant les intégrations fragmentées et ponctuelles, les développeurs gagnent du temps sur l’installation et la maintenance continue, ce qui leur permet de se concentrer sur la logique et l’innovation des applications de plus haut niveau. En outre, la séparation claire de MCP entre la logique de l’agent et les capacités du backend permet des bases de code plus modulaires et plus faciles à maintenir.
Qui a adopté MCP ?
La question la plus importante pour toute norme est la suivante : « Les gens vont-ils l’adopter ? » Après seulement quelques mois, la réponse est un oui clair et net. Le 9 avril, le dirigeant de Google DeepMind Demis Hassabis a apporté son soutien. Il a rapidement été appuyé par Sundar Pichai, PDG de Google. D’autres entreprises ont suivi le mouvement, notamment Microsoft, Replit et Zapier.
Il ne s’agit pas seulement de belles paroles. Une bibliothèque croissante de connecteurs MCP est en train d’émerger. Par exemple, Docker a récemment annoncé qu’il prenait en charge MCP.
Ce catalogue, même pas six mois après l’introduction de MCP, comprend déjà plus de 100 serveurs MCP de Grafana Labs, Kong, Neo4j, Pulumi, Heroku, Elasticsearch et bien d’autres.
Quels sont les cas d’utilisation réels de MCP ?
Au-delà de ce à quoi Docker peut accéder, il existe déjà des centaines de serveurs MCP. Ceux-ci peuvent être utilisés pour des tâches telles que :
- Les chatbots d’assistance à la clientèle : Les assistants IA peuvent accéder aux données CRM, aux informations sur les produits et aux tickets d’assistance en temps réel, fournissant ainsi une aide précise et contextuelle.
- Recherche d’IA en entreprise : L’IA peut effectuer des recherches dans les magasins de documents, les bases de données et le stockage en nuage, et relier les réponses aux documents sources correspondants.
- Outils pour développeurs: Les assistants de codage peuvent interagir avec CVS et d’autres systèmes de contrôle de version, les systèmes de suivi des problèmes et la documentation.
- Agents d’intelligence artificielle : Les agents autonomes peuvent planifier des tâches en plusieurs étapes, agir au nom des utilisateurs et s’adapter à l’évolution des besoins en exploitant les outils et les données connectés au MCP.
La meilleure question, en réalité, est de savoir à quoi MCP ne peut pas servir.
L’avenir : une couche d’intégration universelle de l’IA
MCP représente un changement de paradigme. Ce protocole permet à une IA isolée et statique de passer à des des systèmes profondément intégrés, conscients du contexte. Au fur et à mesure de sa maturation, le protocole sera à la base d’une nouvelle génération d’agents et d’assistants d’IA capables de raisonner, d’agir et de collaborer sur l’ensemble des outils et des données numériques de manière sûre, efficace et à grande échelle.
Je n’ai jamais vu une technologie prendre un tel essor depuis que l’IA générative a explosé sur la scène en 2022. Ce qui me rappelle vraiment, cependant, c’est l’apparition de Kubernetes il y a un peu plus de dix ans. À l’époque, beaucoup pensaient qu’il y aurait une course aux orchestrateurs de conteneurs entre des programmes aujourd’hui oubliés comme Swarm et Mesosphere. J’ai su dès le départ que Kubernetes serait le vainqueur.
C’est donc ce que je dis maintenant. MCP sera le lien de l’IA qui débloquera le plein potentiel de l’IA dans l’entreprise, le cloud et au-delà.