La plupart des agents IA d’entreprise savent analyser, mais pas agir. Ils résument des documents, font remonter des informations, rédigent des réponses. Ils ne clôturent pas les tickets de support, ne mettent pas à jour Salesforce, ne déclenchent pas de déploiements. Le ROI reste marginal. L’architecture qui résout ce problème est un runtime MCP : une couche d’exécution sécurisée qui gère les autorisations, les identifiants et les appels d’outils pour le compte de chaque utilisateur.

La vraie transformation se produit quand les agents passent à l’action, quand les collaborateurs pilotent le travail plutôt que de l’exécuter. Mais faire en sorte que les agents opèrent en toute sécurité sur les systèmes d’entreprise, c’est là que tout se complique.

Des études récentes d’IDC et du MIT montrent que 88 à 95 % des pilotes IA d’entreprise n’atteignent jamais la production. La cause première n’est pas le modèle de langage. C’est la complexité de l’intégration sécurisée, et chaque mois passé à reconstruire la plomberie d’authentification est un mois de moins pendant lequel vos agents ne créent pas de valeur métier.

Points clés

  • Utilisez un runtime MCP comme couche d’action sécurisée entre vos agents et les outils d’entreprise. Il évalue l’intersection des permissions de l’agent et de celles de l’utilisateur, action par action, au moment de l’exécution.
  • Exécutez chaque appel d’outil pour le compte de l’utilisateur (OBO). L’agent agit avec les identifiants de l’utilisateur, limités à ses permissions natives, et chaque action est traçable dans les journaux d’audit.
  • Ne faites pas transiter les tokens OAuth dans le contexte du LLM. Les identifiants doivent être stockés dans un coffre au niveau du runtime, là où le modèle ne peut pas les observer, les modifier ni les divulguer.
  • N’utilisez pas de comptes de service statiques. Ils brisent les modèles de permissions et transforment une seule injection de prompt en incident à l’échelle de l’entreprise.
  • Construisez avec des outils optimisés pour les agents, pas de simples wrappers d’API : des opérations au niveau de l’intention avec des schémas validés qui évitent les hallucinations de paramètres et éliminent les boucles de retry.
  • Exigez des validations humaines pour toute action destructrice. Les suppressions, les mises à jour en masse et les communications externes doivent marquer une pause pour une approbation explicite avant l’exécution.
  • Mettez en place les journaux d’audit et la télémétrie dès le premier jour. Exportez chaque appel d’outil via OpenTelemetry vers votre SIEM pour la conformité, la réponse aux incidents et l’analyse des causes racines.

Pourquoi connecter des agents IA aux outils d’entreprise est difficile : identité, permissions et exécution sécurisée

Le goulot d’étranglement dans les systèmes agentiques, comme Claude Cowork ou OpenClaw, n’est pas le fait de passer des appels API. C’est la propagation de l’identité, l’héritage des permissions et l’exécution sécurisée dans des environnements d’entreprise complexes.

Quand les équipes construisent des intégrations directes entre des LLMs et des logiciels d’entreprise, elles se heurtent rapidement à des frictions. Les développeurs passent du temps à gérer des cycles de vie OAuth fragiles, à traiter des flux de consentement utilisateur asynchrones, à ajuster manuellement les scopes d’autorisation au moindre privilège et à construire des contrôles d’approbation sur mesure. C’est un travail d’infrastructure sans valeur différenciante qui consume du temps d’ingénierie sans faire progresser les capacités fondamentales de l’agent.

Parce que ce travail est fastidieux et bloque le développement du cœur de l’agent, les équipes prennent souvent un raccourci dangereux : elles utilisent des comptes de service.

Accorder à un agent un accès global en lecture et écriture sur toute une instance d’entreprise brise les modèles de permissions natifs. Vous contournez des années de contrôles d’accès basés sur les rôles soigneusement configurés.

Une seule entrée manipulée peut entraîner une exfiltration de données instantanée et intraçable, ou une modification du système. Si un agent détient une clé API statique avec un accès en écriture global, une vulnérabilité d’injection de prompt localisée devient un incident à l’échelle de l’entreprise.

Les équipes commettent deux erreurs. Donnez à l’agent sa propre identité, et un stagiaire peut contourner ses permissions via l’agent. Héritez de l’accès complet de l’utilisateur, et une seule injection de prompt se propage à travers tous les systèmes connectés.

La bonne réponse, c’est l’intersection : qu’est-ce que cet agent est autorisé à faire ET qu’est-ce que cet utilisateur est autorisé à faire, évalué action par action, au moment de l’exécution. C’est le modèle d’intersection des permissions, et c’est la seule approche qui empêche à la fois l’escalade de privilèges et l’extension du rayon de souffle.

Cette évaluation doit se produire au niveau du runtime. Pas au moment de la connexion, pas dans le prompt, pas dans le code applicatif. Sans elle, faire passer les agents au-delà des démos mono-utilisateur est dangereux.

Le changement d’architecture : l’agent est déjà le proxy

Avant d’évaluer des approches d’intégration spécifiques, il faut comprendre pourquoi l’architecture d’entreprise traditionnelle ne s’applique plus.

Dans le modèle pré-agentique, un proxy (passerelle API) s’intercale entre les applications et les API pour assurer le routage, l’authentification et la limitation de débit. Le proxy est le point de contrôle parce que tout le trafic passe par lui.

Les agents inversent cette topologie. L’agent s’interpose entre l’utilisateur et l’infrastructure : il gère déjà le routage, l’orchestration et la prise de décision. Ajouter un proxy traditionnel devant les outils qu’il appelle n’introduit pas un point de contrôle supplémentaire. Cela crée un saut redondant, aveugle au contexte d’exécution qui compte vraiment : quel utilisateur, quelle action, quelle permission, à cet instant précis.

Le point de contrôle d’une architecture agentique, c’est la couche d’exécution où l’outil tourne, où les credentials sont résolus, les permissions vérifiées et les actions prises au nom d’un humain précis. C’est le runtime.

L’ère des API gateways était définie par le proxy comme point de contrôle. L’ère agentique, elle, est définie par le runtime.

Quatre architectures pour connecter des agents IA aux outils d’entreprise

Quand les organisations passent de pilotes isolés à des déploiements en production, les équipes d’ingénierie adoptent l’un de quatre modèles d’intégration. Comprendre où chaque approche atteint ses limites sous charge entreprise est essentiel pour la planification architecturale.

Approche d’intégrationSécurité & identitéCharge de maintenanceFiabilité & exécutionRapidité de mise en marché
Connecteurs custom & auth DIYTrès variable ; retombe souvent sur des clés statiques.Très élevée ; nécessite des équipes auth dédiées.Faible ; sujet aux boucles de hallucination de paramètres.Très lente.
Legacy iPaaSModérée ; difficultés avec l’exécution On-Behalf-Of.Moyenne ; repose sur la maintenance de workflows visuels.Moyenne ; optimisé pour les déclencheurs linéaires, pas les boucles.Modérée.
Serveurs MCP non managésFaible ; pas d’autorisation multi-utilisateurs centralisée.Élevée ; déploiement et patchs manuels requis.Faible ; pas de retries ni de failover natifs.Rapide pour les prototypes.
MCP runtime (ex. Arcade)Élevée ; mapping de permissions natif et coffres de tokens.Faible ; le runtime gère le cycle de vie et les mises à jour.Élevée ; exécution parallèle et retries automatiques.Très rapide.

Approche 1 : construire des connecteurs custom et OAuth (authentification DIY)

Créer des wrappers API sur mesure et des couches OAuth personnalisées pour chaque outil d’entreprise dont votre agent a besoin.

L’avantage, c’est le contrôle total. Vous maîtrisez chaque aspect de l’intégration et évitez le lock-in fournisseur.

Mais les limites deviennent vite paralysantes. Les connecteurs custom représentent un gouffre d’ingénierie. Les équipes passent des mois à construire des coffres de tokens sécurisés, gérer la rotation des refresh tokens et coder des cas limites. Des mois qui auraient pu servir à livrer des fonctionnalités agent qui font vraiment avancer le business.

Les API d’entreprise brutes aggravent le problème. Elles attendent des entrées très structurées et déterministes, alors que les agents produisent du langage naturel dynamique. Les câbler directement à des endpoints bruts engendre des hallucinations de paramètres et des boucles de retry sans fin. L’authentification seule devient un projet d’infrastructure à part entière : rotation de tokens, matching utilisateur, validation de session.

Approche 2 : utiliser un legacy iPaaS pour les appels d’outils de l’agent

Les entreprises adaptent des plateformes d’intégration existantes comme Workato, MuleSoft ou Zapier pour déclencher des actions à partir des sorties de LLM.

L’atout, c’est la familiarité. Les équipes IT d’entreprise connaissent déjà ces outils, et ils embarquent de vastes catalogues d’endpoints préconstruits.

Mais les limites sont architecturales et fondamentales. Ces plateformes ont été conçues pour des automatisations linéaires, déterministes, à base de déclencheurs. Les systèmes agentiques fonctionnent sur des boucles de raisonnement non déterministes et avec état, où l’agent décide quoi appeler, quand et combien de fois selon les résultats intermédiaires. Forcer cela dans un pattern webhook linéaire s’effondre rapidement.

Le problème de fond, c’est l’identité. Les plateformes legacy iPaaS reposent sur des comptes de service système à système. Elles manquent d’une véritable exécutionpar utilisateur, en mode On-Behalf-Of (OBO), ce qui oblige les équipes à construire des contournements complexes et fragiles pour s’assurer que l’agent n’agit qu’avec les permissions spécifiques de l’utilisateur qui tape le prompt. Une autorisation par utilisateur évaluée à l’exécution sur chaque appel d’outil requiert une infrastructure que ces plateformes n’ont jamais été conçues pour fournir.

Approche 3 : faire tourner des serveurs MCP non managés

Le Model Context Protocol a standardisé la façon dont les modèles IA se connectent aux sources de données et aux outils. Dans cette approche, les équipes déploient des serveurs MCP open source pour exposer des capacités locales ou SaaS directement à leurs agents.

La force de MCP, c’est la standardisation. Il découple le framework agent de l’implémentation sous-jacente des outils, créant un langage universel pour les appels d’outils. Le problème, c’est que la qualité des serveurs MCP open source non managés varie énormément. D’après desbenchmarks, beaucoup peinent en fiabilité et en exactitude, ce qui amplifie les défis des déploiements en production.

Ces serveurs s’effondrent dès qu’on les passe en production. Les serveurs MCP bruts et non managés manquent de gouvernance centralisée. Ils ne gèrent pas l’authentification d’entreprise multi-utilisateurs, ce qui fait que tous les utilisateurs partagent souvent la même identité de connexion.

Ils manquent aussi de fonctionnalités de fiabilité en production comme les retries automatiques, l’exécution parallèle et le failover avec état. Cette charge retombe sur le développeur applicatif.

Approche 4 : utiliser un MCP runtime (la couche d’actions sécurisée)

Un MCP runtime est la couche d’infrastructure conçue spécifiquement pour résoudre ce problème. Arcade.dev, le premier MCP runtime du marché, combine des outils optimisés pour les agents, une authentification et autorisation centralisées, ainsi qu’une gouvernance d’entreprise dans un plan de contrôle unique.

Cette approche cible la production IA directement. Le runtime parle MCP nativement (JSON-RPC, Streamable HTTP) sans traduction de protocole ni perte de contexte. Il préserve les permissions natives via des flux de tokens On-Behalf-Of, isole les identifiants du modèle de langage et fournit des journaux d’audit instantanés, compatibles OpenTelemetry, pour chaque action.

Les équipes livrent plus vite parce que le runtime gère l’autorisation, le cycle de vie des tokens, les nouvelles tentatives et la gouvernance. Les ingénieurs se concentrent entièrement sur la logique des agents et les résultats métier.

L’Arcade MCP Gateway permet à n’importe quel client MCP d’accéder à l’ensemble du catalogue d’outils via un point d’entrée unique. Les équipes peuvent aussi intégrer leurs propres serveurs MCP dans le runtime pour bénéficier de l’autorisation, des nouvelles tentatives et des journaux d’audit sans réécrire ce qui fonctionne déjà. Le runtime étend votre investissement MCP existant plutôt que de le remplacer.

Pour les projets personnels mono-utilisateur ou les scripts locaux, un runtime complet ajoute une complexité inutile. Mais pour les équipes platform engineering qui déploient des systèmes autonomes auprès de milliers d’utilisateurs en entreprise, un MCP runtime est la seule voie viable vers la production.

Ce que la production exige : autorisation, outillage et gouvernance

La comparaison ci-dessus montre où chaque approche accroche. Mais pour comprendre pourquoi le MCP runtime s’impose, il faut creuser les trois capacités qui séparent les déploiements en production des démos : une autorisation juste-à-temps qui applique des accès limités à chaque utilisateur, des outils optimisés pour les agents qui éliminent les boucles d’hallucination, et une infrastructure de gouvernance qui offre aux équipes platform une visibilité totale sur chaque action.

Comment l’autorisation juste-à-temps applique des accès limités à l’utilisateur

Les connecteurs personnalisés se rabattent sur des clés statiques. Les plateformes iPaaS legacy s’appuient sur des comptes de service partagés. Les serveurs MCP non gérés ne disposent d’aucune authentification multi-utilisateur. Les trois échouent au même endroit : ils ne peuvent pas évaluer qui a le droit de faire quoi au moment où l’outil est appelé.

C’est le problème que l’autorisation juste-à-temps résout.

L’agent demande et valide les identifiants uniquement au moment où une action les requiert, pas en amont. Si un utilisateur n’invoque jamais l’intégration Salesforce, aucun token Salesforce n’est jamais obtenu ni stocké.

L’intégralité du flux d’authentification (échanges OAuth, renouvellement des tokens, stockage des identifiants) s’exécute dans une logique backend déterministe que le LLM ne peut jamais modifier, observer ou exposer. Pour renforcer la gouvernance, les équipes peuvent attacher des hooks pré-appel et post-appel afin d’appliquer des politiques personnalisées : validations humaines pour certaines actions, limites d’usage ou règles d’accès contextuelles.

Cela fonctionne parce que le runtime est avec état (stateful). Il maintient un contexte par session et par utilisateur tout au long de la boucle de raisonnement de l’agent. Un proxy sans état évalue chaque requête isolément et ne peut pas savoir qu’une requête est l’étape 3 d’un workflow en 6 étapes, effectuée au nom d’Alice, qui a autorisé ce périmètre précis il y a 4 minutes. Le runtime, lui, le sait ; et ce contexte de session est ce qui rend l’autorisation par utilisateur et par outil applicable.

C’est là que le modèle d’intersection des permissions décrit précédemment devient opérationnel. L’architecture applique : Permissions Agent ∩ Permissions Utilisateur = Périmètre d’action effectif. L’agent ne peut exécuter une action que si la politique de rôle de l’agent et les permissions SaaS natives de l’utilisateur l’autorisent explicitement. Toute autre combinaison est refusée.

Exemple concret : un agent IA d’entreprise est conçu pour assister le département des ressources humaines. Un employé utilisant cet agent dispose de privilèges administratifs élevés dans Workday, incluant l’accès aux données de paie mondiales. Mais l’agent RH lui-même est strictement limité aux tâches de recrutement.

Parce que le runtime évalue l’intersection de ces permissions au moment de l’appel, l’agent est refusé lorsqu’on lui demande d’accéder aux données de paie. L’utilisateur en a l’autorité, mais le périmètre restreint de l’agent bloque l’action. Cela stoppe l’exfiltration de données et les attaques de type confused deputy net.

Outils optimisés pour les agents vs wrappers API : lequel choisir et pourquoi

Le tableau comparatif pointe un mode d’échec spécifique aux connecteurs personnalisés : les boucles d’hallucination de paramètres. Cela arrive parce que les endpoints REST bruts exigent des paramètres précis et déterministes, alors que les modèles de langage produisent du langage naturel probabiliste. Relier directement l’un à l’autre sans intermédiaire, c’est là que les agents plantent.

Les agents ont besoin d’outils orientés intention plutôt que de wrappers API bruts. Un outil orienté intention absorbe l’ambiguïté de la requête d’un agent et la traduit en une transaction sûre et prévisible. Résultat : une exécution plus rapide, moins d’actions échouées et des coûts d’inférence réduits, car l’agent ne brûle plus de tokens dans des boucles de nouvelles tentatives.

L’exécution en production exige aussi des fonctionnalités de fiabilité runtime que les API brutes ne fournissent pas. Le runtime offre un contexte défini par le développeur pour des nouvelles tentatives intelligentes, une exécution parallélisée pour les tâches multi-étapes, et un basculement automatique pour gérer les limites de débit et les erreurs réseau transitoires. Des schémas normalisés au sein de ces outils préviennent l’hallucination de paramètres, la cause d’échec la plus fréquente quand on connecte directement les modèles aux API.

Voyons comment cela fonctionne concrètement. Au lieu qu’un agent appelle un endpoint de mise à jour Salesforce brut et échoue parce qu’il a halluciné un identifiant de stage requis, l’agent utilise un outil de progression de haut niveau, optimisé pour les agents.

L’outil comprend nativement l’intention de l’utilisateur de faire avancer une opportunité vers la négociation. Sa logique interne recherche de manière sécurisée l’identifiant exact correspondant à cette instance Salesforce, valide la transition d’état et exécute la mise à jour en toute sécurité. Le modèle de langage n’a pas besoin de deviner le schéma exact de la base de données. L’action réussit au premier appel, pas au cinquième.

Gouvernance et observabilité pour les actions des agents (journaux d’audit, OTel, versioning)

Les serveurs MCP non gérés ont obtenu la note « Faible » en fiabilité et sécurité dans la comparaison ci-dessus, faute de gouvernance centralisée. Dès que des agents exécutent de vraies actions au nom des utilisateurs, les équipes platform ont besoin d’une visibilité et d’un contrôle complets sur l’écosystème d’intégration. Le runtime y répond par trois mécanismes.

Le filtrage de visibilité garantit que les agents ne voient que les outils spécifiques que l’utilisateur actuel est autorisé à invoquer. Si un utilisateur n’a pas la permission de fusionner du code dans GitHub, l’outil de fusion GitHub n’apparaît pas dans la fenêtre de contexte de l’agent.

Les journaux d’audit détaillés enregistrent chaque action par utilisateur, par service et par session d’agent. Ces journaux sont exportables vers les outils SIEM standards via OpenTelemetry (OTel) pour satisfaire les audits de conformité.

Le contrôle de version permet aux ingénieurs platform de mettre à jour les schémas d’outils et de faire tourner les paramètres de connexion en toute sécurité, sans perturber les agents en production qui tournent en cours de session sur des versions antérieures.

Quand un agent ferme par erreur plusieurs opportunités dans un CRM, l’équipe plateforme ne peut pas passer des jours à éplucher des logs bruts. Avec un journal d’audit compatible OTel généré par la couche d’action, l’équipe sécurité remonte en quelques minutes jusqu’au prompt exact, à la session agent précise et au token utilisé. La cause racine est isolée immédiatement, ce qui permet d’affiner les instructions de l’agent ou la politique d’accès de l’outil sans délai.

Parmi les quatre approches évaluées, seul le runtime MCP réunit les trois garanties : autorisation limitée à l’utilisateur au moment de l’appel, outillage orienté intention qui prévient les hallucinations, et gouvernance centralisée avec pistes d’audit complètes. Les sections suivantes montrent comment cette architecture fonctionne concrètement et comment l’évaluer pour votre organisation.

Comment choisir une approche d’intégration d’agents IA en entreprise (sécurité, OBO et TCO)

La façon dont vous connectez vos agents IA aux outils d’entreprise est une décision architecturale fondamentale. Elle conditionne la vitesse et la sécurité de votre déploiement. Les ingénieurs plateforme et les responsables techniques doivent cadrer leurs critères d’achat et de construction autour de la sécurité, de l’échelle et de l’allocation des ressources.

Exigences de sécurité et conformité (SOC 2, ISO 27001, auditabilité)

La solution proposée peut-elle s’aligner nativement sur les exigences SOC 2 et ISO 27001 pour une attribution utilisateur stricte ? Si un agent supprime un fichier dans Google Workspace, le journal d’audit doit prouver sans ambiguïté quel humain a autorisé cette action.

Le système doit prendre en charge les hooks d’approbation Human-in-the-Loop (HITL)avant l’appel d’outil. Les actions destructrices (modification de configurations de production ou mise à jour en masse d’enregistrements) doivent suspendre l’exécution et exiger une validation cryptographique d’un administrateur humain via Slack ou e-mail avant de continuer.

Faire soi-même ou acheter : coûts OAuth et coût total de possession

Faire soi-même ou acheter exige une évaluation économique sans concession.

Calculez les heures d’ingénierie réelles pour construire, maintenir et mettre à jour en toute sécurité les flux OAuth d’au moins dix API d’entreprise distinctes. Intégrez les coûts cachés : gestion de la rotation des refresh tokens, construction d’URL de callback webhook pour les tâches async longues, correctifs des connecteurs personnalisés à chaque dépréciation d’API par les éditeurs SaaS.

Puis demandez-vous ce que ces ingénieurs auraient pu livrer à la place.

Adopter un runtime MCP transforme un projet d’infrastructure de plusieurs mois en exercice de configuration. Le coût total de possession chute sensiblement, et votre équipe récupère des mois de capacité d’ingénierie à investir dans les fonctionnalités agents qui différencient votre produit.

Délai de valeur et focus d’ingénierie

Le délai de valeur est là où la plupart des équipes sous-estiment le coût du développement en interne.

Vos ingénieurs IA vont-ils passer les trois prochains mois à construire des connecteurs Slack et Workspace fiables, ou à optimiser les prompts, évaluer la logique de raisonnement et livrer les fonctionnalités agents qui génèrent du chiffre ? Chaque semaine passée sur la plomberie d’intégration est une semaine que vos concurrents utilisent pour passer en production.

Quand vous évaluez des fournisseurs externes ou des plans d’architecture interne, forcez le débat avec des questions techniques précises :

  • Les clés API ou les tokens OAuth sont-ils jamais visibles dans la fenêtre de contexte du prompt du modèle de langage ?
  • Comment le système résout-il les conflits de permissions entre un utilisateur très privilégié et un agent à périmètre restreint ?
  • Le système peut-il émettre un contexte de trace W3C standard vers nos collecteurs OpenTelemetry existants ?
  • Comment l’outil gère-t-il la limitation de débit quand un agent entre dans une boucle de tentatives inattendue ?

Si la réponse sur la visibilité des credentials n’est pas une isolation absolue, l’architecture n’est pas adaptée à une production d’entreprise.

Architecture de référence d’un runtime MCP (flux étape par étape)

Avec la décision architecturale posée, voici comment une requête transite concrètement dans le runtime de bout en bout. Le runtime MCP joue le rôle d’intermédiaire qui orchestre la confiance et l’exécution entre le moteur de raisonnement non déterministe et l’environnement d’entreprise déterministe.

Le flux d’une requête sécurisée suit une séquence stricte :

Secure AI agent enterprise integration architecture diagram showing MCP runtime flow

  1. Prompt utilisateur : l’utilisateur soumet une demande, par exemple « ferme ce ticket de support ».
  2. Plan LLM : le modèle de langage de l’agent détermine la séquence d’appels d’outils nécessaire pour répondre à la demande.
  3. Runtime MCP : le runtime reçoit la demande d’appel d’outil. Il évalue les permissions de l’utilisateur et de l’agent, puis récupère le credential On-Behalf-Of requis.
  4. Exécution de l’outil : le runtime, et non l’agent, exécute l’appel API précis vers le système cible (par exemple Zendesk).
  5. Résultat et action suivante : Le runtime reçoit le résultat de l’API, le filtre et le retransmet à l’agent. Le LLM planifie alors l’action suivante dans la séquence ou conclut que la tâche est terminée.
  6. Confirmation et audit : l’agent confirme la fin de l’action à l’utilisateur, et le runtime journalise l’intégralité de la transaction via OpenTelemetry à des fins d’audit.

Cette architecture impose une séparation stricte des responsabilités. Le modèle de langage gère le raisonnement, la planification, la sélection des actions et la génération. La couche runtime gère les credentials, l’application des politiques, la limitation de débit, l’exécution des actions et la journalisation.

En stockant les tokens au niveau de la couche runtime, cette architecture empêche l’exfiltration de données par injection de prompt. Le modèle de langage ne possède jamais les clés nécessaires pour exporter des données.

Comment un MCP runtime fonctionne avec n’importe quel LLM

Le MCP runtime fonctionne avec n’importe quel LLM, via n’importe quel framework d’orchestration, ou sans framework du tout. Aucune dépendance n’est requise. Arcade joue le rôle de backend d’exécution sécurisé : votre code gère le raisonnement, Arcade gère les credentials, les autorisations et l’exécution des tools.

Cette séparation nette est ce qui réduit le délai de mise en production. Les ingénieurs IA se concentrent entièrement sur la logique des agents, sans avoir à gérer la plomberie à haut risque des intégrations d’entreprise.

Un exemple concret : un agent qui lit Gmail et envoie des messages Slack via le runtime Arcade. La configuration nécessite trois dépendances et trois variables d’environnement :

pip install arcadepy openai python-dotenv
# .env
ARCADE_API_KEY=your_arcade_api_key        # Free at arcade.dev
ARCADE_USER_ID=your_email@company.com     # The user the agent acts on behalf of
OPENAI_KEY=your_openai_key
from arcadepy import Arcade
from openai import OpenAI
from dotenv import load_dotenv
import json, os

load_dotenv()

arcade_client = Arcade()
arcade_user_id = os.getenv("ARCADE_USER_ID")
llm_client = OpenAI(
   api_key=os.getenv("OPENAI_KEY"),
)

# Define enterprise productivity tools — Arcade handles auth for each
tool_catalog = [
   "Gmail.ListEmails",
   "Gmail.SendEmail",
   "Slack.SendMessage",
]

# Get tool definitions formatted for the LLM
tool_definitions = [
   arcade_client.tools.formatted.get(name=t, format="openai")
   for t in tool_catalog
]

# JIT authorization + execution — credentials never touch the LLM
def authorize_and_run_tool(tool_name: str, input: str):
   auth = arcade_client.tools.authorize(
       tool_name=tool_name, user_id=arcade_user_id
   )
   if auth.status != "completed":
       print(f"Authorize {tool_name}: {auth.url}")
       arcade_client.auth.wait_for_completion(auth.id)

   result = arcade_client.tools.execute(
       tool_name=tool_name,
       input=json.loads(input),
       user_id=arcade_user_id,
   )
   return json.dumps(result.output.value)

# Agentic loop — LLM reasons and selects tools, Arcade executes them
def invoke_llm(history: list[dict], max_turns: int = 5) -> list[dict]:
   turns = 0
   while turns < max_turns:
       turns += 1
       response = llm_client.chat.completions.create(
           model="gpt-4o-mini",
           messages=history,
           tools=tool_definitions,
           tool_choice="auto",
       )
       msg = response.choices[0].message
       if msg.tool_calls:
           history.append(msg.model_dump(exclude_none=True))
           for tc in msg.tool_calls:
               result = authorize_and_run_tool(tc.function.name, tc.function.arguments)
               history.append({"role": "tool", "tool_call_id": tc.id, "content": result})
           continue
       else:
           history.append({"role": "assistant", "content": msg.content})
       break
   return history

# Run the agent
history = [{"role": "system", "content": "You are a helpful assistant."}]
history.append({"role": "user", "content": "Summarize my latest 5 emails, then send me a DM on Slack with the summary."})
history = invoke_llm(history)
print(history[-1]["content"])

Le LLM raisonne sur la tâche, sélectionne Gmail.ListEmails pour récupérer les e-mails, les résume, puis sélectionne Slack.SendMessage pour envoyer le résumé. Le runtime gère l’autorisation JIT pour chaque tool au nom de l’utilisateur concerné. L’agent ne voit jamais les tokens OAuth, ne gère jamais les flux de rafraîchissement, et ne touche jamais aux credentials. Retrouvez le guide complet dans la documentation Arcade.

Prochaines étapes pour industrialiser les intégrations d’agents (checklist)

Pour passer des prototypes sandbox aux déploiements en production, les équipes d’ingénierie plateforme suivent un plan d’implémentation structuré et itératif.

Étape 1 : Inventorier les tools nécessaires et les scopes à privilèges minimaux

Commencez par un audit rigoureux de vos tools. Listez les API dont vos agents ont besoin et documentez précisément les scopes utilisateur et granularités OAuth requises pour chacun. N’accordez pas d’accès global. Appliquez le principe de moindre privilège à chaque workflow.

Étape 2 : Définir les actions autonomes et celles nécessitant approbation humaine (HITL)

Définissez ensuite vos limites opérationnelles. Construisez une matrice pour distinguer les actions sûres en exécution autonome (comme la lecture d’événements calendrier) des actions à haut risque qui nécessitent une délégation explicite ou une approbation humaine (comme la suppression de fichiers ou l’envoi d’e-mails externes).

Étape 3 : Standardiser sur un plan de contrôle unique

Centralisez votre stratégie d’intégration sans attendre. Évitez la création de « registres fantômes ».

Quand des équipes dispersées construisent des intégrations redondantes et non gérées avec des tokens codés en dur, elles créent des failles de sécurité graves et une prolifération incontrôlée des intégrations. Standardisez sur un plan de contrôle unique pour tous les tools d’agents.

Étape 4 : Piloter un workflow et valider l’isolation des tokens et la télémétrie

Avant un déploiement large, testez l’architecture sur un cas d’usage restreint et maîtrisé. Pilotez un seul workflow, comme l’automatisation des issues développeurs reliant GitHub et Jira, pour valider l’isolation des tokens et la télémétrie.

Investissez dans l’infrastructure, pas uniquement dans des connecteurs isolés. Évaluez les plateformes qui traitent l’autorisation, les tools optimisés pour les agents et la gouvernance du cycle de vie comme un runtime sécurisé unifié, et non comme des problèmes séparés.

Conclusion : Utiliser un MCP runtime pour connecter les agents IA aux outils d’entreprise

Le vrai défi pour connecter des agents IA aux outils de productivité d’entreprise n’est pas la mise en forme de payloads JSON ou les appels API. Le goulot d’étranglement, c’est la sécurisation des accès limités à l’utilisateur, l’application des permissions à privilèges minimaux au runtime, et le maintien d’une gouvernance opérationnelle rigoureuse sur des systèmes non déterministes.

Les équipes d’ingénierie plateforme les plus efficaces savent que reconstruire from scratch la propagation d’identité, les cycles de vie des tokens et la fiabilité des intégrations est une distraction coûteuse par rapport à leurs objectifs métier. Elles ont besoin d’un MCP runtime, pas de davantage de connecteurs sur mesure.

Arcade est le premier MCP runtime du marché. Il offre une autorisation sécurisée des agents, le plus grand catalogue de tools optimisés pour les agents, et une gouvernance centralisée du cycle de vie dans un plan de contrôle unique. Arcade élimine la charge indifférenciée des intégrations d’entreprise pour que votre équipe livre plus vite et scale avec maîtrise.

Si vous construisez des agents qui doivent s’exécuter sur des outils d’entreprise, commencez par le guide de démarrage ou explorez le catalogue complet des tools pour voir ce qui est disponible d’emblée.

FAQ : Intégrations d’agents IA en entreprise

Quelle est la meilleure façon de connecter des agents IA aux outils de productivité d’entreprise ?

Utilisez un MCP runtime, une couche d’action sécurisée qui exécute des actions au nom de l’utilisateur (OBO), maintient les tokens hors du LLM et applique une autorisation runtime à chaque appel de tool.

Les agents IA doivent-ils utiliser des comptes de service pour accéder à Slack, Google Workspace ou Microsoft 365 ?

Non. Les comptes de service contournent les permissions utilisateur et élargissent le rayon d’impact des injections de prompt. Utilisez l’exécution au nom de l’utilisateur avec des scopes à privilèges minimaux.

Que signifie « On-Behalf-Of (OBO) » pour les intégrations d’agents ?

OBO signifie que l’agent exécute chaque action avec des credentials liés à l’utilisateur demandeur, ce qui limite l’action aux permissions natives de cet utilisateur et la rend traçable dans les logs d’audit.

Qu’est-ce que l’autorisation just-in-time pour les agents IA ?

L’autorisation just-in-time est une vérification de politique au runtime qui s’exécute au moment de chaque appel de tool, en évaluant l’identité de l’utilisateur, le scope autorisé de l’agent et l’action demandée. Les credentials sont demandés et validés uniquement au moment du besoin, sans pré-autorisation lors de la configuration.

Qu’est-ce qu’un MCP runtime, et en quoi diffère-t-il d’un serveur MCP ?

Un serveur MCP expose des tools à un agent via le MCP, mais il est généralement mono-utilisateur, sans état, et livré sans authentification intégrée, gestion de tokens ni observabilité. Un MCP runtime est la couche d’infrastructure d’entreprise qui complète les serveurs MCP en ajoutant ce qui leur manque : authentification OBO multi-utilisateur, application de politiques par appel, coffre-fort de tokens, relances automatiques et audit/télémétrie. Le serveur définit ce que l’agent peut appeler ; le runtime rend ces appels sûrs à grande échelle. Arcade est le premier MCP runtime du marché, conçu spécifiquement pour les déploiements d’agents en production.

Quels sont les prérequis de sécurité minimaux pour l’accès aux outils d’agents en production ?

Isolation des tokens vis-à-vis du LLM, exécution OBO par utilisateur, scopes à moindre privilège, autorisation par action, logs d’audit avec attribution utilisateur, et validations HITL pour les actions à risque élevé.

Comment auditer et attribuer les actions d’agents pour la conformité (SOC 2 / ISO 27001) ?

Enregistrez chaque appel d’outil avec l’identité utilisateur, l’outil, les paramètres/l’intention, le résultat et le contexte de trace, puis exportez via OpenTelemetry vers votre SIEM pour investigation et reporting.

Quand les outils iPaaS legacy (Zapier/Workato/MuleSoft) atteignent-ils leurs limites avec les agents ?

Ils peinent avec les boucles non déterministes et l’exécution OBO par utilisateur, obligeant les équipes à recourir à des credentials partagés ou des contournements fragiles.

Comment les outils optimisés pour agents réduisent-ils les hallucinations par rapport aux wrappers d’API bruts ?

Ils s’appuient sur des opérations au niveau de l’intention avec des schémas validés et des lookups internes : le modèle n’a pas à deviner les IDs ou paramètres requis, et peut échouer proprement.

Quand faut-il ajouter des validations humaines (HITL) ?

Pour toute action destructrice ou irréversible (suppressions, e-mails externes, mises à jour en masse, modifications de permissions) ou toute action ayant un impact réel sur la sécurité, les finances ou les données clients.