Managed Agents d'Anthropic : ce qui manque

L’équipe d’ingénierie d’Anthropic a récemment publié un article d’architecture détaillé intitulé “Scaling Managed Agents : Decoupling the Brain from the Hands.” Un travail solide qui confirme ce que toutes les équipes qui déploient des agents IA savent déjà : l’infrastructure autour du modèle est la vraie difficulté, pas le modèle lui-même.

Voici ce que dit cet article, pourquoi c’est important, et où subsiste un manque critique.

Ce qu’Anthropic a construit

Les Managed Agents d’Anthropic sont un service hébergé qui exécute des agents Claude à long horizon en votre nom. L’idée centrale s’appuie sur une analogie avec les systèmes d’exploitation : tout comme les OS ont virtualisé le matériel en abstractions stables (processus, fichier, read()qui ont survécu aux disques et CPU de chaque époque, les Managed Agents virtualisent les composants d’un agent en trois interfaces :

SessionUn journal durable, en ajout seulement, de tout ce qui s’est passé, stocké hors de la fenêtre de contexte de Claude et hors du harness. Le contexte survit aux crashs et peut être interrogé par programmation.

HarnessLa boucle qui appelle Claude, route les appels d’outils et gère l’ingénierie du contexte. Il est sans état. S’il plante, un nouveau rejoue le journal de session et reprend là où il en était.

SandboxUn environnement d’exécution isolé où Claude exécute du code et modifie des fichiers.

Le choix architectural clé, c’est la découpling (séparation)de ces trois éléments. Dans l’ancien design, tout vivait dans un seul conteneur, un « animal de compagnie » qu’on ne pouvait pas se permettre de perdre. En cas de panne, la session mourait avec lui. En séparant le cerveau des mains, chaque composant devient une brique Lego : remplaçable, scalable et déboguable indépendamment. Les résultats parlent d’eux-mêmes : le temps de premier token p50 a chuté de ~60 %, le p95 de plus de 90 %.

Ils ont aussi pris une décision de sécurité intelligente : les identifiants n’entrent jamais dans le sandbox. Les tokens OAuth vivent dans un coffre, et un proxy gère les appels authentifiés au nom de l’agent. Le code généré par Claude ne peut jamais exfiltrer des secrets, puisque ces secrets n’y sont tout simplement pas.

Quel problème cela résout vraiment

Anthropic résout le problème de l’orchestration d’agentscomment faire tourner un modèle en boucle sur de longs horizons, survivre aux pannes, gérer un contexte qui dépasse la fenêtre, et scaler sur de nombreuses sessions concurrentes ? C’est l’infrastructure pour le « cerveau » : le moteur de raisonnement et la plomberie qui le maintient en marche.

C’est vraiment difficile, et l’article apporte une contribution solide. Mais remarquez ce qui reste ostensiblement peu défini : les mains.

L’article définit une main comme tout ce qui implémente execute(name, input) → stringça. Ce à quoi les mains se connectent réellement, comment elles s’authentifient en tant qu’utilisateur spécifique, comment vous gérez quels outils sont disponibles pour quels agents, comment vous gérez les flux OAuth pour des dizaines de fournisseurs SaaS et des milliers d’utilisateurs finaux… tout ça est laissé comme exercice pour le lecteur.

Et cet exercice est colossal.

Ce qu’Arcade.dev résout

Arcade.dev est un runtime MCP, l’infrastructure de production pour ces « mains » qu’Anthropic abstrait derrière une signature de fonction.

Si les Managed Agents d’Anthropic répondent à « comment je maintiens le cerveau d’un agent en marche de façon fiable à l’échelle », Arcade répond à la question complémentaire :« comment cet agent prend-il des actions réelles, en tant qu’utilisateurs réels, sur des systèmes métier réels ? »

Trois missions concrètes :

1. Autorisation par utilisateur à l’échelle. Quand votre agent envoie un e-mail, il ne peut pas utiliser un compte de service. Il doit agir en tant que cet utilisateur précis, avec le token de cet utilisateur, scopé aux permissions de cet utilisateurpermissions. Arcade gère l’intégralité du cycle de vie OAuth (acquisition, rafraîchissement, stockage, scoping des tokens) pour des fournisseurs comme Google, Slack, Salesforce et GitHub. Il s’intègre à votre fournisseur d’identité existant. C’est exactement le problème de gestion des identifiants qu’Anthropic a reconnu (« les tokens vivent dans un coffre, un proxy gère les appels »), sans avoir livré de solution générale.

2. Des outils optimisés pour les agents, pas des wrappers d’API. Les surfaces d’API brutes sont conçues pour les développeurs, pas pour les LLMs. Elles ont de la pagination, des schémas complexes et des codes d’erreur ambigus. Arcade propose un catalogue d’outils MCP conçus spécifiquement pour la consommation par les agents, offrant une meilleure fiabilité, un coût en tokens plus faible et des sorties mieux structurées. Vous pouvez aussi créer des outils personnalisés avec leur framework open-source, OAuth et evals inclus.

3. Gouvernance et flexibilité de déploiement. Les entreprises doivent savoir quels agents peuvent appeler quels outils, disposer d’une piste d’audit et déployer dans leur VPC ou en environnement air-gapped. Arcade fournit une gouvernance du cycle de vie pour la visibilité et le contrôle sur chaque outil et agent de l’organisation, avec des options de déploiement allant du cloud au tout on-premises.

Comment ils s’articulent

Ce ne sont pas des produits concurrents. Ce sont des couches complémentaires. Anthropic a construit l’OS pour le cerveau de l’agent. Arcade a construit le runtime pour ses mains.

L’architecture même d’Anthropic requiertquelque chose comme Arcade. Leur interface execute(name, input) → stringest délibérément agnostique aux outils. Comme ils le disent, « le harness ne se soucie pas de savoir si le sandbox est un conteneur, un téléphone ou un émulateur Pokémon. » Mais quand une entreprise a besoin que cet agent réserve une réunion dans Google Calendar d’un utilisateur, mette à jour une opportunité Salesforce et poste un résumé sur Slack, quelqu’un doit construire et faire tourner cette infrastructure. Ça implique de gérer l’utilisateur final authentifié avec un scoping correct, le rafraîchissement des tokens et la journalisation des audits.

C’est Arcade. Le cerveau est pris en charge. Les mains ont besoin d’un runtime. Arcade est ce runtime.

Anthropic vient de vous dire à quel point les agents sont complexes. Ils ont omis la partie la plus difficile.

Ce qu’Anthropic a construit

Quel problème cela résout vraiment

Ce qu’Arcade.dev résout

Comment ils s’articulent

RECENT ARTICLES

Welcome to Arcade Labs

Microsoft Build 2026: What Was Announced, and What It Means for the Agent Stack

Opus 4.8 just dropped. But can it actually do the work?

Accédez en avant-première à Arcade et commencez à construire dès maintenant.