Managed Agents de Anthropic: Lo que falta

El equipo de ingeniería de Anthropic publicó recientemente un artículo detallado de arquitectura llamado “Scaling Managed Agents: Decoupling the Brain from the Hands.” Es un trabajo excelente que confirma lo que ya saben todos los equipos que despliegan agentes de AI: la infraestructura alrededor del modelo es la parte difícil, no el modelo en sí.

Aquí está lo que dice el artículo, por qué importa y dónde queda una brecha crítica.

Lo que Anthropic construyó

Managed Agents de Anthropic es un servicio hospedado que ejecuta agentes de Claude de largo horizonte en tu nombre. La idea central es una analogía con los sistemas operativos: así como los SO virtualizaron el hardware en abstracciones estables (proceso, archivo,read()que sobrevivieron a cualquier disco o CPU específico, Managed Agents virtualiza los componentes de un agente en tres interfaces:

Sessionun log duradero y de solo adición que registra todo lo ocurrido, almacenado fuera de la ventana de contexto de Claude y del harness. Esto significa que el contexto sobrevive a fallas y puede consultarse de forma programática.

Harnessel bucle que llama a Claude, enruta las llamadas de herramientas y gestiona la ingeniería de contexto. No tiene estado. Si falla, uno nuevo reproduce el log de sesión y retoma donde se quedó.

Sandboxun entorno de ejecución aislado donde Claude ejecuta código y edita archivos.

El movimiento arquitectónico clave es eldesacoplamientode estas tres cosas. En el diseño anterior, todo vivía en un solo contenedor, una “mascota” que no te podías permitir perder. Cuando fallaba, la sesión moría con él. Al separar el cerebro de las manos, cada componente se convierte en una pieza de Lego: reemplazable, escalable de forma independiente y depurable. Los resultados hablan solos: el tiempo p50 de primer token bajó ~60%, mientras que el p95 cayó más del 90%.

También tomaron una decisión de seguridad inteligente: las credenciales nunca entran al sandbox. Los tokens OAuth viven en un vault y un proxy maneja las llamadas autenticadas en nombre del agente. El código generado por Claude nunca puede filtrar secretos porque simplemente no están ahí.

Qué problema resuelve realmente

Anthropic está resolviendo el problema deorquestación de agentes: ¿cómo ejecutas un modelo de forma confiable en un bucle durante horizontes largos, sobrevives fallas, gestionas contexto que supera la ventana y escalas a muchas sesiones concurrentes? Es infraestructura para el “cerebro”, el motor de razonamiento y la plomería que lo mantiene funcionando.

Esto es genuinamente difícil, y el artículo es una contribución sólida. Pero nota lo que está notablemente sin especificar: lasmanos.

El artículo define una mano como cualquier cosa que implementeexecute(name, input) → stringEso es todo. A qué se conectan realmente las manos, cómo se autentican como un usuario específico, cómo gobiernas qué herramientas están disponibles para qué agentes, cómo gestionas flujos OAuth a través de docenas de proveedores SaaS para miles de usuarios finales… eso se deja como ejercicio para el lector.

Y ese ejercicio es enorme.

Lo que resuelve Arcade.dev

Arcade.dev es un runtime de MCP, la infraestructura de producción para esas “manos” que Anthropic abstrae con una firma de función.

Si Managed Agents de Anthropic responde “¿cómo mantengo el cerebro de un agente funcionando de forma confiable a escala?”, Arcade responde la pregunta complementaria:“¿cómo toma ese agente acciones reales de forma segura, como usuarios reales, en sistemas de negocio reales?”

Tres trabajos concretos a resolver:

1. Autorización por usuario a escala. Cuando tu agente envía un correo, no puede usar una cuenta de servicio. Necesita actuar comoese usuario específico, conel token deOAuth de ese usuario, con alcance alos permisos de ese usuarioArcade gestiona el ciclo de vida completo de OAuth (adquisición de tokens, renovación, almacenamiento, scoping) en proveedores como Google, Slack, Salesforce y GitHub. Se integra con tu proveedor de identidad existente. Este es exactamente el problema de gestión de credenciales que Anthropic reconoció (“los tokens viven en un vault, un proxy maneja las llamadas”), pero para el que no publicaron una solución general.

2. Herramientas optimizadas para agentes, no wrappers de API. Las superficies de API crudas están diseñadas para desarrolladores, no para LLMs. Tienen paginación, esquemas complejos y códigos de error ambiguos. Arcade ofrece un catálogo de herramientas MCP construidas específicamente para el consumo de agentes, con mayor confiabilidad, menor costo en tokens y salidas mejor estructuradas. También puedes construir herramientas personalizadas con su framework open-source, que incluye OAuth y evals.

3. Gobernanza y flexibilidad de despliegue. Las empresas necesitan saber qué agentes pueden llamar a qué herramientas, ver una pista de auditoría y desplegar en su VPC o en un entorno air-gapped. Arcade ofrece gobernanza del ciclo de vida para tener visibilidad y control sobre cada herramienta y agente en la organización, con opciones de despliegue que van desde la nube hasta completamente on-premises.

Cómo encajan juntos

No son productos que compiten. Son capas complementarias. Anthropic construyó el SO para el cerebro del agente. Arcade construyó el runtime para las manos del agente.

La propia arquitectura de Anthropicrequierealgo como Arcade. Su interfazexecute(name, input) → stringes deliberadamente agnóstica a las herramientas. Como ellos dicen, “el harness no le importa si el sandbox es un contenedor, un celular o un emulador de Pokémon.” Pero cuando una empresa necesita que ese agente agende una reunión en el Google Calendar de un usuario, actualice una oportunidad en Salesforce y publique un resumen en Slack, alguien tiene que construir y operar esa infraestructura. Eso implica manejar todo lo del usuario final autenticado con el scoping correcto, renovación de tokens y registro de auditoría.

Eso es Arcade. El cerebro ya está cubierto. Las manos necesitan un runtime. Arcade es ese runtime.

Anthropic te acaba de decir lo difícil que son los agentes. Se les olvidó la parte más difícil.

Lo que Anthropic construyó

Qué problema resuelve realmente

Lo que resuelve Arcade.dev

Cómo encajan juntos

ARTÍCULOS RECIENTES

Welcome to Arcade Labs

Microsoft Build 2026: What Was Announced, and What It Means for the Agent Stack

Opus 4.8 just dropped. But can it actually do the work?

Ingresa a Arcade ahora y comienza a construir.