Cómo Tradestack construyó agentes de AI en producción

El 70% de los proyectos de AI que nunca llegan a producción tienen algo en común: chocan contra el muro de autenticación y nunca se recuperan. Tradestack lo rompió aprovechando las capacidades de Arcade.dev.

Cuando Vaibhav Pandey y su equipo en Tradestack se propusieron construir una oficina trasera agéntica para contratistas del Reino Unido, se toparon con el desafío que mata la mayoría de los proyectos de agentes: darle a la AI acceso seguro y confiable a sistemas críticos del negocio. Sus clientes objetivo (contratistas de mercado medio que manejan facturación, presupuestos y gestión de proyectos) necesitaban más que un chatbot. Necesitaban un agente que realmente pudierahacercosas en los sistemas que ya usan.

“Si el agente no puede actuar en nombre tuyo como dueño de negocio, entonces prácticamente no sirve de mucho”, explica Pandey. Para que el asistente de Tradestack basado en WhatsApp entregara valor real, necesitaba crear presupuestos en sistemas de gestión de trabajos, enviar cotizaciones y facturas a través de Xero, y manejar comunicaciones por clientes de correo como Outlook y Gmail, todo manteniendo seguridad de nivel empresarial.

El muro de autenticación que detiene al 70% de los proyectos

La mayoría de los equipos descubren a las malas que construir agentes en producción requiere una experiencia que simplemente no existe en el mercado. Necesitas la intersección de AI, sistemas de identidad e infraestructura distribuida, una combinación tan rara que es prácticamente imposible de contratar.

Tradestack exploró soluciones existentes al principio, pero las herramientas prefabricadas ofrecían “menos control del que queríamos”. Como señala Pandey: “Sentimos que no es la experiencia ideal tener herramientas precocinadas sin poder influir en su diseño”.

El desafío de autenticación va más allá de los flujos de OAuth. Cuando tu AI toca datos financieros, comunicaciones con clientes y sistemas críticos del negocio, la confianza se vuelve existencial. Pandey lo compara con “pasar tu tarjeta cuatro veces” en la caja, aunque sepas que solo te cobrarán una vez, la fricción genera duda.

De concepto a producción: el sprint de dos semanas

Tras una recomendación de Harrison Chase en LangChain, Tradestack evaluó Arcade.dev. La diferencia fue inmediata: implementación limpia de OAuth, control sobre el diseño de herramientas y, crucialmente, un equipo que entendía tanto el comportamiento de la AI como la seguridad empresarial.

“Nate y Mateo fueron muy útiles para resolver problemas rápidamente”, recuerda Pandey. “Pasamos de cero a dos toolkits en producción, Outlook y Xero, en pocas semanas”.

No se trataba solo de velocidad. Tradestack necesitaba infraestructura de nivel productivo desde el primer día:

Autorización empresarialNo solo “¿quién es este usuario?” sino “¿debería el agente de este usuario poder crear esta factura ahora?”
Permisos granulares: Agentes que pueden leer correos pero no borrarlos, responder solo a consultas de clientes, crear borradores de facturas pero no aprobar pagos
Señales de confianza para clientes: Usar la pantalla de autenticación de Arcade ayudó a establecer credibilidad. “Como dueño de negocio, no quieres que accedan a tu cuenta desde una app en la que no confías”, como lo dice Pandey

Construir para el mundo real, no para demos

El despliegue en producción de Tradestack reveló aprendizajes que solo surgen cuando los agentes se enfrentan a clientes reales:

1. Un OAuth limpio no es opcional “Tener una experiencia de OAuth muy limpia es fundamental para la confianza del cliente”, enfatiza Pandey. En la industria de la construcción en el Reino Unido, donde los dueños de negocio o sus equipos de TI deben aprobar el acceso al correo y los datos financieros son sagrados, cualquier fricción en la autenticación se convierte en un deal-breaker.

2. Calidad sobre cantidad en integraciones En lugar de perseguir números, Tradestack se enfocó deliberadamente en 4 o 5 toolkits profundamente integrados y de alta calidad que realmente importan en los flujos de trabajo de sus clientes. “No nos vemos agregando 20 toolkits por el simple hecho de hacerlo. Lo que sí vemos es invertir con cuidado en cuatro o cinco integraciones indispensables para nuestros usuarios. Eso es la esencia de lo que hemos aprendido, y por qué Arcade se siente como una plataforma sólida para construir capacidades de agentes. A diferencia de muchas plataformas que presumen miles de integraciones prefabricadas, el equipo de Arcade parece entender de forma única lo que llaman principios de ‘machine-experience’. Para nosotros, nuestro sistema necesita competencia real, no aparentar capacidad superficial. En el momento en que intentas automatizar de manera confiable incluso una sola tarea, te das cuenta de cuántos matices y casos borde deben manejarse con cuidado. En ese proceso, el diseño de herramientas, lo que consideramos un subconjunto del context engineering, emerge como una palanca decisiva de rendimiento. Siempre preferiríamos cuatro integraciones que funcionen de forma fluida e inteligente sobre cien a medias”.

3. Humano en el ciclo para acciones de alto riesgo: El HITL puede tomar muchas formas, pero Tradestack descubrió que el enfoque más valioso es cuando el agente sabecuándo pedir aprobación. Considera un flujo simple: convertir una consulta de cliente en una orden de trabajo una vez que se acepta la cotización. La mayoría de las veces no hace falta ninguna revisión humana. Pero cuando algo parece raro, digamos que el precio aprobado por el cliente no coincide con la cotización original, el alcance del trabajo cambió, o hay indicios de un duplicado, el sistema puede pausar y marcarlo para revisión. Incluso en tareas que pasan sin intervención, los usuarios pueden dar retroalimentación después, y el agente incorpora ese aprendizaje para el futuro. Con el tiempo, este ciclo de retroalimentación ayuda al sistema a reconocer qué llamadas a herramientas o escenarios son rutinarios y cuáles requieren criterio humano.

La ventaja arquitectónica

¿Qué le permitió a Tradestack moverse tan rápido manteniendo estándares empresariales? No tuvieron que resolver las incompatibilidades arquitectónicas fundamentales que arruinan el desarrollo de agentes:

Traducción LLM a API: Las herramientas de Arcade hablan “intenciones de LLM” en lugar de obligar a los agentes a navegar estructuras complejas de API
Autorización post-prompt: Las decisiones de seguridad se toman después de entender la intención del usuario, no antes
Infraestructura de producción: El despliegue, monitoreo y escalado los maneja la plataforma

Como explica Pandey, Tradestack veía a Arcade como su “MCP interno antes de que existiera MCP”, una plataforma central para crear, desplegar y gestionar todas las capacidades de los agentes.

Resultados: de WhatsApp y correo a acción empresarial

Hoy, la solución de Tradestack ayuda a contratistas del Reino Unido a delegar tareas críticas de oficina trasera mediante simples mensajes de WhatsApp y acceso a su bandeja de correo:

“Prepara un presupuesto para la conversión del ático en Islington y envíaselo a Michael para revisión”
“Genera las facturas de los trabajos completados la semana pasada y envíalas para pago”
“Revisa mi correo y asegúrate de que todas las facturas de proveedores estén registradas en Xero”

Cada solicitud activa acciones seguras y autorizadas en múltiples sistemas, todo funcionando de forma confiable en producción, no solo en demos cuidadosamente controladas. La capacidad de los dueños de negocio de mantener control claro sobre proyectos y finanzas, sabiendo que las tareas delegadas a Tradestack se ejecutan con confiabilidad y a tiempo, genera ganancias significativas de productividad en un sector que ha estado desatendido por mucho tiempo.

El camino a seguir: escalar inteligencia, no infraestructura

Con la autenticación y la infraestructura resueltas, Tradestack puede enfocarse en lo que realmente importa: construir mejor inteligencia para sus clientes. Su hoja de ruta incluye:

Contexto y memoria a largo plazo: Rastrear conversaciones de proyectos en múltiples plataformas
Optimización de trayectoria: Cachear flujos de trabajo consistentes (como cargas de facturas de proveedores) para una ejecución más rápida y confiable
Evaluación escalable: Pasar de pruebas manuales al seguimiento sistemático del rendimiento en distintos clientes y casos de uso

La lección: elige tus batallas

“La autorización es ciencia de cohetes”, como nos dijo un arquitecto empresarial. Tradestack tuvo éxito al reconocer esta verdad desde temprano y elegir una plataforma que ya la había resuelto.

Mientras el 70% de los proyectos de agentes de AI fracasan intentando reconstruir infraestructura de autenticación, Tradestack pasó de concepto a producción en dos semanas. No solo se movieron rápido: construyeron agentes de nivel productivo que manejan datos financieros, comunicaciones con clientes y operaciones del negocio con la seguridad y confiabilidad que sus clientes empresariales exigen.

¿La diferencia? Se enfocaron en construir inteligencia para contratistas del Reino Unido, no en pelear con flujos de OAuth y gestión de tokens. A veces la decisión arquitectónica más inteligente es saber qué no construir.

El asistente de AI de Tradestack está transformando la forma en que las empresas de construcción del Reino Unido gestionan sus operaciones. Aprende cómo puedes construir agentes de nivel productivo sin los dolores de cabeza de infraestructura en arcade.dev.