AX Es el Nuevo DX: ElevenLabs sobre Agent Skills y MCP

¡Paul Asjes lleva años construyendo SDKs en Stripe y WorkOS. Ahora, como DevX Lead en ElevenLabs, está repensando qué significa la educación para desarrolladores cuando quien aprende es el agente de un desarrollador!

Este artículo está adaptado de una entrevista con Paul Asjes, DevX Lead en ElevenLabs.

Lo que preocupa a todas las empresas de herramientas para desarrolladores ahora mismo es que los modelos en los que corren los agentes se entrenan con datos fijos en el tiempo. Eso significa que pueden generar código perfectamente con conocimiento desactualizado, sin ninguna mala intención. El agente de un ingeniero podría generar código contra una superficie de API que no existe desde hace tres versiones, darle una experiencia rota y pasar a la siguiente herramienta. En pocas palabras: la experiencia del agente es ahora la experiencia del desarrollador.

Paul Asjes, DevX Lead en ElevenLabs, ha estado resolviendo este problema con un enfoque de tres partes: skills que enseñan a los agentes cómo razonar sobre tu producto, MCP tools que les dan acciones deterministas para ejecutar, y MCP apps que ofrecen a los desarrolladores interfaces plug-and-play para presentar a los usuarios. “Mi objetivo no es tanto la educación del desarrollador sino la educación del agente”, le dijo Paul a RL Nabors en una entrevista reciente para la serie MCP MVP de Arcade. “Porque los agentes son quienes escriben gran parte del código.”

Paul pasó años en Stripe y WorkOS, construyendo SDKs y creando el tipo de documentación que leen los humanos. Ahora la audiencia cambió. Esto es lo que aprendió sobre cómo construir para la nueva.

El problema de la brecha de conocimiento

Cuando un agente no sabe cómo hacer algo, rara vez busca educarse. Por la manera en que se entrenan los LLMs, hacen suposiciones.

Paul citó una investigación de OpenAI que encontró que los LLMs abordan las preguntas como un examen de opción múltiple. Al igual que el SAT u otras pruebas estandarizadas en preparatorias estadounidenses, estadísticamente es mejor para el modelo adivinar una respuesta que no dar ninguna. No responder siempre está mal, mientras que adivinar podría estar bien. Esto es fundamental en cómo funcionan los modelos actuales y no es un bug que se pueda parchar o eliminar con entrenamiento.

Para las empresas de APIs, esto significa que un agente que no fue entrenado con tu SDK más reciente generará con toda confianza código contra una superficie de API que quizá ya no existe. Cualquiera que le haya pedido a Claude construir algo con React y haya recibido patrones de React 18 (aunque React 19 sea la versión actual) ha vivido este dolor.

La industria ha intentado algunas soluciones. llms.txt permite que los sitios de documentación sirvan markdown sin procesar para que los agentes lo consuman. MCP servers dan a los agentes herramientas deterministas para llamar. Pero Paul y su equipo descubrieron algo contraintuitivo: darle a un agente un volcado masivo de toda tu documentación en realidad lo hace rendir peor que darle un subconjunto cuidadosamente seleccionado.

Tessl, una empresa que evalúa agent skills, confirmó este hallazgo en una entrevista con su CEO. Los agentes con acceso a instrucciones concisas y bien curadas superaron a los agentes con documentación completa. Sí existe algo como demasiada información para un LLM.

Skills: documentación para agentes

Una agent skill es un archivo markdown con instrucciones concisas optimizadas para que los agentes las sigan. Si eso suena poco impresionante, Paul lo reconoce: “Me sorprende que no hayamos pensado en esto antes.”

El formato de Agent Skills fue desarrollado originalmente por Anthropic y ahora lo adoptaron Microsoft, OpenAI, GitHub y otros. Estandariza cómo se empaquetan estas instrucciones. ElevenLabs ha publicado un conjunto de skills que cubren sus productos principales: texto a voz, voz a texto, agentes de voz, efectos de sonido y configuración de API keys.

Lo que distingue a las skills de la documentación normal es tanto lo que incluyen como lo que omiten. Las skills le dicen explícitamente a los agentes qué no hacer: “¡NO pongas la API key directamente en el código!”

Los agentes, a diferencia de los desarrolladores humanos, no infieren eso del contexto ni de la experiencia previa. Las skills están escritas para un lector brillante al seguir instrucciones y pésimo para el criterio.

Tools: llamadas a funciones deterministas para agentes

Paul traza una línea clara entre skills y MCP tools: “Las skills enseñan al agente cómo hacer una tarea. Los MCP tools le dan acciones deterministas para ejecutar.” Un MCP tool dice: “llama a esta función con este esquema JSON.” Una skill dice: “así debes pensar para construir una integración de texto a voz, aquí están los pasos, aquí están los errores comunes.” Uno maneja la ejecución; el otro maneja el razonamiento.

Los MCP Tools y los Agent Tools son complementarios. Un MCP tool puede evitar que un agente alucine el endpoint de API incorrecto, pero no puede evitar que pase parámetros sin sentido. Una skill puede enseñarle al agente cómo luce una solicitud sensata, pero el agente igual necesita ejecutarla.

MCP apps: UI para el usuario final

ElevenLabs también ha estado construyendo para el otro lado de la experiencia del agente. Paul construyó el ElevenLabs MCP Player, una MCP app disponible en Claude Desktop en su biblioteca de extensiones. Es un servidor MCP con una UI basada en React, así que cuando Claude genera audio, en lugar de solo devolver una ruta de archivo, muestra un reproductor de audio. Incluye controles de play, pausa, scrub, velocidad y repetición.

Esto es posible gracias a las MCP Apps (llamadas “MCP bundles” en la implementación de Claude), una evolución reciente del protocolo MCP que permite a los servidores renderizar UI junto con las respuestas de sus tools. Antes, toda interacción MCP era texto de entrada, texto de salida. Ahora puede ser texto (¡o voz!) de entrada, interfaz de salida.

Paul cree que esto es clave para llevar MCP más allá del público entusiasta. “Las MCP apps abren este mundo a personas no técnicas”, dijo. “No necesitas saber qué es un servidor MCP. Solo necesitas saber que esto hace que Claude haga las cosas mejor.”

Imagina algo como una app store para capacidades de agentes. Hoy, si quieres que Claude haga llamadas telefónicas con ElevenLabs, necesitas una cuenta de ElevenLabs, posiblemente una cuenta de Twilio, y los conocimientos técnicos para conectarlos. Una MCP app podría empaquetar todo eso en una sola app que alguien sin conocimientos técnicos puede instalar por 99 centavos. “Si le agregas dinero a la ecuación”, dijo Paul, “ahí es donde un ecosistema realmente prospera.”

El descubrimiento sigue siendo un desafío, sin embargo. Hay poco proceso de vetting para lo que entra a registros de skills como skills.sh, lo que significa que la inyección de prompts es un riesgo real en marketplaces como el de OpenClaw. El versionado de skills está mal documentado y si una skill queda desactualizada o necesita un fix de seguridad, no hay mecanismo para notificar a los usuarios. “Si no ejecutas npx skills updatenunca sabrás que tu skill está desactualizada.” Y los estándares competidores siguen siendo un problema, con Anthropic, OpenAI, Cursor y otros corriendo variantes de la misma idea.

“Me recuerda a esa tira clásica de XKCD,” dijo Paul. “Hay 14 estándares competidores, así que hacemos uno que cubre todos los casos de uso. Pronto hay 15 estándares competidores.”

La abstracción continúa

Paul ve el cambio de escribir código a gestionar agentes como el más reciente en una larga cadena de abstracciones: de las tarjetas perforadas a los teclados, de las GUIs al lenguaje natural. “Por una generación nos hemos inclinado hacia adelante, tratando de comunicarnos con la computadora en sus propios términos”, dijo. “Por primera vez, las computadoras se están inclinando en la dirección opuesta.”

No le sorprendería que escribir código se vuelva una actividad de revisión en pocos años y que el rol de “ingeniero de software” se transforme en uno de “gestión de agentes”. Es una afirmación que incomodará a algunos ingenieros, y Paul lo sabe. “Creo que eso solo va a empeorar/mejorar, dependiendo de tu punto de vista.”

Compartas o no ese timeline, las implicaciones prácticas para los equipos de developer experience ya están aquí. Si los agentes escriben la mayor parte del código de integración, entonces la calidad de tu documentación orientada a agentes, skills, MCP tools y mensajes de error importa tanto como tus videos y tutoriales orientados a humanos. Posiblemente más.

Pruébalo tú mismo

El ElevenLabs MCP Player está disponible ahora como extensión en Claude Desktop. Búscalo como “ElevenLabs” en los ajustes, bajo extensiones. El código fuente está abierto en github.com/elevenlabs/elevenlabs-mcp-player.

Para instalar las agent skills de ElevenLabs en tu agente de código, ejecuta npx @anthropic-ai/agent-skills install github:elevenlabs/skills. El repositorio de skills está en github.com/elevenlabs/skills. Si quieres evaluar skills antes de adoptarlas, el registro de Tessl ofrece puntuaciones de calidad en estructura, implementación y descubribilidad.

Sigue a ElevenLabs en Bluesky y X para actualizaciones, y encuentra a Paul en Bluesky y X.

MCP MVP es una serie de videos de Arcade.dev con RL Nabors que destaca a los constructores que dan forma al ecosistema agéntico. Mira la entrevista completa con Paul Asjes →

¿Quieres darle a tus agentes acceso autenticado a APIs sin gestionar tokens tú mismo? Mira cómo Arcade maneja OAuth para MCP tools.