Quand les outils flanchent : MCP robuste avec Temporal

Melissa Herrera est Developer Advocate Senior chez Temporal. Elle a précédemment conçu des systèmes multi-agents chez DataStax et Langflow. Elle défend aujourd’hui une idée simple : la fragilité des chaînes d’appels d’outils agentiques est un problème résolu, à condition de traiter vos outils comme des workflows plutôt que comme des fonctions « tire-et-oublie ».

Cet article est adapté d’une interview MCP MVP avec Melissa Herrera, Developer Advocate Senior chez Temporal.

La plupart des workflows agentiques sont voués à l’échec à cause de l’inévitable accumulation des erreurs en cascade.

Si chaque étape d’un workflow agentique réussit 95 % du temps, une chaîne de cinq étapes ne réussit plus que 77 % du temps. Un workflow de vingt étapes tombe à 36 %. Ces échecs sont difficiles à détecter, car les agents produisent volontiers des résultats plausibles mais faux sur lesquels les étapes suivantes s’appuient, un phénomène que les chercheurs appellent amplification des erreurs. Plus la chaîne est longue, plus l’effondrement est certain.

Appliquez maintenant ce schéma aux outils MCP en production. Votre agent appelle un outil de réservation de vol, qui lui-même appelle une API de paiement qui expire. La chaîne s’effondre. Vous vous retrouvez dans un état irrécupérable : cartes à moitié débitées, réservations fantômes, invitations de calendrier pour des vols sans billet (histoire vraie).

Melissa Herrera, Developer Advocate Senior chez Temporal pense que la réponse était là depuis le début. Les ingénieurs en systèmes distribués avaient résolu ce problème bien avant le boom de l’IA. Le modèle Durable Execution de Temporal dote vos outils de points de contrôle, de relances automatiques et d’auto-réparation, transformant ainsi les échecs en cascade en échecs récupérables.

Forte de sa passion pour les jeux vidéo (Super Mario Bros. en tête), Melissa a expliqué à RL Nabors lors d’une interview pour la série MCP MVP d’Arcade : « Si votre code heurte un Goomba, Temporal vous ramène à votre dernière sauvegarde, pas au début du jeu. »

Ce que la durabilité veut vraiment dire

La durabilité, ou Durable Execution, garantit que votre code arrive à son terme, même quand des erreurs surviennent en chemin. Si une partie du processus casse, le système reprend là où il s’était arrêté. L’état et la progression sont préservés. Ce n’est pas un concept nouveau.

Temporal résout des problèmes de systèmes distribués depuis 2019, bien avant la vague actuelle de l’IA. Mais le principe redevient d’actualité parce que les agents IA ont exactement le même profil d’échec que n’importe quel système distribué : ils font des appels réseau, dépendent d’API externes et enchaînent des étapes non déterministes. La seule différence, c’est qu’à la place de microservices qui s’appellent entre eux, vous avez un LLM qui appelle des outils qui appellent des API.

« Tous ces patterns et ces problèmes de systèmes distribués réapparaissent simplement sous une forme différente », dit Melissa.

Les trois primitives de Temporal

L’architecture de Temporal repose sur trois briques fondamentales : Workflows, Activities et Workers.

Un Workflow est l’orchestrateur. Il définit ce qui doit se passer du début à la fin. Les Workflows sont déterministes : pour les mêmes entrées, ils produisent les mêmes sorties. C’est ce qui rend le rejeu et la récupération possibles.

Les Activities accueillent le travail non déterministe : appels API, requêtes de base de données, inférences LLM, exécutions d’outils. Tout ce qui peut échouer vit dans une Activity. Quand une Activity échoue, Temporal relance automatiquement avec des stratégies de backoff configurables. Le Workflow n’a pas à se préoccuper de l’échec : il voit simplement l’Activity finir par réussir (ou signaler un échec permanent après épuisement des tentatives).

Les Workers exécutent votre code. Ils interrogent Temporal pour obtenir des tâches, exécutent vos Workflows et Activities, et renvoient les résultats. Ils sont aussi stateless : si un Worker tombe, un autre reprend là où le premier s’était arrêté.

Écrivez votre logique métier dans un Workflow, placez vos effets de bord dans des Activities. Si l’exécution est interrompue, elle reprend depuis le dernier bon point de contrôle.

Les outils MCP comme Workflows Temporal

Pour illustrer ce que ça donne avec MCP, Melissa a fait une démo d’un outil météo connecté à Claude. Quand elle a demandé à Claude la météo à New York, la requête a transité par un serveur MCP où chaque outil était adossé à un Workflow Temporal. Dans l’interface de Temporal, on voyait le Workflow se lancer, l’Activity appeler l’API du National Weather Service, puis le résultat remonter vers Claude. Pour montrer le comportement de relance, Melissa a demandé la météo à Londres, une ville hors de la zone couverte par le National Weather Service. Distinction importante : Temporal est conçu pour gérer les échecs transitoires (coupures réseau, timeouts, API temporairement indisponible), ce genre de choses qui pourraient réussir si on réessaie.

Mais ici, l’échec était permanent : aucune relance n’allait faire en sorte que le National Weather Service couvre une ville non américaine. Temporal ne le savait pas d’emblée, donc il a fait exactement ce pour quoi il est conçu : il a relancé automatiquement 19 fois avant de conclure que l’échec ne disparaîtrait pas. Chaque tentative était journalisée, visible et inspectable dans l’interface de Temporal.

Quand il a finalement renoncé, il a échoué proprement avec un message d’erreur clair, sans perdre silencieusement le contexte ni planter en plein processus. C’est Temporal qui fonctionne normalement. La limite de relances est configurable : vous, le développeur, contrôlez toujours jusqu’où votre Workflow doit persister avant de s’arrêter.

Pour l’implémentation, vous définissez vos outils MCP sur un serveur MCP, puis vous enveloppez la logique des outils avec les décorateurs Workflow et Activity de Temporal. Le code du serveur MCP change à peine. Vous ajoutez un@workflow décorateur et déplacez vos appels API dans des@activity fonctions.

Signals, Queries et intervention humaine

Temporal dispose de deux primitives supplémentaires qui deviennent essentielles pour les agents long-running : Signals et Queries.

Un Signal permet d’envoyer des informations dans un Workflow en cours d’exécution depuis l’extérieur. Pour les agents, c’est le mécanisme d’intervention humaine. Imaginez un agent qui réserve un voyage en votre nom. Il trouve des vols, en choisit un, et avant de débiter votre carte, il envoie un Signal pour demander confirmation. Le Workflow se met en pause, attend votre accord, puis reprend. Si vous refusez, il revient à l’étape de recherche.

Un Query permet d’inspecter l’état d’un Workflow en cours sans l’interrompre. Où en est mon agent ? Quels outils a-t-il appelés ? Quel est l’état actuel de la réservation ? Ces questions trouvent une réponse à tout moment, sans affecter l’exécution.

« Ces Workflows long-running et ces agents long-running ont besoin d’un mécanisme de contrôle », dit Melissa. « Un Signal permet de fournir davantage d’informations à notre agent et éventuellement de le réorienter. Votre agent ne part plus dans tous les sens. »

RL a rattaché cela à un schéma plus large : l’avenir de l’interaction humain-agent, ce n’est pas la microgestion. C’est plutôt comme surveiller un enfant en bas âge. L’agent fonctionne en autonomie, mais il fait des points avec l’humain de temps en temps. Signals et Queries rendent ça possible sans rompre la continuité du Workflow.

Agents comme outils, outils comme agents

Les agents peuvent être exposés comme outils MCP pour que d’autres agents les appellent. La spécification MCP le permet, même si le pattern n’est pas encore largement adopté.

Melissa, qui a précédemment conçu des systèmes multi-agents chez Langflow, y voit l’architecture naturelle pour les workflows agentiques complexes. Vous avez un agent orchestrateur avec plusieurs sous-agents spécialisés dans sa boîte à outils : un pour la réservation de vols, un pour la gestion du calendrier, un pour les e-mails. Chaque sous-agent est son propre outil MCP, adossé à son propre Workflow Temporal. Si l’agent de réservation de vols échoue, seul ce Workflow relance. L’agent orchestrateur ne perd pas l’état de sa conversation.

« La frontière entre agents et outils commence à s’estomper », dit Melissa. « Tout agent spécialisé dans quelque chose peut aussi être un outil. Et quand vous placez chacun dans son propre Workflow Temporal, ils sont tous durables par défaut. »

C’est là que l’architecture de Temporal rapporte des dividendes composés. Au lieu d’un workflow monolithique et fragile, vous obtenez un arbre de Workflows indépendamment durables. Les échecs sont isolés. Les relances sont ciblées. Et l’ensemble du système est observable via l’interface de Temporal.

Les vieux problèmes reviennent

La discussion a pris un tour philosophique quand RL a établi un parallèle entre les patterns de systèmes distribués que Temporal résout et l’architecture terminal-mainframe des années 1980. Le cloud computing, c’est en un sens juste des terminaux qui se connectent à l’ordinateur de quelqu’un d’autre. Quand les besoins en traitement dépassent la capacité locale, le calcul migre hors du périphérique, et tous les problèmes de réseau, de fiabilité et de gestion d’état reviennent en force.

« Tout ce qui est vieux redevient nouveau », dit RL. « Si vous partez d’un point et que vous faites le tour d’un arbre, vous revenez à votre point de départ. La tech, c’est pareil. »

Melissa abonde. Les ingénieurs en agents IA redécouvrent les mêmes défis de systèmes distribués que les ingénieurs résolvent depuis des décennies. La différence, c’est que le « système distribué » inclut maintenant un LLM susceptible de faire quelque chose d’inattendu. Ce qui, si quoi que ce soit, rend la durabilité plus importante que jamais.

Essayez par vous-même

Le Temporal AI Cookbook contient la démo exacte montrée par Melissa, plus des recettes supplémentaires pour construire des agents durables avec Temporal. Commencez par là.

Pour aller plus loin sur l’architecture, lisez Building Long-Running Interactive MCP Tools with Temporal et Durable MCP : Using Temporal to Give Agentic Systems Superpowers sur le blog Temporal.

Si vous êtes à San Francisco en mai, Replay 2026 se tient du 5 au 7 mai au Moscone Center. Des intervenants d’Instacart, OpenAI, Alaska Airlines et bien d’autres. Utilisez le code MELISSA85 pour 85 % de réduction sur votre billet.

Les SDK officiels de Temporal prennent en charge sept langages de programmation. Démarrez sur temporal.io ou inscrivez-vous à Temporal Cloud avec 1 000 $ de crédits offerts. Pour vos questions et discussions, rejoignez le#topic-ai canal sur le Temporal Community Slack.

Suivez Melissa sur LinkedIn et sur GitHub.

MCP MVP est une série vidéo d’Arcade.dev avec RL Nabors qui met en lumière les bâtisseurs qui façonnent l’écosystème agentique. Regardez l’interview complète avec Melissa Herrera →