Les sandboxes Daytona disponibles sur Arcade.dev

Les workflows agents les plus puissants ne vivent presque jamais dans un seul outil. Ils traversent plusieurs systèmes : l’agent récupère une tâche depuis Linear, clone un dépôt depuis GitHub, exécute du code dans un sandbox, poste les résultats sur Slack, puis rédige un rapport détaillé dans Google Docs. Le sandbox constitue le socle de calcul isolé, mais sa valeur se démultiplie quand il est orchestré de façon fluide avec tous les autres systèmes que l’agent doit solliciter.

Ce partenariat entre Arcade.dev, le runtime MCP qui gère l’autorisation et l’exécution des outils pour les agents IA en production, et Daytona apporte cette orchestration multi-systèmes. Le toolkit Daytona est disponible en tant qu’intégration Arcade Optimized ce qui signifie qu’il a traversé un processus d’ingénierie rigoureux : couverture complète des tests d’intégration, descriptions d’outils optimisées pour les agents, et gestion structurée des erreurs qui garantissent une exécution fiable et efficace sur les LLMs et les frameworks d’agents. Résultat : moins d’appels échoués, moins de tokens gaspillés, et un comportement d’agent plus prévisible.

46 outils, pensés pour le raisonnement des agents

Le Daytona toolkit by Arcade embarque 46 outils couvrant l’intégralité du cycle de vie du sandbox.

Fonctionnalités clés :

Gestion des sandboxes : Créer, démarrer, arrêter, archiver, redimensionner, supprimer et configurer des sandboxes. Définir des politiques d’arrêt et de suppression automatiques, et utiliser des labels pour l’organisation.
Exécution de code et de commandes shell : Exécuter du code directement dans l’interpréteur du sandbox ou lancer des commandes shell. Les sessions persistantes sont prises en charge pour les processus longs comme les serveurs de développement et les builds multi-étapes.
Système de fichiers : Lire, écrire, déplacer, supprimer, rechercher et remplacer des fichiers. Créer des répertoires, récupérer les métadonnées et paginer les arborescences de répertoires volumineuses.
Opérations Git : Cloner, brancher, committer, pousser, tirer, vérifier le statut et consulter les logs, avec un support complet du workflow de dépôt à l’intérieur des sandboxes.
Snapshots : Créer et gérer des templates de sandbox pour des environnements instantanément reproductibles.
SSH et réseau : Générer des credentials SSH, lister les ports actifs et obtenir les URL de prévisualisation des services web tournant dans les sandboxes.

La vraie avancée n’est pas le nombre d’outils, mais la conception technique qui les rend fiables au sein de workflows d’agents complexes.

Conçu pour les workflows d’agents

Créer 46 outils est un défi ; les faire fonctionner de façon fiable dans des workflows d’agents autonomes, longs et multi-étapes, c’est l’obstacle d’ingénierie ultime. Le toolkit apporte plusieurs fonctionnalités essentielles :

Résolution des sandboxes par nom : Les agents peuvent référencer les sandboxes naturellement par leur nom lisible, assigné à la création, sans avoir à suivre des IDs complexes et changeants tout au long du workflow.
Correspondance approximative avec suggestions : Si un agent fournit un nom de sandbox contenant une faute de frappe ou une troncature, le toolkit suggère les correspondances les plus proches, permettant à l’agent de se corriger et de continuer sans intervention humaine.
Récupération structurée sur erreur : Chaque réponse d’erreur est conçue pour être consommée par un LLM : des messages structurés qui expliquent clairement ce qui s’est passé et ce que l’agent devrait tenter ensuite. Les agents peuvent ainsi se rétablir proprement et maintenir les workflows en mouvement, sans tomber dans des impasses.
Descriptions d’outils optimisées pour le raisonnement LLM : Les descriptions d’outils et les schémas de paramètres suivent la méthodologie Agentic Tool Patterns, pensée pour la façon dont les modèles de langage sélectionnent et invoquent les outils. Des descriptions claires mènent à une meilleure sélection des outils, moins de paramètres hallucinés et une exécution multi-étapes plus fiable.

GitHub OAuth intégré

Les workflows d’agents impliquant des sandboxes nécessitent presque toujours des opérations Git. Le point de friction classique a toujours été l’authentification : comment l’agent obtient-il un token GitHub valide dans le sandbox exactement au moment où il en a besoin ?

Le Daytona toolkit by Arcade résout ça avec un GitHub OAuth juste-à-temps intégré directement dans les outils Git. Quand un agent déclenche une opération Git sur un remote GitHub, Arcade gère le flux OAuth de façon transparente. Concrètement :

Plus de Personal Access Tokens (PATs) à gérer
Plus de tokens à injecter dans les variables d’environnement
Plus de plomberie de credentials

L’utilisateur autorise une fois, et toutes les opérations Git suivantes sur n’importe quel sandbox fonctionnent sans rien faire. Pour les remotes non-GitHub, les credentials explicites restent supportés en fallback. Ce schéma n’est possible que parce que le runtime d’Arcade gère à la fois l’exécution des outils et la couche d’auth, combinant infrastructure sandbox et OAuth managé en un seul appel d’outil sécurisé.

Ce que vous pouvez construire

Les sandboxes Daytona, combinés au runtime d’Arcade et à son catalogue d’outils de haute qualité (GitHub, Linear, Slack, Google Docs et bien d’autres), ouvrent la voie à des workflows de développement entièrement autonomes :

CI intelligent : Analyser le diff d’une Pull Request (PR), n’exécuter que les tests affectés dans des sandboxes Daytona parallèles, et poster sur la PR des explications d’échec exploitables (et non des logs bruts).
Bisect de régression automatisé : Face à un test en échec, bisecte automatiquement l’historique des commits en créant un sandbox par révision en parallèle. Identifie le commit exact responsable de la régression et génère une explication lisible de la cause racine.
TODO-to-PR : Résorber la dette technique de façon systématique : scanner un dépôt pour les commentaires TODO, créer des sandboxes isolés pour implémenter chacun, lancer les tests et ouvrir des pull requests ciblées.
Refactoring continu : Détecter les points chauds de complexité, appliquer les refactorings dans des sandboxes isolés, vérifier que les tests passent, et ouvrir de petites PRs selon un calendrier récurrent. Le refactoring devient ainsi un processus de fond continu plutôt qu’un projet ponctuel.
Développement d’agents en toute sécurité : Donnez aux agents une autonomie totale dans des sandboxes jetables (clonage de dépôts, installation de dépendances, exécution de code arbitraire), sans aucun risque pour la production. La couche OAuth d’Arcade garantit qu’aucun token longue durée n’est exposé dans les variables d’environnement.

Pour commencer

Le toolkit Daytona est disponible dès maintenant en tant qu’intégration Arcade Optimized. Créez un compte Arcade pour commencer à utiliser les outils Daytona dans vos agents IA.

Ressources