Tool Search d'Anthropic : l'impact sur l'IA en production

J’étais récemment à Amsterdam pour rencontrer quelques-unes des plus grandes entreprises, et elles ont toutes soulevé le même défi : comment donner aux agents IA accès à davantage d’outils sans que tout parte en vrille ?

Le problème : dès qu’elles dépassent 20-30 outils, les coûts en tokens deviennent ingérables et la précision de sélection s’effondre. La douleur est si vive que beaucoup d’équipes ont tenté (sans succès) de bricoler leurs propres contournements avec des pipelines RAG, pour finalement se heurter à des murs de performance.

Voilà pourquoi le Tool Search Tool annoncé récemment par Anthropic m’enthousiasme autant : c’est une avancée majeure pour résoudre ce problème récurrent des agents IA.

Qu’a réellement publié Anthropic ?

Annoncé comme l’une des trois nouvelles fonctionnalités en bêta, leTool Search Toold’Anthropic permet aux modèles Claude de découvrir et charger dynamiquement des outils à la demande, plutôt que d’ajouter manuellement chaque définition d’outil dans la fenêtre de contexte au démarrage.

Avant, ces modèles devaient garder chaque outil possible en mémoire de travail en permanence. Désormais, ils peuvent déléguer ça et effectuer une recherche au moment où c’est nécessaire. C’est la différence entre tout retenir par cœur et consulter un dictionnaire. Comme votre cerveau, donner aux modèles Claude la capacité de ranger les outils dans un « dictionnaire » réduit la charge cognitive tout en améliorant la précision.

Voyons les deux contraintes principales que cela résout :

Gonflement des tokensDans leur annonce, Anthropic donne un exemple concret : imaginez un setup à cinq serveurs :

GitHub : 35 outils (~26 K tokens)
Slack : 11 outils (~21 K tokens)
Sentry : 5 outils (~3 K tokens)
Grafana : 5 outils (~3 K tokens)
Splunk : 2 outils (~2 K tokens)

Soit 58 outils consommant environ 55 K tokens avant même que la conversation ne commence. Ajoutez des serveurs comme Jira (qui seul utilise ~17 K tokens) et vous approchez rapidement les 100 K tokens de surcharge. Cette consommation impacte directement la latence des réponses et les coûts opérationnels.

Avant cette release, les agents commençaient à montrer des problèmes de fiabilité dès 20 outils environ. Pour mettre ça en perspective : le toolkit GitHub seul contient 18 outils, et Gmail en a 10 à 13. Cela créait des contraintes pratiques sévères : les organisations ne pouvaient pas déployer des agents capables de gérer plusieurs systèmes simultanément.

Précision : La précision de sélection des outils était une autre contrainte critique. Plus le nombre d’outils augmentait, plus la capacité du modèle à choisir le bon outil diminuait. Ce problème était particulièrement marqué quand les outils avaient des noms similaires ou des fonctionnalités qui se recoupaient.

Comment Anthropic a résolu ça pour Claude

La solution est simple : marquer les outils avecdefer_loading : true. Ces outils restent découvrables mais ne consomment pas de contexte tant que Claude n’en a pas réellement besoin. Claude effectue une recherche via regex ou classement par mots-clés (BM25), puis ne charge que ce dont il a besoin.

Les résultats parlent d’eux-mêmes : 85 % de réduction de l’utilisation des tokens tout en conservant accès à toute la bibliothèque d’outils, plus des améliorations significatives de précision sur les évaluations MCP, Opus 4 passant de 49 % à 74 % avec cette option activée.

Pourquoi ça nous enthousiasme chez Arcade.dev ?

Si cette capacité représente un bond en avant significatif, elle introduit simultanément des défis d’infrastructure critiques que les organisations doivent relever pour faire tourner et scaler des agents en production. Quand les agents accèdent à un nombre illimité d’outils, les entreprises doivent s’assurer qu’ils s’y connectent en sécurité, que les outils sont optimisés pour les agents, et qu’elles maintiennent gouvernance et contrôle à l’échelle. C’est là que le MCP runtime d’Arcade entre en jeu.

1. Autorisation sécurisée des agents

L’autorisation des agents est l’un des défis les plus difficiles à résoudre, et c’est pourquoi la plupart des projets IA ne dépassent jamais la démo mono-utilisateur. Arcade garantit que les agents peuvent agir sur n’importe quel système avec des permissions contrôlées et spécifiques à chaque utilisateur. Il s’intègre dans les flux OAuth, IDP et d’accès utilisateur existants, pour des contrôles granulaires sur vos agents dès le départ.

2. Outils optimisés pour les agents

La plupart des serveurs et outils MCP ne font que wrapper des API existantes, ce qui mène à une mauvaise précision et des utilisateurs mécontents. Vous pouvez donner à Claude accès à mille outils, mais s’ils sont mal construits, ça ne change rien. De mauvaises définitions d’outils entraînent de mauvaises sélections. Arcade propose le plus grand catalogue d’outils MCP optimisés pour les agents, clé en main. Nos outils surpassent la concurrence parce que nous avons fait le travail difficile de les rendre vraiment fonctionnels : pas simplement des wrappers d’API, mais des outils conçus spécifiquement pour gérer l’intention des agents, avec une meilleure fiabilité et des coûts réduits.

3. Gouvernance à l’échelle

Plus d’accès aux outils débloque plus de cas d’usage, ce qui signifie plus d’agents et plus d’équipes qui les déploient dans votre organisation. Cette prolifération d’agents et de MCP rend difficile de savoir si les équipes reconstruisent des serveurs existants ou cassent des workflows en poussant des mises à jour. Le MCP runtime d’Arcade centralise le contrôle et la gouvernance de tous vos outils MCP, améliore leur découverte et leur accès entre équipes, permet des tests et un versioning sécurisés, et offre la seule visibilité sur ce que chaque agent accède au nom de chaque utilisateur sur chaque service, accélérant ainsi les déploiements en production en toute confiance.

Limites du Tool Search à prendre en compte

Quelques limitations du Tool Search Tool d’Anthropic méritent d’être mentionnées.

D’abord, cet outil est exclusivement disponible pour Claude. Si vous utilisez Anthropic pour vos grands modèles mais un autre fournisseur pour vos petits modèles (un schéma courant), cette fonctionnalité ne fonctionnera pas des deux côtés. Ce sera aussi particulièrement problématique pour les équipes qui utilisent des agents de code ou des assistants IDE, où la fonctionnalité ne couvrira qu’un sous-ensemble des modèles disponibles.

Ensuite, le support des frameworks mettra du temps. En l’état, l’implémentation nécessite d’utiliser directement le SDK d’Anthropic avec des headers et flags bêta spéciaux. Cette capacité n’est pas encore supportée par LangChain ni d’autres frameworks populaires.

Il est temps de construire

Anthropic a contribué à éliminer une contrainte majeure sur les capacités des agents IA.

La vraie question n’est pas de savoir si votre agent peut accéder à mille outils, mais s’il le devrait, et si vous pouvez gérer ça de manière sûre et efficace, surtout quand les agents touchent à des systèmes de production critiques.

C’est là qu’Arcade entre en jeu. En tant que runtime pour MCP, Arcade est le seul à pouvoir offrir autorisation sécurisée des agents, outils haute précision et gouvernance centralisée. Nous vous donnons la capacité de déployer des agents IA multi-utilisateurs qui agissent sur n’importe quel système avec des permissions granulaires et une visibilité totale, sans infrastructure complexe.

Vous construisez des agents IA en production ? Essayez le MCP runtime d’Arcade gratuitement pour livrer plus vite et scaler avec contrôle.

Que signifie le Tool Search d'Anthropic pour Claude, concrètement pour vous ?

Qu’a réellement publié Anthropic ?

Comment Anthropic a résolu ça pour Claude