Pourquoi l'inférence IA est sous-tarifée en entreprise

En ce moment même, quelque part à San Francisco, une entreprise de modèles de fondation perd de l’argent en traitant votre appel API.

OpenAI a dépensé 8,67 milliards de dollars en inférence sur les neuf premiers mois de 2025, soit près du double de ses revenus sur la même période. Sam Altman a publiquement reconnu que les abonnements ChatGPT Pro à 200 dollars par mois leur coûtent plus qu’ils ne rapportent. Anthropic brûle 70 % de chaque dollar encaissé. Ces entreprises vendent leurs produits en dessous du prix de revient, subventionnées par la plus grande concentration de capital-risque de l’histoire de la tech, dans une course effrénée à la part de marché avant que la musique ne s’arrête.

Au DealBook Summit de décembre, le PDG d’Anthropic Dario Amodei a été direct : « Il y a des acteurs qui jouent à quitte ou double, et ça m’inquiète vraiment. » Il ne parlait pas de scepticisme envers l’IA. Il alertait sur le risque de timing : des entreprises qui parient juste sur l’impact futur de l’IA, mais faux sur le moment où l’économie sera viable.

Voilà ce que la plupart des analyses sur l’avertissement de Dario ratent : l’instabilité de la couche des modèles de fondation est une opportunité pour la couche applicative. Si vous construisez des agents IA pour des workflows d’entreprise, vous n’êtes pas exposé à ce risque de timing. Vous en bénéficiez. Chaque agent déployé aujourd’hui tourne sur du compute subventionné, payé par des investisseurs qui ne reverront peut-être jamais leur mise.

La question stratégique n’est pas de savoir s’il faut construire. C’est comment construire : assez vite pour capter de la valeur pendant la fenêtre de subvention, assez solide pour survivre à la consolidation qui vient.

La fenêtre de subvention

Regardons les chiffres qui définissent le moment présent.

OpenAI a généré environ 4,3 milliards de dollars au premier semestre 2025 et projette environ 13 milliards sur l’année. Face à ces revenus, les dépenses atteignent environ 22 milliards (un écart de 9 milliards financé par les investisseurs). Les pertes cumulées de 2023 à 2028 sont projetées à 44 milliards. La rentabilité n’est pas attendue avant 2029 ou 2030.

La trajectoire d’Anthropic est similaire dans sa forme, même si plus modeste : environ 3 milliards de cash brûlé par an, pour des revenus annualisés qui ont atteint 5 milliards en août 2025. L’objectif est l’équilibre en 2028, soit deux ans avant OpenAI, mais encore trois ans à attendre.

David Cahn de Sequoia a chiffré l’écart à l’échelle du secteur : 600 milliards de dollars entre ce que les entreprises IA doivent générer pour justifier leurs investissements en infrastructure et ce qu’elles encaissent réellement. Cet écart s’est creusé, pas réduit, à mesure que les dépenses s’accélèrent.

Qu’est-ce que cela signifie concrètement ? Que l’inférence est mal tarifée. Quand OpenAI vous facture un appel API, il ne vous facture pas ce que cet appel lui coûte : il facture ce qui, selon lui, maximisera l’adoption pendant la course à la montée en charge. La différence entre le prix et le coût, c’est votre subvention, financée par SoftBank, Microsoft, Sequoia et une constellation d’investisseurs qui parient que la part de marché d’aujourd’hui se transformera en pouvoir de fixation des prix demain.

Ce n’est pas un équilibre stable. Les subventions finissent toujours. Elles s’arrêtent quand les investisseurs perdent patience, quand les entreprises se font racheter, quand les marchés de capitaux se resserrent, ou quand les survivants ont assez de part de marché pour remonter leurs prix. La seule question, c’est quand.

La réalité de la consolidation

Le calcul ne tient pas avec cinq grands acteurs de modèles de fondation bien capitalisés. Ce n’est pas de la spéculation, c’est de l’arithmétique. Quand un secteur affiche 600 milliards de plus en coûts qu’en revenus, le résultat est la consolidation. Les entreprises fusionnent, se font racheter, pivotent ou disparaissent. L’infrastructure demeure ; certains acteurs, non.

L’avertissement « quitte ou double » de Dario est, implicitement, une prédiction sur cette consolidation. Certaines entreprises prennent des risques de timing qui ne paieront pas. Elles seront à court de capital avant que l’économie soit viable. Ce n’est pas une critique de l’IA : c’est reconnaître que la réalité financière finit toujours par s’imposer, quelle que soit la portée transformatrice de la technologie sous-jacente.

On a déjà vu ce schéma. Le déploiement de la fibre optique à la fin des années 1990 a mobilisé plus de 100 milliards de dollars dans des capacités qui dépassaient largement la demande à court terme. Des entreprises ont fait faillite. Des investisseurs ont tout perdu. Et pourtant, cette infrastructure est devenue l’épine dorsale de l’internet moderne. L’argent a largement été gaspillé pour ceux qui l’ont dépensé, mais les capacités ont tout rendu possible ensuite.

L’infrastructure IA suit une trajectoire similaire. Pour ceux qui construisent en entreprise, la question n’est pas de savoir si la purge arrive, mais comment se positionner pour y faire face.

Le problème du financement circulaire

Une dynamique mérite une attention particulière, car elle explique pourquoi les niveaux de dépenses actuels sont peut-être encore moins tenables qu’il n’y paraît.

Prenez la relation Nvidia-OpenAI. En septembre 2025, Nvidia a annoncé un investissement de 100 milliards de dollars dans OpenAI. OpenAI utilisera une part significative de ce capital pour acheter des GPU Nvidia. L’argent circule de Nvidia vers OpenAI, puis revient à Nvidia. Pendant ce temps, les autres investisseurs d’OpenAI (SoftBank, Microsoft et d’autres) financent également des achats de GPU qui alimentent Nvidia, dont la progression boursière justifie ensuite de nouveaux investissements dans l’IA.

Goldman Sachs a signalé cette circularité comme facteur de risque. La taille apparente du marché IA est peut-être gonflée par ce recyclage de capital à travers l’écosystème. Quand ce cycle ralentit, dès qu’un nœud majeur réduit ses dépenses, les effets se propagent à tout le système.

Ce n’est pas une raison d’éviter l’investissement en IA. C’est une raison de comprendre où vous vous situez dans la chaîne de valeur. Si vous êtes une entreprise de modèles de fondation, vous dépendez de la continuité de ce flux circulaire. Si vous construisez des applications par-dessus ces modèles, vous captez la valeur créée par ce flux sans être exposé à son interruption.

Les entreprises comme faiseurs de rois

Voici ce que les entreprises de modèles de fondation ont compris, et que la plupart des entreprises clientes ignorent encore : vos décisions d’adoption détermineront qui survivra.

Les revenus grand public (abonnements ChatGPT, comptes Claude Pro) ne combleront pas l’écart de 600 milliards. Les chiffres sont trop petits. Les contrats entreprise sont la seule voie vers une échelle de revenus qui justifie les dépenses d’infrastructure actuelles. OpenAI, Anthropic, Google et tous les autres acteurs de modèles de fondation le savent. C’est pourquoi ils constituent tous des équipes commerciales dédiées aux entreprises, visent la conformité SOC 2 et parlent de confidentialité des données.

L’objectif d’équilibre 2028 d’Anthropic repose sur une montée en charge des revenus entreprise qui ne s’est pas encore matérialisée. La projection de rentabilité 2029-2030 d’OpenAI part du même postulat. Ce ne sont pas de simples prévisions : ce sont des paris existentiels sur vos décisions d’achat.

Cela vous donne du levier. Les entreprises de modèles de fondation, désespérées de revenus enterprise, se battront agressivement pour votre business. Engagements pluriannuels, remises sur volume, fine-tuning personnalisé, support dédié : tout est négociable pour un client qui prouve que l’adoption en entreprise est réelle. Utilisez ce levier. Mais utilisez-le maintenant, pendant que la pression est maximale.

Le cadre stratégique : vitesse et résilience

En synthèse, l’impératif stratégique pour ceux qui construisent de l’IA en entreprise est double : avancer vite pendant que l’économie est favorable, tout en architecturant pour un monde où votre fournisseur de modèles de fondation pourrait ne plus exister dans trois ans, ou coûter trois fois plus cher.

Ce n’est pas une contradiction. C’est reconnaître que le moment actuel offre à la fois une opportunité (le compute subventionné) et un risque (l’instabilité des fournisseurs). La stratégie gagnante saisit l’opportunité tout en couvrant le risque.

Pour les DSI et les responsables technologiques : Les calculs de ROI que vous faites aujourd’hui sont artificiellement favorables. Les coûts d’inférence ne resteront pas aussi bas indéfiniment. Les projets qui semblent marginaux à 3x les coûts API actuels devraient être déprioritisés. Ceux qui fonctionnent même à des tarifs plus élevés devraient être accélérés. Et chaque négociation avec un fournisseur de modèles de fondation devrait tenir compte de votre levier en tant que client entreprise dont il a absolument besoin.

Pour les responsables IA/ML et les architectes : L’agnosticisme vis-à-vis des modèles n’est pas seulement une bonne pratique d’ingénierie, c’est de la gestion de risque existentiel. Construisez des couches d’abstraction. Utilisez des frameworks d’orchestration comme MCP et LangChain qui permettent de changer de modèle de fondation sans tout reconstruire. Vos architectures d’agents doivent traiter le modèle de fondation comme un composant remplaçable, pas comme un mur porteur. Le coût de migration que vous évitez aujourd’hui, c’est l’enfermement fournisseur qui pourrait vous paralyser quand la consolidation retarifie toute votre stack.

Pour les ingénieurs qui construisent des agents : Votre avantage concurrentiel n’est pas « on utilise GPT-4 » ou « on utilise Claude ». C’est « on a automatisé ce workflow et on sait l’améliorer en continu ». La connaissance institutionnelle, le prompt engineering, l’intégration avec les systèmes d’entreprise, les boucles de feedback qui améliorent les performances dans le temps : voilà ce qui résiste au turnover des modèles de fondation. Construisez des systèmes qui capturent la valeur du workflow. Pas des systèmes qui ne fonctionnent qu’avec les particularités d’un seul modèle.

Prédictions

Sur la base des données et dynamiques présentées, voici ce que nous anticipons pour les trois prochaines années :

Les prix de l’inférence vont se stabiliser ou augmenter d’ici 18 à 36 mois. La tarification actuelle reflète une stratégie de conquête de marché, pas une économie unitaire soutenable. À mesure que les contraintes de capital se resserreront ou que les survivants gagneront du pouvoir de marché, les prix remonteront vers le coût réel. La réduction de coût de 280x documentée par Stanford sur les deux dernières années va ralentir, à mesure que les gains d’efficacité deviennent plus difficiles et que les entreprises de modèles doivent montrer une trajectoire vers la rentabilité.

Au moins une grande entreprise de modèles de fondation sera confrontée à une crise de liquidité, un rachat ou un pivot majeur d’ici 2027. Le calcul l’exige. Tout le monde qui brûle des milliards par an ne trouvera pas un chemin viable. L’avertissement « quitte ou double » de Dario s’avérera prémonitoire pour au moins une entreprise précise. On ne prédit pas laquelle (trop de variables), mais l’issue à l’échelle de la catégorie est quasi certaine.

Les architectures agnostiques vis-à-vis des modèles deviendront le standard en entreprise d’ici 18 à 24 mois. Les early adopters construisent déjà de cette façon. À mesure que le risque de consolidation deviendra plus évident, les processus d’achat et de revue architecturale exigeront des capacités multi-modèles. Les fournisseurs proposant des couches d’orchestration et des frameworks d’abstraction verront la demande s’accélérer.

La couche agents et orchestration captera plus de valeur que la couche de fondation d’ici 2028. Cela reproduit le schéma du cloud computing, où les fournisseurs d’infrastructure opèrent sur des marges minces tandis que les fournisseurs d’applications, plus proches des problèmes métier, captent la majorité de la valeur. Les modèles de fondation se commoditisent plus vite que la plupart des observateurs ne l’anticipaient : Claude, GPT-4, Gemini et Llama sont de plus en plus interchangeables pour de nombreux cas d’usage en entreprise. La différenciation remonte dans la stack, vers l’automatisation des workflows, l’intégration d’outils et le fine-tuning spécifique aux entreprises.

La vitesse d’adoption en entreprise déterminera quels fournisseurs de modèles de fondation survivront. Les revenus grand public ne suffisent pas. Les 18 prochains mois distingueront les gagnants des perdants essentiellement sur la base de l’exécution commerciale en entreprise, pas de la performance des modèles. Les décisions de déploiement des F2000 sont, très littéralement, existentielles pour plusieurs entreprises de modèles de fondation.

L’opportunité dans l’instabilité

Chaque grande transition technologique crée une période d’instabilité où l’économie ne tient pas encore vraiment. La bulle ferroviaire. La purge automobile. Le crash des dot-com. Le gonflement de la fibre. À chaque fois, l’infrastructure a perduré et permis une création de valeur massive, juste pas toujours pour ceux qui l’avaient construite.

Nous sommes dans cette période pour l’IA. Les entreprises de modèles de fondation construisent de l’infrastructure à un rythme sans précédent, la subventionnent avec du capital investisseur, et la tarife en dessous du coût pour conquérir des parts de marché. Certaines échoueront ou seront rachetées. Les survivants auront finalement le pouvoir de fixer les prix.

Mais en ce moment précis, dans cette fenêtre spécifique, l’économie favorise les développeurs d’applications. Vous bénéficiez de milliards investis en infrastructure sans en supporter le coût. Vous accédez à une inférence tarifée pour la conquête de marché, pas pour la rentabilité. Vous avez des entreprises de modèles de fondation qui se battent pour vos contrats.

Dario a raison de s’inquiéter du risque de timing au niveau de la couche de fondation. C’est son problème à résoudre. Pour les entreprises qui construisent des agents et des workflows propulsés par l’IA, le risque de timing est inversé : le risque, ce n’est pas d’aller trop vite, c’est d’aller trop lentement et de rater la fenêtre de subvention.

Construisez agressivement. Construisez en mode agnostique. Captez la valeur des workflows pendant que le compute est bon marché. Et architecturez des systèmes qui prospéreront quelle que soit la liste des entreprises de modèles de fondation encore debout en 2028.

La bulle est réelle. Construisez dessus quand même.

Sources & méthodologie

Une note sur la qualité des données : ni OpenAI ni Anthropic ne publie de comptes audités. Les chiffres de cette analyse proviennent de documents divulgués rapportés par The Information, The Wall Street Journal et TechCrunch ; de déclarations de dirigeants dans des forums publics ; et d’estimations d’analystes de cabinets dont Sacra et Sequoia Capital. Ils doivent être compris comme des indicateurs directionnels plutôt que des données précises. Lorsque des chiffres sont interpolés ou contestés, cela est précisé dans le texte.

Sources principales :

Finances OpenAI : Reuters (revenus S1 2025), The Wall Street Journal (projections de dépenses), The Information (projections de pertes cumulées, documents divulgués), TechCrunch/The Register (analyse des coûts d’inférence via Ed Zitron)

Finances Anthropic : Reuters (ARR mai 2025), Goldman Sachs/PM Insights (ARR août 2025), The Wall Street Journal (projections d’équilibre, taux de burn)

Engagements en infrastructure : Annonces officielles et couverture ultérieure de CNBC, Bloomberg, NYT, The Wall Street Journal (Stargate, investissement Nvidia, accord Oracle, engagement Microsoft Azure)

Analyse sectorielle : Sequoia Capital (analyse de l’écart de revenus par David Cahn), Goldman Sachs Research (alertes ROI sur l’infrastructure IA), Stanford HAI (IA Index 2025, tendances des coûts d’inférence)

Déclarations de dirigeants : Sam Altman (économie de ChatGPT Pro, projections de revenus), Dario Amodei (DealBook Summit décembre 2025)

Mention légale : Cette analyse a été préparée par Arcade.dev, une plateforme runtime pour construire et opérer des agents IA multi-utilisateurs dans les systèmes d’entreprise. Nos produits comprennent une infrastructure pour construire des architectures d’agents agnostiques vis-à-vis des modèles. Nous avons des relations commerciales avec plusieurs fournisseurs de modèles de fondation et des clients entreprise. Notre perspective est informée par, et alignée avec, la thèse de la couche applicative en entreprise présentée dans cet article.