5 mai 20269 min de lecture

La token anxiety n'est pas un problème de budget. C'est un problème d'architecture.

On a ouvert les vannes. On n'a pas architecturé les canaux. Chaque token consommé sans structure est un token qui finance l'oubli.

Il n'a jamais été aussi facile de justifier un investissement IA.

Les budgets s'ouvrent. Les équipes expérimentent. Les use cases se multiplient. Et dans chaque Excom, la même conviction rassurante : on prend de l'avance.

Mais prendre de l'avance suppose qu'on accumule quelque chose.

Et c'est là que la question silencieuse émerge — celle que presque personne ne pose encore clairement : est-ce qu'on accumule, ou est-ce qu'on consomme ?

I — Le signal que personne ne veut nommer

Il y a un terme qui circule dans les équipes tech depuis quelques mois. Un terme discret, presque honteux, qu'on prononce rarement en Excom mais qu'on ressent partout : la token anxiety.

Cette angoisse sourde devant des budgets LLM qui grossissent sans ROI visible. Cette question qui monte — doucement d'abord, puis de plus en plus fort — sur ce que tout cela produit de durable.

Les chiffres sont déjà là. Selon Kong Inc. (2024), 72% des entreprises anticipent une nouvelle hausse de leur spend LLM. 73% dépensent déjà plus de 50 000 $ par an. 37% dépassent 250 000 $. Selon Menlo Ventures (2024), l'enterprise spend LLM est passé de 3,5 milliards à 8,4 milliards de dollars en six mois.

Ce n'est pas une tendance. C'est une accélération.

Et dans cette accélération, une vérité inconfortable commence à apparaître : la token anxiety n'est pas un problème de coût. C'est le symptôme d'une architecture qui n'a pas été pensée pour capitaliser ce qu'elle produit.

II — Produire n'est pas accumuler

Nous avons confondu deux choses qui se ressemblent dans les dashboards, mais ne se ressemblent pas dans les bilans à trois ans.

Produire de l'intelligence. Et l'accumuler.

Dans la plupart des organisations, l'IA a transformé la production. Les analyses sortent plus vite. Les synthèses se génèrent en minutes. Les équipes font en une heure ce qui prenait une semaine.

Mais voilà ce qu'on observe réellement sur le terrain : chaque session repart de zéro. Chaque équipe reconstruit ce qu'une autre a déjà généré. Les insights produits hier n'alimentent pas les décisions d'aujourd'hui. L'intelligence ne se sédimente nulle part.

Les individus apprennent. Les dossiers avancent. L'organisation, elle, recommence.

La différence est subtile. Elle est pourtant structurante.

L'IA sans architecture ne scale pas l'intelligence. Elle scale l'amnésie.

III — Le défaut invisible : ce que l'IA amplifie sans le résoudre

On pensait que le principal goulot d'étranglement stratégique était la production d'insight. Ce n'est plus le cas.

Le time-to-insight s'est effondré. Mais le problème s'est déplacé — vers quelque chose de plus fondamental, et de beaucoup moins visible : la capacité à transformer ce qui est produit en capital cumulatif.

La rareté n'est plus la donnée. La rareté est la cohérence dans le temps.

Et c'est précisément là que l'IA amplifie le défaut au lieu de le résoudre. Sans fondations structurées, plus l'IA génère — plus les versions se multiplient, plus les hypothèses divergent, plus la traçabilité devient complexe, plus la mémoire dépend d'individus plutôt que de l'institution.

On a ouvert les vannes. On n'a pas architecturé les canaux.

Chaque token consommé sans structure est un token qui finance l'oubli. On paie pour penser vite. On ne paie pas pour retenir.

IV — La différence entre une dépense et un investissement

Il y a deux types d'organisations en ce moment.

Celles qui ont déployé l'IA. Et celles qui ont architecturé pour qu'elle s'accumule.

Les premières produisent des outputs. Beaucoup. Et ils disparaissent avec la session qui les a générés.

Les secondes construisent autre chose : une mémoire institutionnelle qui se densifie à chaque usage. Chaque décision alimente la suivante. L'intelligence produite aujourd'hui enrichit le raisonnement de demain. L'avantage ne vient pas du modèle utilisé — il vient de ce que le modèle produit de permanent.

C'est la différence entre une dépense et un investissement. Entre de la performance et du capital.

Une organisation qui analyse n'est pas nécessairement une organisation qui accumule. Accumuler suppose une couche que la plupart des organisations n'ont pas posée : celle qui décide ce que l'intelligence produite devient. Pas juste où elle est stockée. Ce qu'elle alimente ensuite.

Sans cela, chaque insight reste ponctuel. Et une succession d'insights ponctuels ne crée pas de mémoire stratégique. Elle crée une facture LLM qui grossit.

V — Ce que l'architecture change réellement

Le vrai ROI de l'IA ne se mesure pas à l'usage. Il se mesure à ce qui reste quand la session est fermée.

Le débat sur les modèles est déjà dépassé. Ce qui différencie n'est pas le LLM choisi. C'est ce que l'organisation a décidé de faire de ce qu'il produit.

Cela suppose un principe opérationnel clair : la liberté de modèle ne vaut rien sans la discipline de l'output. Peu importe quel LLM est appelé — ce qui sort doit être tracé, sourcé, structuré pour alimenter la décision suivante. Pas une réponse. Un actif.

C'est là que se joue le prochain différenciateur stratégique. Pas dans l'accès aux modèles — qui sera bientôt banalisé. Mais dans ce que certaines organisations auront sédimenté pendant que les autres consommaient.

VI — L'avantage qui ne se rattrape pas

La vitesse a longtemps été l'avantage. Produire plus vite. Décider plus vite. Réagir plus vite.

Demain, la vitesse sera un standard. Ce qui restera rare : la capacité à structurer durablement ce qui a été produit. À construire une infrastructure d'intelligence qui rend chaque analyse plus puissante que la précédente. Une trajectoire qui ne redémarre pas à chaque projet.

Les organisations qui résolvent ça maintenant ne seront pas juste plus efficaces. Elles seront structurellement inalignables par celles qui commenceront dans dix-huit mois.

Parce que l'avantage compétitif de l'IA ne se construit pas à l'usage. Il se construit dans l'architecture qui décide ce que l'usage produit de permanent.

Et dans un monde où tout s'accélère, ce qui se stabilise devient stratégique.

Conclusion

La token anxiety est un signal. Pas un problème de budget à optimiser.

C'est le signal que votre organisation a scalé l'IA avant de savoir ce qu'elle voulait en faire. Avant de décider ce que chaque token devait produire de durable.

La vraie question — pour une Direction Stratégique, un CDO, un Excom qui regarde grossir la facture LLM — n'est pas combien coûte l'IA. C'est combien de ce qu'elle produit survit à la session.