Un des changements les plus discrets mais les plus importants de ces deux dernières années : le coût d'usage des modèles de langage (LLMs) s'est effondré. Ce qui coûtait un euro pour un certain volume de traitement coûte aujourd'hui quelques centimes pour le même volume sur des modèles comparables en qualité.
Comment vérifier vous-même
Les tarifs des principaux fournisseurs (OpenAI, Anthropic, Google, Mistral) sont publics sur leurs sites respectifs. Il suffit de comparer les prix actuels à ceux archivés dans les annonces de lancement des modèles précédents pour voir la tendance. Tous les fournisseurs majeurs ont baissé leurs prix de manière significative sur 2023–2025.
Pourquoi les prix baissent
- Concurrence forte entre les fournisseurs de modèles (OpenAI, Anthropic, Google, acteurs open source...)
- Progrès matériels (GPUs plus performants, optimisations de l'inférence)
- Progrès algorithmiques (distillation, quantization, modèles plus petits aussi performants)
- Croissance du volume total qui permet d'amortir les coûts fixes
Ce que ça change concrètement
Un agent IA qui coûtait cher à faire tourner en 2023 tourne pour une fraction du prix aujourd'hui. Résultat : des cas d'usage qui étaient économiquement non viables pour une PME deviennent rentables. Traiter 10 000 emails par mois, qualifier des centaines de leads, analyser des contrats — tout ça est maintenant accessible à des budgets beaucoup plus modestes.
Les limites
Baisser le coût du modèle ne baisse pas le coût du projet dans les mêmes proportions. L'analyse métier, la définition des règles, les intégrations, les tests, le monitoring — ce sont des coûts humains qui n'ont pas bougé. Le coût du modèle représente rarement la majorité du budget d'un projet d'agent IA sérieux.
Ceci dit, la tendance est claire : déployer un agent IA coûte chaque année un peu moins cher, à périmètre égal. La fenêtre d'opportunité est ouverte.