Question 1

Comment prévoir mes dépenses LLM API sur 12 mois ?

Accepted Answer

Trois entrées : requêtes/mois (mois 1), pattern de croissance (flat/linéaire/exponentielle), et tokens moyens input/output par requête. Le calculateur projette mois par mois et le total année 1. Sauvegarde des scénarios pour comparer les choix de modèle côte à côte.

Question 2

Quel pattern de croissance utiliser — flat, linéaire ou exponentiel ?

Accepted Answer

Flat : outils internes stables ou B2B SaaS à l'échelle. Linéaire : produit croissant ~10% MoM. Exponentiel : startups pré-PMF ou consumer viral doublant chaque 1–2 mois. La plupart finissent entre linéaire et 1.3× exponentiel.

Question 3

GPT-5 ou Claude Sonnet 4.6 moins cher à 100M tokens/mois ?

Accepted Answer

À 100M tokens (80M input, 20M output) : GPT-5 $1,400/mois, Claude Sonnet 4.6 $540/mois — 60% d'écart. Sonnet 4.6 gagne sur le prix presque à toute échelle. Change sauf besoin spécifique de features GPT-5.

Question 4

Ce calculateur inclut-il les économies du prompt caching ?

Accepted Answer

Oui — active "cache hit rate". Anthropic facture 10% du prix input normal sur hit, OpenAI 50%, Google 25%. À 60% hit rate sur RAG, le coût input Anthropic baisse de 54%. Énorme pour les apps à system prompt long.

Question 5

Quelle précision a un forecast LLM 12 mois ?

Accepted Answer

Pour les 3 premiers mois : ±10% si ton estimation est réaliste. Pour les mois 6–12 : ±30% est normal car les prix changent et tu peux changer de modèle. Re-run mensuellement et fixe le scénario sauvegardé pour le reporting executive.

Question 6

Quel est le moyen le moins cher de servir 1B tokens LLM/mois ?

Accepted Answer

Trois voies : (1) DeepSeek V3 à $1.10/M output = ~$220/mois pour 200M output, (2) Together Llama 4 70B à $0.88/M = $176/mois, (3) self-host vLLM sur 4× H100 à $2.50/h = $7,200/mois plat (vaut au-dessus de ~3B tokens/mois). Le calculateur compare les trois.

Modèle	Mois-1	Total Année-1	vs Sonnet
Amazon Nova Lite	$10	$120	0.02×
DeepSeek V3	$80	$960	0.15×
Gemini 2.5 Flash	$74	$888	0.14×
Claude Haiku 4.5	$144	$1,728	0.27×
Claude Sonnet 4.6	$540	$6,480	1.00×
OpenAI GPT-5	$1,400	$16,800	2.59×
Claude Opus 4.7	$2,700	$32,400	5.00×

Estimateur mensuel d'API LLM

Ce que fait ce calculateur

Forecast mois-par-mois

Patterns croissance

Modélisation prompt cache

22 modèles comparés

Scenario saver

Année-1 cumulatif

Comparaison rapide

Comment utiliser ce calculateur

Pourquoi utiliser ce calculateur

Questions fréquentes