AITOT

Calculateur

Estimateur mensuel d'API LLM

Prévoyez les dépenses API sur 12 mois avec sauvegarde de scénarios.

Tarifs actualisés:

Le AITOT LLM API Monthly Cost Estimator forecast 12 mois de dépense sur OpenAI GPT-5, Claude Sonnet 4.6, Gemini 2.5 Pro, Llama 4, DeepSeek V3 et 17 autres modèles.

Le calculateur sort dépense mois-par-mois, total année-1 cumulé, et modèle le moins cher à votre échelle. Toggle prompt caching modèle 60-90% économies input Anthropic.

À 100M tokens/mois, Claude Sonnet 4.6 coûte $540/mois, GPT-5 $1,400/mois, DeepSeek V3 $80/mois. Le spread 17× est pourquoi le choix de modèle est le plus gros levier 2026.

Total année 1

Anthropic · Claude Sonnet 4.6

$36,529

Mois 1
100,000 req
$1,668$1,668
Mois 2
115,000 req
$1,918$3,586
Mois 3
130,000 req
$2,168$5,755
Mois 4
145,000 req
$2,419$8,173
Mois 5
160,000 req
$2,669$10,842
Mois 6
175,000 req
$2,919$13,761
Mois 7
190,000 req
$3,169$16,930
Mois 8
205,000 req
$3,419$20,350
Mois 9
220,000 req
$3,670$24,019
Mois 10
235,000 req
$3,920$27,939
Mois 11
250,000 req
$4,170$32,109
Mois 12
265,000 req
$4,420$36,529
MensuelCumulé

La prévision suppose un seul modèle principal. Pour les agents multi-modèles, exécutez plusieurs scénarios et additionnez.

Ce que fait ce calculateur

Forecast mois-par-mois

Courbe dépense 12 mois, pas juste total annuel.

Patterns croissance

Flat (B2B stable), linéaire (~10% MoM), exponentiel.

Modélisation prompt cache

Toggle hit rate pour tarifs effectifs.

22 modèles comparés

GPT-5, Claude, Gemini, Llama 4, DeepSeek, Mistral, Nova, Cohere.

Scenario saver

Sauvegardez multiples forecasts.

Année-1 cumulatif

Numéro headline pour meeting budget.

Comparaison rapide

Coût année-1 @ 100M tokens/mois, trafic flat, ratio 4:1

ModèleMois-1Total Année-1vs Sonnet
Amazon Nova Lite$10$1200.02×
DeepSeek V3$80$9600.15×
Gemini 2.5 Flash$74$8880.14×
Claude Haiku 4.5$144$1,7280.27×
Claude Sonnet 4.6$540$6,4801.00×
OpenAI GPT-5$1,400$16,8002.59×
Claude Opus 4.7$2,700$32,4005.00×

Assume 80M input + 20M output tokens/mois sans caching.

Comment utiliser ce calculateur

Projeter coût LLM API 12-mois sur 22 modèles avec modélisation growth.

  1. 1

    Entrez volume mois-1

    Set requests pour premier mois. Soyez réaliste.

  2. 2

    Choisissez pattern growth

    Flat, linéaire (10% MoM), ou exponentiel.

  3. 3

    Set tokens par request

    Moyenne input + output. Chat ~2k in / 400 out.

  4. 4

    Sauvegardez et comparez

    Sauvegardez multiples modèles pour comparer année-1.

Pourquoi utiliser ce calculateur

  • 22 modèles trackés mensuellement
  • Modélisation pattern growth
  • Prompt cache + batch discounts
  • Sauvegarde + compare scénarios
  • Toggle inference tax
  • Sans login

Questions fréquentes

Comment prévoir mes dépenses LLM API sur 12 mois ?+
Trois entrées : requêtes/mois (mois 1), pattern de croissance (flat/linéaire/exponentielle), et tokens moyens input/output par requête. Le calculateur projette mois par mois et le total année 1. Sauvegarde des scénarios pour comparer les choix de modèle côte à côte.
Quel pattern de croissance utiliser — flat, linéaire ou exponentiel ?+
Flat : outils internes stables ou B2B SaaS à l'échelle. Linéaire : produit croissant ~10% MoM. Exponentiel : startups pré-PMF ou consumer viral doublant chaque 1–2 mois. La plupart finissent entre linéaire et 1.3× exponentiel.
GPT-5 ou Claude Sonnet 4.6 moins cher à 100M tokens/mois ?+
À 100M tokens (80M input, 20M output) : GPT-5 $1,400/mois, Claude Sonnet 4.6 $540/mois — 60% d'écart. Sonnet 4.6 gagne sur le prix presque à toute échelle. Change sauf besoin spécifique de features GPT-5.
Ce calculateur inclut-il les économies du prompt caching ?+
Oui — active "cache hit rate". Anthropic facture 10% du prix input normal sur hit, OpenAI 50%, Google 25%. À 60% hit rate sur RAG, le coût input Anthropic baisse de 54%. Énorme pour les apps à system prompt long.
Quelle précision a un forecast LLM 12 mois ?+
Pour les 3 premiers mois : ±10% si ton estimation est réaliste. Pour les mois 6–12 : ±30% est normal car les prix changent et tu peux changer de modèle. Re-run mensuellement et fixe le scénario sauvegardé pour le reporting executive.
Quel est le moyen le moins cher de servir 1B tokens LLM/mois ?+
Trois voies : (1) DeepSeek V3 à $1.10/M output = ~$220/mois pour 200M output, (2) Together Llama 4 70B à $0.88/M = $176/mois, (3) self-host vLLM sur 4× H100 à $2.50/h = $7,200/mois plat (vaut au-dessus de ~3B tokens/mois). Le calculateur compare les trois.