AITOT

Calculateur

Comparateur de prix de tokens

Estimez le coût des tokens entrée/sortie sur OpenAI, Anthropic, Google, xAI, Mistral, avec économies de prompt cache.

Tarifs actualisés:

Le AITOT Token & Pricing Comparator vous laisse comparer coût par token sur 22 LLMs leaders en 2026 — incluant OpenAI GPT-5, Claude Opus 4.7, Gemini 2.5 Pro, Llama 4 70B, DeepSeek V3, Mistral Large 2, et Amazon Nova. Mettez votre moyenne tokens input/output, obtenez coût par request + mensuel côte à côte.

Les tokens output dominent la plupart des factures — coûtent 3-5× les input chez chaque fournisseur majeur. Le comparateur trie par coût total, pas tarif headline. Toggles prompt caching coupent coût input 60-90% sur Anthropic et 50% sur OpenAI.

Tout le pricing vient de documentation officielle et est rafraîchi le 1er de chaque mois. Factures réelles tombent dans 5-15% des estimés. Sans login; résultats calculent client-side.

Moins cher

Amazon · Nova Lite

$14.40

Par mois

31 modèles
FournisseurModèleEntrée / 1MSortie / 1MPar requêtePar mois
AmazonNova Lite$0.06$0.24$0.0001$14.40
OpenAIGPT-5 nano$0.05$0.40$0.0002$20.00
GoogleGemini 2.5 Flash-Lite$0.10$0.40$0.0002$24.00
CohereCommand R$0.15$0.60$0.0004$36.00
MistralMistral Small 3$0.20$0.60$0.0004$40.00
DeepSeekDeepSeek V3$0.27$1.10$0.0007$65.60
OpenAIGPT-5.4 nano$0.20$1.25$0.0007$66.00
GoogleGemini 3.1 Flash-Lite$0.25$1.50$0.0008$80.00
OpenAIGPT-5 mini$0.25$2.00$0.001$100.00
Meta (Together)Llama 4 70B$0.88$0.88$0.0011$105.60
GoogleGemini 2.5 Flash$0.30$2.50$0.0012$124.00
DeepSeekDeepSeek R1$0.55$2.19$0.0013$131.60
xAIGrok 4 mini$0.60$2.40$0.0014$144.00
AmazonNova Pro$0.80$3.20$0.0019$192.00
OpenAIGPT-5.4 mini$0.75$4.50$0.0024$240.00
AnthropicClaude Haiku 4.5$1.00$5.00$0.0028$280.00
MistralMistral Large 2$2.00$6.00$0.004$400.00
Meta (Together)Llama 4 405B$3.50$3.50$0.0042$420.00
OpenAIo3$2.00$8.00$0.0048$480.00
GoogleGemini 3.5 Flash$1.50$9.00$0.0048$480.00
OpenAIGPT-5$1.25$10.00$0.005$500.00
GoogleGemini 2.5 Pro$1.25$10.00$0.005$500.00
CohereCommand R+$2.50$10.00$0.006$600.00
GoogleGemini 3.1 Pro$2.00$12.00$0.0064$640.00
OpenAIGPT-5.4$2.50$15.00$0.008$800.00
GoogleGemini 2.5 Pro (long ctx >200K)$2.50$15.00$0.008$800.00
AnthropicClaude Sonnet 4.6$3.00$15.00$0.0084$840.00
AnthropicClaude Opus 4.8$5.00$25.00$0.014$1,400.00
xAIGrok 4$5.00$25.00$0.014$1,400.00
OpenAIGPT-5.5$5.00$30.00$0.016$1,600.00
OpenAIGPT-5.5 Pro$30.00$180.00$0.096$9,600.00

Estimations uniquement. Les factures réelles peuvent varier de 5 à 15% selon le cache, le batching et la région.

Ce que fait ce calculateur

22 LLMs dans un tableau

GPT-5, Opus 4.7, Gemini 2.5 Pro, Llama 4, DeepSeek V3, Mistral, Nova, Cohere — tous comparables.

Modélisation prompt cache

Toggle cache hit rate 0-100% pour voir tarifs effectifs Anthropic (10% on hit), OpenAI (50%), Google (25%).

Per-request + per-month

Calculateur montre coût par request et total mensuel pour chaque modèle.

Workload presets

Chat, RAG, agent, summarization, code-gen presets prefixent ratios input/output réalistes.

Ratio output:input

Chat 4:1; code-gen 3:1; summarization 10:1. Slider pour votre workload.

Export + partage

Sauvegardez scénarios en localStorage, exportez CSV, partagez permalinks.

Comparaison rapide

Tarification tokens des top LLMs (par 1M tokens)

ModèleInputOutputBlended 50:50
Amazon Nova Lite$0.06$0.24$0.15
DeepSeek V3$0.27$1.10$0.69
Gemini 2.5 Flash$0.30$2.50$1.40
GPT-5 mini$0.40$1.60$1.00
Claude Haiku 4.5$0.80$4.00$2.40
Claude Sonnet 4.6$3.00$15.00$9.00
OpenAI GPT-5$10.00$30.00$20.00
Claude Opus 4.7$15.00$75.00$45.00

Output domine la plupart des workloads. Utilisez le calculateur avec votre ratio réel.

Comment utiliser ce calculateur

Estimez coût tokens input + output pour votre workload sur 22 LLMs en moins de 60 secondes.

  1. 1

    Choisissez workload preset

    Sélectionnez chat, RAG, agent, summarization, ou code-gen.

  2. 2

    Set requests par mois

    Volume mensuel attendu. Le calculateur scale coût à total mensuel.

  3. 3

    Toggle prompt caching

    Si system prompt est stable, set cache hit rate 50-80%.

  4. 4

    Comparez et choisissez

    Trier par coût mensuel. Choisir modèle moins cher qui répond au standard qualité.

Pourquoi utiliser ce calculateur

  • Gratuit à jamais — sans login, sans carte
  • 22 LLMs rafraîchis mensuellement
  • Tourne client-side — inputs privés
  • Workload presets, pas moyennes génériques
  • Inclut prompt cache + batch discounts
  • Permalinks pour partage

Questions fréquentes

Comment comparer les tarifs de tokens LLM entre fournisseurs en 2026 ?+
Saisis ton volume moyen de tokens input + output par requête et le volume mensuel. Le comparateur calcule le coût par requête et mensuel sur 22 modèles — OpenAI GPT-5, Claude Opus 4.7, Gemini 2.5 Pro, Llama 4, Mistral, DeepSeek, Amazon Nova et plus. Trie par output rate car l'output domine la facture en production.
Quel LLM a les tokens de sortie les moins chers en 2026 ?+
Amazon Nova Lite à $0.24 par million de tokens output est le moins cher en production-grade. DeepSeek V3 à $1.10 et Gemini 2.5 Flash à $2.50 suivent. Évite Claude Opus 4.7 ($75/M output) sauf besoin spécifique de qualité de raisonnement.
Combien le prompt cache réduit ma facture LLM ?+
Pour des workloads RAG avec system prompt stable, le prompt caching réduit le coût input 60–90% sur Anthropic, 50% sur OpenAI, 75% sur Google. Le cache hit rate steady-state réel est 50–70%. Ajuste le slider "% input cached" pour voir ton prix effectif.
Pourquoi l'output coûte plus que l'input sur tous les modèles ?+
La génération output est séquentielle — chaque token requiert un forward pass complet. Les tokens input sont traités en parallèle. L'output est aussi memory-bandwidth-bound sur les grands modèles. La plupart des fournisseurs facturent 3–5× plus l'output pour refléter le GPU time réel.
Ce calculateur inclut-il le rabais Batch API ?+
Non — il affiche les prix API real-time. Pour des workloads non-temps-réel (résumé nocturne, content moderation backfill), OpenAI et Anthropic offrent 50% off via Batch API. Soustrais 50% du coût affiché si ton trafic peut attendre 24h.
Quel modèle offre la meilleure qualité par dollar en 2026 ?+
Claude Sonnet 4.6 ($3 input, $15 output) et GPT-5 mini ($0.40 input, $1.60 output) dominent les benchmarks price-performance. Pour le coding, Claude Sonnet 4.6 gagne sur SWE-bench. Pour le chat général, Gemini 2.5 Flash est le défaut pas-cher-mais-capable à $0.30/$2.50.