Calculateur
Comparateur de prix de tokens
Estimez le coût des tokens entrée/sortie sur OpenAI, Anthropic, Google, xAI, Mistral, avec économies de prompt cache.
Tarifs actualisés:
Le AITOT Token & Pricing Comparator vous laisse comparer coût par token sur 22 LLMs leaders en 2026 — incluant OpenAI GPT-5, Claude Opus 4.7, Gemini 2.5 Pro, Llama 4 70B, DeepSeek V3, Mistral Large 2, et Amazon Nova. Mettez votre moyenne tokens input/output, obtenez coût par request + mensuel côte à côte.
Les tokens output dominent la plupart des factures — coûtent 3-5× les input chez chaque fournisseur majeur. Le comparateur trie par coût total, pas tarif headline. Toggles prompt caching coupent coût input 60-90% sur Anthropic et 50% sur OpenAI.
Tout le pricing vient de documentation officielle et est rafraîchi le 1er de chaque mois. Factures réelles tombent dans 5-15% des estimés. Sans login; résultats calculent client-side.
Moins cher
Amazon · Nova Lite
$14.40
Par mois
| Fournisseur | Modèle | Entrée / 1M | Sortie / 1M | Par requête | Par mois |
|---|---|---|---|---|---|
| Amazon | Nova Lite | $0.06 | $0.24 | $0.0001 | $14.40 |
| OpenAI | GPT-5 nano | $0.05 | $0.40 | $0.0002 | $20.00 |
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 | $0.0002 | $24.00 | |
| Cohere | Command R | $0.15 | $0.60 | $0.0004 | $36.00 |
| Mistral | Mistral Small 3 | $0.20 | $0.60 | $0.0004 | $40.00 |
| DeepSeek | DeepSeek V3 | $0.27 | $1.10 | $0.0007 | $65.60 |
| OpenAI | GPT-5.4 nano | $0.20 | $1.25 | $0.0007 | $66.00 |
| Gemini 3.1 Flash-Lite | $0.25 | $1.50 | $0.0008 | $80.00 | |
| OpenAI | GPT-5 mini | $0.25 | $2.00 | $0.001 | $100.00 |
| Meta (Together) | Llama 4 70B | $0.88 | $0.88 | $0.0011 | $105.60 |
| Gemini 2.5 Flash | $0.30 | $2.50 | $0.0012 | $124.00 | |
| DeepSeek | DeepSeek R1 | $0.55 | $2.19 | $0.0013 | $131.60 |
| xAI | Grok 4 mini | $0.60 | $2.40 | $0.0014 | $144.00 |
| Amazon | Nova Pro | $0.80 | $3.20 | $0.0019 | $192.00 |
| OpenAI | GPT-5.4 mini | $0.75 | $4.50 | $0.0024 | $240.00 |
| Anthropic | Claude Haiku 4.5 | $1.00 | $5.00 | $0.0028 | $280.00 |
| Mistral | Mistral Large 2 | $2.00 | $6.00 | $0.004 | $400.00 |
| Meta (Together) | Llama 4 405B | $3.50 | $3.50 | $0.0042 | $420.00 |
| OpenAI | o3 | $2.00 | $8.00 | $0.0048 | $480.00 |
| Gemini 3.5 Flash | $1.50 | $9.00 | $0.0048 | $480.00 | |
| OpenAI | GPT-5 | $1.25 | $10.00 | $0.005 | $500.00 |
| Gemini 2.5 Pro | $1.25 | $10.00 | $0.005 | $500.00 | |
| Cohere | Command R+ | $2.50 | $10.00 | $0.006 | $600.00 |
| Gemini 3.1 Pro | $2.00 | $12.00 | $0.0064 | $640.00 | |
| OpenAI | GPT-5.4 | $2.50 | $15.00 | $0.008 | $800.00 |
| Gemini 2.5 Pro (long ctx >200K) | $2.50 | $15.00 | $0.008 | $800.00 | |
| Anthropic | Claude Sonnet 4.6 | $3.00 | $15.00 | $0.0084 | $840.00 |
| Anthropic | Claude Opus 4.8 | $5.00 | $25.00 | $0.014 | $1,400.00 |
| xAI | Grok 4 | $5.00 | $25.00 | $0.014 | $1,400.00 |
| OpenAI | GPT-5.5 | $5.00 | $30.00 | $0.016 | $1,600.00 |
| OpenAI | GPT-5.5 Pro | $30.00 | $180.00 | $0.096 | $9,600.00 |
Estimations uniquement. Les factures réelles peuvent varier de 5 à 15% selon le cache, le batching et la région.
Ce que fait ce calculateur
22 LLMs dans un tableau
GPT-5, Opus 4.7, Gemini 2.5 Pro, Llama 4, DeepSeek V3, Mistral, Nova, Cohere — tous comparables.
Modélisation prompt cache
Toggle cache hit rate 0-100% pour voir tarifs effectifs Anthropic (10% on hit), OpenAI (50%), Google (25%).
Per-request + per-month
Calculateur montre coût par request et total mensuel pour chaque modèle.
Workload presets
Chat, RAG, agent, summarization, code-gen presets prefixent ratios input/output réalistes.
Ratio output:input
Chat 4:1; code-gen 3:1; summarization 10:1. Slider pour votre workload.
Export + partage
Sauvegardez scénarios en localStorage, exportez CSV, partagez permalinks.
Comparaison rapide
Tarification tokens des top LLMs (par 1M tokens)
| Modèle | Input | Output | Blended 50:50 |
|---|---|---|---|
| Amazon Nova Lite | $0.06 | $0.24 | $0.15 |
| DeepSeek V3 | $0.27 | $1.10 | $0.69 |
| Gemini 2.5 Flash | $0.30 | $2.50 | $1.40 |
| GPT-5 mini | $0.40 | $1.60 | $1.00 |
| Claude Haiku 4.5 | $0.80 | $4.00 | $2.40 |
| Claude Sonnet 4.6 | $3.00 | $15.00 | $9.00 |
| OpenAI GPT-5 | $10.00 | $30.00 | $20.00 |
| Claude Opus 4.7 | $15.00 | $75.00 | $45.00 |
Output domine la plupart des workloads. Utilisez le calculateur avec votre ratio réel.
Comment utiliser ce calculateur
Estimez coût tokens input + output pour votre workload sur 22 LLMs en moins de 60 secondes.
- 1
Choisissez workload preset
Sélectionnez chat, RAG, agent, summarization, ou code-gen.
- 2
Set requests par mois
Volume mensuel attendu. Le calculateur scale coût à total mensuel.
- 3
Toggle prompt caching
Si system prompt est stable, set cache hit rate 50-80%.
- 4
Comparez et choisissez
Trier par coût mensuel. Choisir modèle moins cher qui répond au standard qualité.
Pourquoi utiliser ce calculateur
- ✓Gratuit à jamais — sans login, sans carte
- ✓22 LLMs rafraîchis mensuellement
- ✓Tourne client-side — inputs privés
- ✓Workload presets, pas moyennes génériques
- ✓Inclut prompt cache + batch discounts
- ✓Permalinks pour partage