Calculator
Calculateur Coût Fine-tuning LLM
Calculez le coût de fine-tuning — tokens training × tarif au million, plus uplift par token sur l'inference du modèle custom.
Pricing refreshed: 2026-05-01
Total année 1 · cheapest
Fireworks · Llama 4 8B
$248
| Provider | Base model | Coût training | Inference mensuel | Total année 1 |
|---|---|---|---|---|
| Fireworks | Llama 4 8B | $8 | $20 | $248 |
| Together | Llama 4 8B LoRA adapter; full fine-tune more | $15 | $22 | $279 |
| Cohere | Command R | $30 | $48 | $606 |
| OpenAI | GPT-4o mini Inference is 2× base mini rate | $45 | $48 | $621 |
| Mistral | Mistral Small 3 $2/mo hosting per deployed adapter | $45 | $58 | $741 |
| Fireworks | Llama 4 70B | $45 | $90 | $1,125 |
| Together | Llama 3.3 70B | $75 | $88 | $1,131 |
| OpenAI | GPT-5 mini | $60 | $96 | $1,212 |
| Together | Llama 4 70B | $90 | $120 | $1,530 |
| OpenAI | o3-mini | $75 | $136 | $1,707 |
| AWS Bedrock | Claude Haiku 4.5 (custom) Provisioned throughput required | $120 | $303 | $3,756 |
| Mistral | Mistral Large 2 | $135 | $564 | $6,903 |
| OpenAI | GPT-4o Inference is 1.5× base GPT-4o rate | $375 | $600 | $7,575 |
Training cost = tokens × epochs × per-million rate. Inference uses the fine-tuned model's uplifted per-token rate, which is always higher than the base model. Year-1 total = one-time training + 12 months of inference.
Questions fréquentes
Quelle est la précision de ces calculateurs ?+
Les prix proviennent de la documentation officielle et sont mis à jour chaque mois. Les factures réelles peuvent varier de 5 à 15%.
Les prix sont-ils en USD ?+
Oui, tous les prix sont en USD selon la devise de facturation des fournisseurs.
À quelle fréquence les données sont-elles mises à jour ?+
Les tableaux de prix sont révisés et mis à jour le 1er de chaque mois.
Puis-je m'y fier pour mon budget ?+
Utilisez-les comme estimations. Pour la production, validez avec un pilote d'une semaine.