AITOT

Calculateur

Calculateur Coût Fine-tuning LLM

Calculez le coût de fine-tuning — tokens training × tarif au million, plus uplift par token sur l'inference du modèle custom.

Tarifs actualisés:

Le AITOT LLM Fine-tuning Cost calculator estime coût training + inference uplift pour modèles fine-tuned sur OpenAI (GPT-4o, GPT-4o-mini, o3), Anthropic Claude (invite-only), Google Vertex (Gemini), Together AI (LoRA pour Llama 4, Qwen, Mistral).

Training cost = training tokens × epochs × per-million rate. OpenAI GPT-4o-mini: $3/M training tokens. Together Llama 4 70B LoRA: $1.20/M. La plupart fine-tunes production tournent $50-$500 one-time.

Toggle epochs (default 3) et volume inference. Sous 10M tokens/mois, fine-tuning bat rarement prompts crafted. Au-dessus de 100M, fine-tuned smaller model bat larger model avec prompts 3-10×.

Total année 1 · moins cher

Fireworks · Llama 4 8B

$248

FournisseurModèle de baseCoût trainingInference mensuelTotal année 1
FireworksLlama 4 8B

≤16B LoRA SFT tier

$8$20$248
CohereCommand R$30$48$606
OpenAIGPT-4o mini

Stale — OpenAI moved to per-hour training 2026-05; verify pending

$45$48$621
MistralMistral Small 3

$2/mo hosting per deployed adapter

$45$58$741
FireworksLlama 4 70B

16-80B LoRA SFT tier

$45$90$1,125
TogetherLlama 3.3 70B

Legacy v3 line; verify pending 2026-05-18 — no longer top-listed on Together pricing

$75$88$1,131
OpenAIGPT-5 mini

Stale — OpenAI moved to per-hour training 2026-05; verify pending

$60$96$1,212
TogetherLlama 4 Maverick (LoRA SFT)

$16 minimum charge; Maverick = ~70B-class

$120$120$1,560
OpenAIo3-mini

Stale — OpenAI moved to per-hour training 2026-05; verify pending

$75$136$1,707
TogetherLlama 4 Maverick (LoRA DPO)$300$120$1,740
AWS BedrockClaude Haiku 4.5 (custom)

Provisioned throughput required

$120$303$3,756
MistralMistral Large 2$135$564$6,903
OpenAIGPT-4o

Stale — OpenAI moved to per-hour training 2026-05; verify pending

$375$600$7,575

Coût training = tokens × epochs × tarif par million. Inference utilise le tarif majoré du modèle fine-tuned, toujours supérieur au modèle de base. Total année 1 = training unique + 12 mois d'inference.

Ce que fait ce calculateur

Multi-fournisseur

OpenAI fine-tuning, Together LoRA, Vertex tuning, self-host estimates.

Training + inference split

Coût training one-time séparé du uplift mensuel.

Slider epochs

Default 3 epochs.

Modélisation inference uplift

Fine-tuned coûte 1.5-3× base.

Total année-1

Training one-time + 12 mois inference = un numéro budget.

LoRA vs full fine-tuning

LoRA Together 10× moins cher que full FT OpenAI.

Comparaison rapide

Fine-tuning 5M training tokens, 50M inference/mois, 3 epochs

FournisseurTraining CostInference UpliftTotal Année-1
Together Llama 4 70B (LoRA)$18+$50/mois$618
OpenAI GPT-4o-mini$45+$120/mois$1,485
Google Gemini 2.5 Flash tune$75+$150/mois$1,875
OpenAI GPT-4o$375+$1,200/mois$14,775
OpenAI o3$2,250+$3,500/mois$44,250

Année-1 = training + 12 × uplift mensuel.

Comment utiliser ce calculateur

Calculez coût training + inference uplift pour LLMs fine-tuned.

  1. 1

    Entrez training tokens

    Total tokens dans dataset training. 100 examples × 500 tokens = 50k.

  2. 2

    Set epochs

    Default 3. Plus de 4 typically overfittent.

  3. 3

    Estimez inference mensuel

    Combien de tokens fine-tuned model servira/mois.

  4. 4

    Comparez fournisseurs

    LoRA Together le moins cher; OpenAI full FT le plus cher.

Pourquoi utiliser ce calculateur

  • 5 fournisseurs rafraîchis mensuellement
  • Training + inference split
  • Comparaison LoRA vs full FT
  • Numéro budget année-1
  • Modélisation epoch + token
  • Sans login

Questions fréquentes

Combien coûte le fine-tuning d'un LLM en 2026 ?+
Coût training : 1M tokens × rate par million. OpenAI GPT-4o-mini fine-tuning : $3/M tokens training. Anthropic Claude Haiku fine-tuning (limité) : $5/M. Together AI Llama 4 70B LoRA : $1.20/M. La plupart des fine-tunes production coûtent $50–$500.
Quel est l'inference uplift des modèles fine-tuned ?+
Les fine-tuned coûtent 1.5–3× plus par token que le base en inférence. OpenAI GPT-4o-mini base : $0.15/M input. Fine-tuned : $0.30/M input. Planifie ça — fine-tune de haut volume n'économise que si tu changes aussi pour une classe de modèle plus petite.
Quand fine-tuning économise vs prompt engineering ?+
Break-even autour de 10M tokens/mois. En dessous, le fine-tuning bat rarement des prompts few-shot bien faits. Au-dessus de 100M avec tâche stable, un petit modèle fine-tuned bat souvent un grand avec prompts en coût total 3–10×.
Combien d'epochs pour fine-tune ?+
Default 3 epochs pour données instruction-style et 1–2 pour completion. Plus de 4 overfit généralement. Le calculateur multiplie tokens × epochs pour le total facturé — petits bumps en epochs ajoutent beaucoup de coût.
Puis-je fine-tune Claude ou seulement OpenAI ?+
OpenAI : fine-tuning GPT-4o, GPT-4o-mini et o3 en GA. Anthropic Claude par invitation en 2026. Google Vertex offre Gemini tuning. Together AI offre LoRA pour tous les open-weight majeurs. Self-host Axolotl + Modal est la voie la moins chère pour poids ouverts.
Combien de données de training pour un fine-tune efficace ?+
50–500 exemples curés pour style/format. 1,000–10,000 pour domain knowledge. Au-delà de 10,000, les gains plafonnent. La qualité bat la quantité — 100 exemples curés à la main battent souvent 5,000 bruts. Le token count compte pour le billing, pas la qualité.