Question 1

Combien coûte le fine-tuning d'un LLM en 2026 ?

Accepted Answer

Coût training : 1M tokens × rate par million. OpenAI GPT-4o-mini fine-tuning : $3/M tokens training. Anthropic Claude Haiku fine-tuning (limité) : $5/M. Together AI Llama 4 70B LoRA : $1.20/M. La plupart des fine-tunes production coûtent $50–$500.

Question 2

Quel est l'inference uplift des modèles fine-tuned ?

Accepted Answer

Les fine-tuned coûtent 1.5–3× plus par token que le base en inférence. OpenAI GPT-4o-mini base : $0.15/M input. Fine-tuned : $0.30/M input. Planifie ça — fine-tune de haut volume n'économise que si tu changes aussi pour une classe de modèle plus petite.

Question 3

Quand fine-tuning économise vs prompt engineering ?

Accepted Answer

Break-even autour de 10M tokens/mois. En dessous, le fine-tuning bat rarement des prompts few-shot bien faits. Au-dessus de 100M avec tâche stable, un petit modèle fine-tuned bat souvent un grand avec prompts en coût total 3–10×.

Question 4

Combien d'epochs pour fine-tune ?

Accepted Answer

Default 3 epochs pour données instruction-style et 1–2 pour completion. Plus de 4 overfit généralement. Le calculateur multiplie tokens × epochs pour le total facturé — petits bumps en epochs ajoutent beaucoup de coût.

Question 5

Puis-je fine-tune Claude ou seulement OpenAI ?

Accepted Answer

OpenAI : fine-tuning GPT-4o, GPT-4o-mini et o3 en GA. Anthropic Claude par invitation en 2026. Google Vertex offre Gemini tuning. Together AI offre LoRA pour tous les open-weight majeurs. Self-host Axolotl + Modal est la voie la moins chère pour poids ouverts.

Question 6

Combien de données de training pour un fine-tune efficace ?

Accepted Answer

50–500 exemples curés pour style/format. 1,000–10,000 pour domain knowledge. Au-delà de 10,000, les gains plafonnent. La qualité bat la quantité — 100 exemples curés à la main battent souvent 5,000 bruts. Le token count compte pour le billing, pas la qualité.

Fournisseur	Modèle de base	Coût training	Inference mensuel	Total année 1
Fireworks	Llama 4 8B ≤16B LoRA SFT tier	$8	$20	$248
Cohere	Command R	$30	$48	$606
OpenAI	GPT-4o mini Stale — OpenAI moved to per-hour training 2026-05; verify pending	$45	$48	$621
Mistral	Mistral Small 3 $2/mo hosting per deployed adapter	$45	$58	$741
Fireworks	Llama 4 70B 16-80B LoRA SFT tier	$45	$90	$1,125
Together	Llama 3.3 70B Legacy v3 line; verify pending 2026-05-18 — no longer top-listed on Together pricing	$75	$88	$1,131
OpenAI	GPT-5 mini Stale — OpenAI moved to per-hour training 2026-05; verify pending	$60	$96	$1,212
Together	Llama 4 Maverick (LoRA SFT) $16 minimum charge; Maverick = ~70B-class	$120	$120	$1,560
OpenAI	o3-mini Stale — OpenAI moved to per-hour training 2026-05; verify pending	$75	$136	$1,707
Together	Llama 4 Maverick (LoRA DPO)	$300	$120	$1,740
AWS Bedrock	Claude Haiku 4.5 (custom) Provisioned throughput required	$120	$303	$3,756
Mistral	Mistral Large 2	$135	$564	$6,903
OpenAI	GPT-4o Stale — OpenAI moved to per-hour training 2026-05; verify pending	$375	$600	$7,575

Fournisseur	Training Cost	Inference Uplift	Total Année-1
Together Llama 4 70B (LoRA)	$18	+$50/mois	$618
OpenAI GPT-4o-mini	$45	+$120/mois	$1,485
Google Gemini 2.5 Flash tune	$75	+$150/mois	$1,875
OpenAI GPT-4o	$375	+$1,200/mois	$14,775
OpenAI o3	$2,250	+$3,500/mois	$44,250

Calculateur Coût Fine-tuning LLM

Ce que fait ce calculateur

Multi-fournisseur

Training + inference split

Slider epochs

Modélisation inference uplift

Total année-1

LoRA vs full fine-tuning

Comparaison rapide

Comment utiliser ce calculateur

Pourquoi utiliser ce calculateur

Questions fréquentes