Question 1

Berapa biaya fine-tune LLM 2026?

Accepted Answer

Biaya training: 1M token × rate per juta. OpenAI GPT-4o-mini fine-tuning: $3/M token training. Anthropic Claude Haiku fine-tuning (terbatas): $5/M. Together AI Llama 4 70B LoRA: $1.20/M. Mayoritas fine-tune produksi $50–$500.

Question 2

Berapa inference uplift model fine-tuned?

Accepted Answer

Fine-tuned biaya 1.5–3× per token vs base di inference. OpenAI GPT-4o-mini base: $0.15/M input. Fine-tuned: $0.30/M input. Rencanakan — fine-tune volume tinggi hemat hanya jika juga pindah ke class model lebih kecil.

Question 3

Kapan fine-tuning hemat vs prompt engineering?

Accepted Answer

Break-even sekitar 10M token bulan. Di bawah, fine-tuning jarang kalahkan prompt few-shot well-crafted. Di atas 100M dengan task definisi stabil, fine-tune model kecil sering kalahkan model besar dengan prompt 3–10× total cost.

Question 4

Berapa epoch sebaiknya fine-tune?

Accepted Answer

Default 3 epoch untuk data instruction-style dan 1–2 untuk data completion. Lebih dari 4 epoch biasanya overfit. Kalkulator kali token training × epoch untuk total billable — bump kecil di epoch tambah biaya signifikan.

Question 5

Bisakah fine-tune Claude atau hanya OpenAI?

Accepted Answer

OpenAI: fine-tuning GPT-4o, GPT-4o-mini, dan o3 GA. Anthropic Claude invite-only 2026. Google Vertex tawarkan Gemini tuning. Together AI tawarkan LoRA fine-tuning untuk semua open-weight major. Self-host Axolotl + Modal jalur termurah open weight.

Question 6

Berapa banyak data training untuk fine-tune efektif?

Accepted Answer

50–500 contoh kualitas tinggi untuk adaptasi style/format. 1,000–10,000 untuk domain knowledge. Di atas 10,000 contoh, gain plateau. Kualitas kalahkan kuantitas — 100 contoh curated tangan sering melewati 5,000 noisy. Token count untuk billing, bukan kualitas.

Provider	Model dasar	Biaya training	Inference bulanan	Total tahun 1
Fireworks	Llama 4 8B ≤16B LoRA SFT tier	$8	$20	$248
Cohere	Command R	$30	$48	$606
OpenAI	GPT-4o mini Stale — OpenAI moved to per-hour training 2026-05; verify pending	$45	$48	$621
Mistral	Mistral Small 3 $2/mo hosting per deployed adapter	$45	$58	$741
Fireworks	Llama 4 70B 16-80B LoRA SFT tier	$45	$90	$1,125
Together	Llama 3.3 70B Legacy v3 line; verify pending 2026-05-18 — no longer top-listed on Together pricing	$75	$88	$1,131
OpenAI	GPT-5 mini Stale — OpenAI moved to per-hour training 2026-05; verify pending	$60	$96	$1,212
Together	Llama 4 Maverick (LoRA SFT) $16 minimum charge; Maverick = ~70B-class	$120	$120	$1,560
OpenAI	o3-mini Stale — OpenAI moved to per-hour training 2026-05; verify pending	$75	$136	$1,707
Together	Llama 4 Maverick (LoRA DPO)	$300	$120	$1,740
AWS Bedrock	Claude Haiku 4.5 (custom) Provisioned throughput required	$120	$303	$3,756
Mistral	Mistral Large 2	$135	$564	$6,903
OpenAI	GPT-4o Stale — OpenAI moved to per-hour training 2026-05; verify pending	$375	$600	$7,575

Provider	Training Cost	Inference Uplift	Total Tahun-1
Together Llama 4 70B (LoRA)	$18	+$50/bulan	$618
OpenAI GPT-4o-mini	$45	+$120/bulan	$1,485
Google Gemini 2.5 Flash tune	$75	+$150/bulan	$1,875
OpenAI GPT-4o	$375	+$1,200/bulan	$14,775
OpenAI o3	$2,250	+$3,500/bulan	$44,250

Kalkulator Biaya Fine-tuning LLM

Yang dilakukan kalkulator ini

Multi-provider

Training + inference split

Slider epochs

Modeling inference uplift

Total tahun-1

LoRA vs full fine-tuning

Perbandingan cepat

Cara menggunakan kalkulator

Kenapa pakai kalkulator ini

Pertanyaan yang sering diajukan