Question 1

¿Cuánto cuesta hacer fine-tuning de un LLM en 2026?

Accepted Answer

Coste training: 1M tokens × rate por millón. OpenAI GPT-4o-mini fine-tuning: $3/M tokens training. Anthropic Claude Haiku fine-tuning (limitado): $5/M. Together AI Llama 4 70B LoRA: $1.20/M. La mayoría de fine-tunes producción cuestan $50–$500.

Question 2

¿Cuál es el inference uplift de modelos fine-tuned?

Accepted Answer

Los fine-tuned cuestan 1.5–3× más por token que el base en inferencia. OpenAI GPT-4o-mini base: $0.15/M input. Fine-tuned: $0.30/M input. Planéalo — fine-tune de alto volumen solo ahorra si además cambias a una clase de modelo más pequeña.

Question 3

¿Cuándo fine-tuning ahorra vs prompt engineering?

Accepted Answer

Break-even alrededor de 10M tokens/mes. Por debajo, fine-tuning raramente gana a prompts few-shot bien diseñados. Sobre 100M con tarea estable, un modelo pequeño fine-tuned suele ganar al grande con prompts por 3–10× coste total.

Question 4

¿Cuántos epochs hacer en fine-tuning?

Accepted Answer

Default 3 epochs para datos instruction-style y 1–2 para completion. Más de 4 suele overfittear. La calculadora multiplica tokens × epochs — pequeños bumps en epochs suman mucho coste.

Question 5

¿Puedo hacer fine-tune de Claude o solo OpenAI?

Accepted Answer

OpenAI: fine-tuning GPT-4o, GPT-4o-mini y o3 en GA. Anthropic Claude por invitación en 2026. Google Vertex tiene tuning de Gemini. Together AI ofrece LoRA para todos los open-weight grandes. Self-host Axolotl + Modal es el camino más barato para pesos abiertos.

Question 6

¿Cuántos datos necesito para fine-tune efectivo?

Accepted Answer

50–500 ejemplos curados para estilo/formato. 1,000–10,000 para domain knowledge. Sobre 10,000 ejemplos las ganancias se estancan. Calidad gana cantidad — 100 ejemplos curados a mano suelen superar 5,000 ruidosos. El token count importa para billing, no para calidad.

Proveedor	Modelo base	Costo training	Inference mensual	Total año 1
Fireworks	Llama 4 8B ≤16B LoRA SFT tier	$8	$20	$248
Cohere	Command R	$30	$48	$606
OpenAI	GPT-4o mini Stale — OpenAI moved to per-hour training 2026-05; verify pending	$45	$48	$621
Mistral	Mistral Small 3 $2/mo hosting per deployed adapter	$45	$58	$741
Fireworks	Llama 4 70B 16-80B LoRA SFT tier	$45	$90	$1,125
Together	Llama 3.3 70B Legacy v3 line; verify pending 2026-05-18 — no longer top-listed on Together pricing	$75	$88	$1,131
OpenAI	GPT-5 mini Stale — OpenAI moved to per-hour training 2026-05; verify pending	$60	$96	$1,212
Together	Llama 4 Maverick (LoRA SFT) $16 minimum charge; Maverick = ~70B-class	$120	$120	$1,560
OpenAI	o3-mini Stale — OpenAI moved to per-hour training 2026-05; verify pending	$75	$136	$1,707
Together	Llama 4 Maverick (LoRA DPO)	$300	$120	$1,740
AWS Bedrock	Claude Haiku 4.5 (custom) Provisioned throughput required	$120	$303	$3,756
Mistral	Mistral Large 2	$135	$564	$6,903
OpenAI	GPT-4o Stale — OpenAI moved to per-hour training 2026-05; verify pending	$375	$600	$7,575

Proveedor	Training Cost	Inference Uplift	Total Año-1
Together Llama 4 70B (LoRA)	$18	+$50/mes	$618
OpenAI GPT-4o-mini	$45	+$120/mes	$1,485
Google Gemini 2.5 Flash tune	$75	+$150/mes	$1,875
OpenAI GPT-4o	$375	+$1,200/mes	$14,775
OpenAI o3	$2,250	+$3,500/mes	$44,250

Calculadora Costo Fine-tuning LLM

Qué hace esta calculadora

Multi-proveedor

Training + inference split

Slider epochs

Modelado inference uplift

Total año-1

LoRA vs full fine-tuning

Comparación rápida

Cómo usar esta calculadora

Por qué usar esta calculadora

Preguntas frecuentes