Calculator
Calculadora Costo Fine-tuning LLM
Calcula costo de fine-tuning — tokens training × tarifa por millón, más uplift por token en inference del modelo custom.
Pricing refreshed: 2026-05-01
Total año 1 · cheapest
Fireworks · Llama 4 8B
$248
| Provider | Base model | Costo training | Inference mensual | Total año 1 |
|---|---|---|---|---|
| Fireworks | Llama 4 8B | $8 | $20 | $248 |
| Together | Llama 4 8B LoRA adapter; full fine-tune more | $15 | $22 | $279 |
| Cohere | Command R | $30 | $48 | $606 |
| OpenAI | GPT-4o mini Inference is 2× base mini rate | $45 | $48 | $621 |
| Mistral | Mistral Small 3 $2/mo hosting per deployed adapter | $45 | $58 | $741 |
| Fireworks | Llama 4 70B | $45 | $90 | $1,125 |
| Together | Llama 3.3 70B | $75 | $88 | $1,131 |
| OpenAI | GPT-5 mini | $60 | $96 | $1,212 |
| Together | Llama 4 70B | $90 | $120 | $1,530 |
| OpenAI | o3-mini | $75 | $136 | $1,707 |
| AWS Bedrock | Claude Haiku 4.5 (custom) Provisioned throughput required | $120 | $303 | $3,756 |
| Mistral | Mistral Large 2 | $135 | $564 | $6,903 |
| OpenAI | GPT-4o Inference is 1.5× base GPT-4o rate | $375 | $600 | $7,575 |
Training cost = tokens × epochs × per-million rate. Inference uses the fine-tuned model's uplifted per-token rate, which is always higher than the base model. Year-1 total = one-time training + 12 months of inference.
Preguntas frecuentes
¿Qué tan precisas son estas calculadoras?+
Los precios provienen de la documentación oficial de los proveedores y se actualizan mensualmente. Las facturas reales pueden variar 5–15%.
¿Los precios están en USD?+
Sí, todos los precios están en USD según la moneda de facturación de cada proveedor.
¿Con qué frecuencia se actualizan los datos?+
Las tablas de precios se revisan y actualizan el primero de cada mes.
¿Puedo confiar en esto para presupuestar?+
Úsalas como estimaciones. Para presupuestos en producción, valida con un piloto de 1 semana.