AITOT

Calculator

Calculadora Costo Fine-tuning LLM

Calcula costo de fine-tuning — tokens training × tarifa por millón, más uplift por token en inference del modelo custom.

Pricing refreshed: 2026-05-01

Total año 1 · cheapest

Fireworks · Llama 4 8B

$248

ProviderBase modelCosto trainingInference mensualTotal año 1
FireworksLlama 4 8B$8$20$248
TogetherLlama 4 8B

LoRA adapter; full fine-tune more

$15$22$279
CohereCommand R$30$48$606
OpenAIGPT-4o mini

Inference is 2× base mini rate

$45$48$621
MistralMistral Small 3

$2/mo hosting per deployed adapter

$45$58$741
FireworksLlama 4 70B$45$90$1,125
TogetherLlama 3.3 70B$75$88$1,131
OpenAIGPT-5 mini$60$96$1,212
TogetherLlama 4 70B$90$120$1,530
OpenAIo3-mini$75$136$1,707
AWS BedrockClaude Haiku 4.5 (custom)

Provisioned throughput required

$120$303$3,756
MistralMistral Large 2$135$564$6,903
OpenAIGPT-4o

Inference is 1.5× base GPT-4o rate

$375$600$7,575

Training cost = tokens × epochs × per-million rate. Inference uses the fine-tuned model's uplifted per-token rate, which is always higher than the base model. Year-1 total = one-time training + 12 months of inference.

Preguntas frecuentes

¿Qué tan precisas son estas calculadoras?+
Los precios provienen de la documentación oficial de los proveedores y se actualizan mensualmente. Las facturas reales pueden variar 5–15%.
¿Los precios están en USD?+
Sí, todos los precios están en USD según la moneda de facturación de cada proveedor.
¿Con qué frecuencia se actualizan los datos?+
Las tablas de precios se revisan y actualizan el primero de cada mes.
¿Puedo confiar en esto para presupuestar?+
Úsalas como estimaciones. Para presupuestos en producción, valida con un piloto de 1 semana.