Question 1

¿Cómo predigo mi gasto LLM API a 12 meses?

Accepted Answer

Tres entradas: solicitudes/mes (mes 1), patrón de crecimiento (flat/linear/exponencial), y tokens promedio input/output por solicitud. La calculadora proyecta mes a mes y total año 1. Guarda escenarios para comparar modelos lado a lado.

Question 2

¿Qué patrón de crecimiento uso — flat, linear o exponencial?

Accepted Answer

Flat: tools internas estables o B2B SaaS a escala. Linear: producto creciendo ~10% MoM. Exponencial: startups pre-PMF o consumer viral duplicando cada 1–2 meses. La mayoría termina entre linear y 1.3× exponencial.

Question 3

¿GPT-5 o Claude Sonnet 4.6 más barato a 100M tokens/mes?

Accepted Answer

A 100M tokens (80M input, 20M output): GPT-5 $1,400/mes, Claude Sonnet 4.6 $540/mes — 60% diferencia. Sonnet 4.6 gana en precio a casi cualquier escala. Cambia salvo que necesites features específicas de GPT-5.

Question 4

¿Esta calculadora incluye ahorros de prompt caching?

Accepted Answer

Sí — activa "cache hit rate". Anthropic cobra 10% del input normal en hit, OpenAI 50%, Google 25%. Con 60% hit rate en RAG, el coste input Anthropic baja 54%. Importante en apps con system prompt largo.

Question 5

¿Qué precisión tiene un forecast LLM de 12 meses?

Accepted Answer

En los primeros 3 meses: ±10% si tu estimación es realista. En meses 6–12: ±30% es normal porque cambian precios y modelos. Re-ejecuta el forecast mensual y fija el escenario guardado para reporting executive.

Question 6

¿Cuál es la forma más barata de servir 1B tokens LLM/mes?

Accepted Answer

Tres caminos: (1) DeepSeek V3 a $1.10/M output = ~$220/mes para 200M output, (2) Together Llama 4 70B a $0.88/M = $176/mes, (3) self-host vLLM en 4× H100 a $2.50/h = $7,200/mes plano (vale por encima de ~3B tokens/mes). La calculadora compara las tres.

Modelo	Mes-1	Total Año-1	vs Sonnet
Amazon Nova Lite	$10	$120	0.02×
DeepSeek V3	$80	$960	0.15×
Gemini 2.5 Flash	$74	$888	0.14×
Claude Haiku 4.5	$144	$1,728	0.27×
Claude Sonnet 4.6	$540	$6,480	1.00×
OpenAI GPT-5	$1,400	$16,800	2.59×
Claude Opus 4.7	$2,700	$32,400	5.00×

Estimador mensual de API LLM

Qué hace esta calculadora

Forecast mes-a-mes

Patrones crecimiento

Modelado prompt cache

22 modelos comparados

Scenario saver

Año-1 cumulativo

Comparación rápida

Cómo usar esta calculadora

Por qué usar esta calculadora

Preguntas frecuentes