Question 1

¿Cómo comparo precios de tokens LLM entre proveedores en 2026?

Accepted Answer

Introduce tu promedio de tokens input + output por solicitud y el volumen mensual. El comparador calcula coste por solicitud y mensual en 22 modelos — OpenAI GPT-5, Claude Opus 4.7, Gemini 2.5 Pro, Llama 4, Mistral, DeepSeek, Amazon Nova y más. Ordena por output rate porque el output domina la mayoría de facturas en producción.

Question 2

¿Qué LLM tiene los tokens de salida más baratos en 2026?

Accepted Answer

Amazon Nova Lite a $0.24 por millón de tokens output es la opción production-grade más barata. DeepSeek V3 a $1.10 y Gemini 2.5 Flash a $2.50 le siguen. Evita Claude Opus 4.7 ($75/M output) salvo que necesites su calidad de razonamiento.

Question 3

¿Cuánto reduce el prompt cache mi factura LLM?

Accepted Answer

En RAG con system prompt estable, prompt caching reduce coste input 60–90% en Anthropic, 50% en OpenAI, 75% en Google. El cache hit rate steady-state real es 50–70%. Mueve el slider "% input cached" para ver tu precio efectivo.

Question 4

¿Por qué el output cuesta más que el input en todos los modelos?

Accepted Answer

La generación de output es secuencial — cada token requiere un forward pass completo. Los tokens de input se procesan en paralelo. El output también está limitado por bandwidth de memoria en modelos grandes. La mayoría de proveedores cobran 3–5× más por output reflejando el GPU time real.

Question 5

¿Esta calculadora incluye el descuento de Batch API?

Accepted Answer

No — muestra precios real-time. Para cargas no en tiempo real (resumen overnight, moderation backfills), OpenAI y Anthropic ofrecen 50% off vía Batch API. Resta 50% del coste mostrado si tu tráfico puede esperar 24h.

Question 6

¿Qué modelo da la mejor calidad por dólar en 2026?

Accepted Answer

Claude Sonnet 4.6 ($3 input, $15 output) y GPT-5 mini ($0.40 input, $1.60 output) lideran benchmarks price-performance. Para coding, Claude Sonnet 4.6 gana en SWE-bench. Para chat general, Gemini 2.5 Flash es el default barato-pero-capaz a $0.30/$2.50.

Proveedor	Modelo	Entrada / 1M	Salida / 1M	Por solicitud	Por mes
Amazon	Nova Lite	$0.06	$0.24	$0.0001	$14.40
OpenAI	GPT-5 nano	$0.05	$0.40	$0.0002	$20.00
Google	Gemini 2.5 Flash-Lite	$0.10	$0.40	$0.0002	$24.00
Cohere	Command R	$0.15	$0.60	$0.0004	$36.00
Mistral	Mistral Small 3	$0.20	$0.60	$0.0004	$40.00
DeepSeek	DeepSeek V3	$0.27	$1.10	$0.0007	$65.60
OpenAI	GPT-5.4 nano	$0.20	$1.25	$0.0007	$66.00
Google	Gemini 3.1 Flash-Lite	$0.25	$1.50	$0.0008	$80.00
OpenAI	GPT-5 mini	$0.25	$2.00	$0.001	$100.00
Meta (Together)	Llama 4 70B	$0.88	$0.88	$0.0011	$105.60
Google	Gemini 2.5 Flash	$0.30	$2.50	$0.0012	$124.00
DeepSeek	DeepSeek R1	$0.55	$2.19	$0.0013	$131.60
xAI	Grok 4 mini	$0.60	$2.40	$0.0014	$144.00
Amazon	Nova Pro	$0.80	$3.20	$0.0019	$192.00
OpenAI	GPT-5.4 mini	$0.75	$4.50	$0.0024	$240.00
Anthropic	Claude Haiku 4.5	$1.00	$5.00	$0.0028	$280.00
Mistral	Mistral Large 2	$2.00	$6.00	$0.004	$400.00
Meta (Together)	Llama 4 405B	$3.50	$3.50	$0.0042	$420.00
OpenAI	o3	$2.00	$8.00	$0.0048	$480.00
Google	Gemini 3.5 Flash	$1.50	$9.00	$0.0048	$480.00
OpenAI	GPT-5	$1.25	$10.00	$0.005	$500.00
Google	Gemini 2.5 Pro	$1.25	$10.00	$0.005	$500.00
Cohere	Command R+	$2.50	$10.00	$0.006	$600.00
Google	Gemini 3.1 Pro	$2.00	$12.00	$0.0064	$640.00
OpenAI	GPT-5.4	$2.50	$15.00	$0.008	$800.00
Google	Gemini 2.5 Pro (long ctx >200K)	$2.50	$15.00	$0.008	$800.00
Anthropic	Claude Sonnet 4.6	$3.00	$15.00	$0.0084	$840.00
Anthropic	Claude Opus 4.8	$5.00	$25.00	$0.014	$1,400.00
xAI	Grok 4	$5.00	$25.00	$0.014	$1,400.00
OpenAI	GPT-5.5	$5.00	$30.00	$0.016	$1,600.00
OpenAI	GPT-5.5 Pro	$30.00	$180.00	$0.096	$9,600.00

Modelo	Input	Output	Blended 50:50
Amazon Nova Lite	$0.06	$0.24	$0.15
DeepSeek V3	$0.27	$1.10	$0.69
Gemini 2.5 Flash	$0.30	$2.50	$1.40
GPT-5 mini	$0.40	$1.60	$1.00
Claude Haiku 4.5	$0.80	$4.00	$2.40
Claude Sonnet 4.6	$3.00	$15.00	$9.00
OpenAI GPT-5	$10.00	$30.00	$20.00
Claude Opus 4.7	$15.00	$75.00	$45.00

Comparador de precios de tokens

Qué hace esta calculadora

22 LLMs en una tabla

Modelado prompt cache

Per-request + per-month

Workload presets

Ratio output:input

Export + share

Comparación rápida

Cómo usar esta calculadora

Por qué usar esta calculadora

Preguntas frecuentes