AITOT

Calculadora

Comparador de precios de tokens

Estima el costo de tokens entrada/salida en OpenAI, Anthropic, Google, xAI, Mistral, incluyendo ahorros de prompt cache.

Precios actualizados:

El AITOT Token & Pricing Comparator te deja comparar coste por token en 22 LLMs líderes en 2026 — incluyendo OpenAI GPT-5, Claude Opus 4.7, Gemini 2.5 Pro, Llama 4 70B, DeepSeek V3, Mistral Large 2, y Amazon Nova. Mete tu promedio de tokens input/output y obtén coste por request + mensual side-by-side.

Los tokens output dominan la mayoría de facturas — cuestan 3-5× los input en cada proveedor mayor. El comparador ordena por coste total, no tarifa headline. Toggles de prompt caching cortan coste input 60-90% en Anthropic y 50% en OpenAI cuando system prompt es estable.

Todo el pricing viene de documentación oficial y se refresca el 1 de cada mes. Facturas reales caen dentro de 5-15% de estos estimados. Sin login; resultados computan client-side.

Más barato

Amazon · Nova Lite

$14.40

Por mes

31 modelos
ProveedorModeloEntrada / 1MSalida / 1MPor solicitudPor mes
AmazonNova Lite$0.06$0.24$0.0001$14.40
OpenAIGPT-5 nano$0.05$0.40$0.0002$20.00
GoogleGemini 2.5 Flash-Lite$0.10$0.40$0.0002$24.00
CohereCommand R$0.15$0.60$0.0004$36.00
MistralMistral Small 3$0.20$0.60$0.0004$40.00
DeepSeekDeepSeek V3$0.27$1.10$0.0007$65.60
OpenAIGPT-5.4 nano$0.20$1.25$0.0007$66.00
GoogleGemini 3.1 Flash-Lite$0.25$1.50$0.0008$80.00
OpenAIGPT-5 mini$0.25$2.00$0.001$100.00
Meta (Together)Llama 4 70B$0.88$0.88$0.0011$105.60
GoogleGemini 2.5 Flash$0.30$2.50$0.0012$124.00
DeepSeekDeepSeek R1$0.55$2.19$0.0013$131.60
xAIGrok 4 mini$0.60$2.40$0.0014$144.00
AmazonNova Pro$0.80$3.20$0.0019$192.00
OpenAIGPT-5.4 mini$0.75$4.50$0.0024$240.00
AnthropicClaude Haiku 4.5$1.00$5.00$0.0028$280.00
MistralMistral Large 2$2.00$6.00$0.004$400.00
Meta (Together)Llama 4 405B$3.50$3.50$0.0042$420.00
OpenAIo3$2.00$8.00$0.0048$480.00
GoogleGemini 3.5 Flash$1.50$9.00$0.0048$480.00
OpenAIGPT-5$1.25$10.00$0.005$500.00
GoogleGemini 2.5 Pro$1.25$10.00$0.005$500.00
CohereCommand R+$2.50$10.00$0.006$600.00
GoogleGemini 3.1 Pro$2.00$12.00$0.0064$640.00
OpenAIGPT-5.4$2.50$15.00$0.008$800.00
GoogleGemini 2.5 Pro (long ctx >200K)$2.50$15.00$0.008$800.00
AnthropicClaude Sonnet 4.6$3.00$15.00$0.0084$840.00
AnthropicClaude Opus 4.8$5.00$25.00$0.014$1,400.00
xAIGrok 4$5.00$25.00$0.014$1,400.00
OpenAIGPT-5.5$5.00$30.00$0.016$1,600.00
OpenAIGPT-5.5 Pro$30.00$180.00$0.096$9,600.00

Solo estimaciones. Las facturas reales pueden variar 5–15% según el caché, el batching y la región.

Qué hace esta calculadora

22 LLMs en una tabla

GPT-5, Opus 4.7, Gemini 2.5 Pro, Llama 4, DeepSeek V3, Mistral, Nova, Cohere — todos comparables.

Modelado prompt cache

Toggle cache hit rate 0-100% para ver tarifas efectivas Anthropic (10% on hit), OpenAI (50%), Google (25%).

Per-request + per-month

Calculadora muestra coste por request y total mensual para cada modelo.

Workload presets

Chat, RAG, agent, summarization, code-gen presets prefijan ratios input/output realistas.

Ratio output:input

Chat 4:1; code-gen 3:1; summarization 10:1. Slider para tu workload real.

Export + share

Guarda escenarios en localStorage, exporta CSV, comparte permalinks con tu equipo.

Comparación rápida

Pricing de tokens en los top LLMs (por 1M tokens)

ModeloInputOutputBlended 50:50
Amazon Nova Lite$0.06$0.24$0.15
DeepSeek V3$0.27$1.10$0.69
Gemini 2.5 Flash$0.30$2.50$1.40
GPT-5 mini$0.40$1.60$1.00
Claude Haiku 4.5$0.80$4.00$2.40
Claude Sonnet 4.6$3.00$15.00$9.00
OpenAI GPT-5$10.00$30.00$20.00
Claude Opus 4.7$15.00$75.00$45.00

Output domina la mayoría de workloads. Usa la calculadora con tu ratio real.

Cómo usar esta calculadora

Estima coste tokens input + output para tu workload en 22 LLMs en menos de 60 segundos.

  1. 1

    Elige workload preset

    Selecciona chat, RAG, agent, summarization, o code-gen. El preset prefija ratios input/output realistas.

  2. 2

    Set requests por mes

    Mete volumen mensual esperado. La calculadora escala coste a total mensual.

  3. 3

    Toggle prompt caching

    Si tu system prompt es estable, set cache hit rate 50-80% para ver tarifas efectivas.

  4. 4

    Compara y elige

    Sort por coste mensual. Elige el modelo más barato que cumpla tu bar de calidad.

Por qué usar esta calculadora

  • Gratis para siempre — sin login, sin tarjeta
  • 22 LLMs refrescados mensualmente
  • Corre client-side — inputs privados
  • Workload presets, no promedios genéricos
  • Incluye prompt cache + batch discounts
  • Permalinks para compartir

Preguntas frecuentes

¿Cómo comparo precios de tokens LLM entre proveedores en 2026?+
Introduce tu promedio de tokens input + output por solicitud y el volumen mensual. El comparador calcula coste por solicitud y mensual en 22 modelos — OpenAI GPT-5, Claude Opus 4.7, Gemini 2.5 Pro, Llama 4, Mistral, DeepSeek, Amazon Nova y más. Ordena por output rate porque el output domina la mayoría de facturas en producción.
¿Qué LLM tiene los tokens de salida más baratos en 2026?+
Amazon Nova Lite a $0.24 por millón de tokens output es la opción production-grade más barata. DeepSeek V3 a $1.10 y Gemini 2.5 Flash a $2.50 le siguen. Evita Claude Opus 4.7 ($75/M output) salvo que necesites su calidad de razonamiento.
¿Cuánto reduce el prompt cache mi factura LLM?+
En RAG con system prompt estable, prompt caching reduce coste input 60–90% en Anthropic, 50% en OpenAI, 75% en Google. El cache hit rate steady-state real es 50–70%. Mueve el slider "% input cached" para ver tu precio efectivo.
¿Por qué el output cuesta más que el input en todos los modelos?+
La generación de output es secuencial — cada token requiere un forward pass completo. Los tokens de input se procesan en paralelo. El output también está limitado por bandwidth de memoria en modelos grandes. La mayoría de proveedores cobran 3–5× más por output reflejando el GPU time real.
¿Esta calculadora incluye el descuento de Batch API?+
No — muestra precios real-time. Para cargas no en tiempo real (resumen overnight, moderation backfills), OpenAI y Anthropic ofrecen 50% off vía Batch API. Resta 50% del coste mostrado si tu tráfico puede esperar 24h.
¿Qué modelo da la mejor calidad por dólar en 2026?+
Claude Sonnet 4.6 ($3 input, $15 output) y GPT-5 mini ($0.40 input, $1.60 output) lideran benchmarks price-performance. Para coding, Claude Sonnet 4.6 gana en SWE-bench. Para chat general, Gemini 2.5 Flash es el default barato-pero-capaz a $0.30/$2.50.