Calculadora
Comparador de precios de tokens
Estima el costo de tokens entrada/salida en OpenAI, Anthropic, Google, xAI, Mistral, incluyendo ahorros de prompt cache.
Precios actualizados:
El AITOT Token & Pricing Comparator te deja comparar coste por token en 22 LLMs líderes en 2026 — incluyendo OpenAI GPT-5, Claude Opus 4.7, Gemini 2.5 Pro, Llama 4 70B, DeepSeek V3, Mistral Large 2, y Amazon Nova. Mete tu promedio de tokens input/output y obtén coste por request + mensual side-by-side.
Los tokens output dominan la mayoría de facturas — cuestan 3-5× los input en cada proveedor mayor. El comparador ordena por coste total, no tarifa headline. Toggles de prompt caching cortan coste input 60-90% en Anthropic y 50% en OpenAI cuando system prompt es estable.
Todo el pricing viene de documentación oficial y se refresca el 1 de cada mes. Facturas reales caen dentro de 5-15% de estos estimados. Sin login; resultados computan client-side.
Más barato
Amazon · Nova Lite
$14.40
Por mes
| Proveedor | Modelo | Entrada / 1M | Salida / 1M | Por solicitud | Por mes |
|---|---|---|---|---|---|
| Amazon | Nova Lite | $0.06 | $0.24 | $0.0001 | $14.40 |
| OpenAI | GPT-5 nano | $0.05 | $0.40 | $0.0002 | $20.00 |
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 | $0.0002 | $24.00 | |
| Cohere | Command R | $0.15 | $0.60 | $0.0004 | $36.00 |
| Mistral | Mistral Small 3 | $0.20 | $0.60 | $0.0004 | $40.00 |
| DeepSeek | DeepSeek V3 | $0.27 | $1.10 | $0.0007 | $65.60 |
| OpenAI | GPT-5.4 nano | $0.20 | $1.25 | $0.0007 | $66.00 |
| Gemini 3.1 Flash-Lite | $0.25 | $1.50 | $0.0008 | $80.00 | |
| OpenAI | GPT-5 mini | $0.25 | $2.00 | $0.001 | $100.00 |
| Meta (Together) | Llama 4 70B | $0.88 | $0.88 | $0.0011 | $105.60 |
| Gemini 2.5 Flash | $0.30 | $2.50 | $0.0012 | $124.00 | |
| DeepSeek | DeepSeek R1 | $0.55 | $2.19 | $0.0013 | $131.60 |
| xAI | Grok 4 mini | $0.60 | $2.40 | $0.0014 | $144.00 |
| Amazon | Nova Pro | $0.80 | $3.20 | $0.0019 | $192.00 |
| OpenAI | GPT-5.4 mini | $0.75 | $4.50 | $0.0024 | $240.00 |
| Anthropic | Claude Haiku 4.5 | $1.00 | $5.00 | $0.0028 | $280.00 |
| Mistral | Mistral Large 2 | $2.00 | $6.00 | $0.004 | $400.00 |
| Meta (Together) | Llama 4 405B | $3.50 | $3.50 | $0.0042 | $420.00 |
| OpenAI | o3 | $2.00 | $8.00 | $0.0048 | $480.00 |
| Gemini 3.5 Flash | $1.50 | $9.00 | $0.0048 | $480.00 | |
| OpenAI | GPT-5 | $1.25 | $10.00 | $0.005 | $500.00 |
| Gemini 2.5 Pro | $1.25 | $10.00 | $0.005 | $500.00 | |
| Cohere | Command R+ | $2.50 | $10.00 | $0.006 | $600.00 |
| Gemini 3.1 Pro | $2.00 | $12.00 | $0.0064 | $640.00 | |
| OpenAI | GPT-5.4 | $2.50 | $15.00 | $0.008 | $800.00 |
| Gemini 2.5 Pro (long ctx >200K) | $2.50 | $15.00 | $0.008 | $800.00 | |
| Anthropic | Claude Sonnet 4.6 | $3.00 | $15.00 | $0.0084 | $840.00 |
| Anthropic | Claude Opus 4.8 | $5.00 | $25.00 | $0.014 | $1,400.00 |
| xAI | Grok 4 | $5.00 | $25.00 | $0.014 | $1,400.00 |
| OpenAI | GPT-5.5 | $5.00 | $30.00 | $0.016 | $1,600.00 |
| OpenAI | GPT-5.5 Pro | $30.00 | $180.00 | $0.096 | $9,600.00 |
Solo estimaciones. Las facturas reales pueden variar 5–15% según el caché, el batching y la región.
Qué hace esta calculadora
22 LLMs en una tabla
GPT-5, Opus 4.7, Gemini 2.5 Pro, Llama 4, DeepSeek V3, Mistral, Nova, Cohere — todos comparables.
Modelado prompt cache
Toggle cache hit rate 0-100% para ver tarifas efectivas Anthropic (10% on hit), OpenAI (50%), Google (25%).
Per-request + per-month
Calculadora muestra coste por request y total mensual para cada modelo.
Workload presets
Chat, RAG, agent, summarization, code-gen presets prefijan ratios input/output realistas.
Ratio output:input
Chat 4:1; code-gen 3:1; summarization 10:1. Slider para tu workload real.
Export + share
Guarda escenarios en localStorage, exporta CSV, comparte permalinks con tu equipo.
Comparación rápida
Pricing de tokens en los top LLMs (por 1M tokens)
| Modelo | Input | Output | Blended 50:50 |
|---|---|---|---|
| Amazon Nova Lite | $0.06 | $0.24 | $0.15 |
| DeepSeek V3 | $0.27 | $1.10 | $0.69 |
| Gemini 2.5 Flash | $0.30 | $2.50 | $1.40 |
| GPT-5 mini | $0.40 | $1.60 | $1.00 |
| Claude Haiku 4.5 | $0.80 | $4.00 | $2.40 |
| Claude Sonnet 4.6 | $3.00 | $15.00 | $9.00 |
| OpenAI GPT-5 | $10.00 | $30.00 | $20.00 |
| Claude Opus 4.7 | $15.00 | $75.00 | $45.00 |
Output domina la mayoría de workloads. Usa la calculadora con tu ratio real.
Cómo usar esta calculadora
Estima coste tokens input + output para tu workload en 22 LLMs en menos de 60 segundos.
- 1
Elige workload preset
Selecciona chat, RAG, agent, summarization, o code-gen. El preset prefija ratios input/output realistas.
- 2
Set requests por mes
Mete volumen mensual esperado. La calculadora escala coste a total mensual.
- 3
Toggle prompt caching
Si tu system prompt es estable, set cache hit rate 50-80% para ver tarifas efectivas.
- 4
Compara y elige
Sort por coste mensual. Elige el modelo más barato que cumpla tu bar de calidad.
Por qué usar esta calculadora
- ✓Gratis para siempre — sin login, sin tarjeta
- ✓22 LLMs refrescados mensualmente
- ✓Corre client-side — inputs privados
- ✓Workload presets, no promedios genéricos
- ✓Incluye prompt cache + batch discounts
- ✓Permalinks para compartir