Calculadora
Estimador mensual de API LLM
Pronostica gasto API de 12 meses con guardador de escenarios.
Precios actualizados:
El AITOT LLM API Monthly Cost Estimator forecast 12 meses de gasto en OpenAI GPT-5, Claude Sonnet 4.6, Gemini 2.5 Pro, Llama 4, DeepSeek V3 y 17 modelos más. Inputs: requests mes-1, patrón crecimiento, tokens promedio.
La calculadora outputs gasto mes-a-mes, total año-1 cumulativo, y modelo más barato a tu escala. Toggle prompt caching para modelar 60-90% ahorro input Anthropic, 50% OpenAI, 25% Google.
A 100M tokens/mes, Claude Sonnet 4.6 cuesta $540/mes, GPT-5 $1,400/mes, DeepSeek V3 $80/mes. El spread 17× es por qué la elección de modelo es la mayor palanca 2026.
Total año 1
Anthropic · Claude Sonnet 4.6
$36,529
El forecast asume un único modelo principal. Para agentes multi-modelo, corre varios escenarios y suma.
Qué hace esta calculadora
Forecast mes-a-mes
Curva de gasto 12 meses, no solo total anual.
Patrones crecimiento
Flat (B2B estable), linear (~10% MoM), exponencial (1.3-2× mensual).
Modelado prompt cache
Toggle hit rate para tarifas efectivas Anthropic, OpenAI, Google.
22 modelos comparados
GPT-5, Claude family, Gemini, Llama 4, DeepSeek, Mistral, Nova, Cohere.
Scenario saver
Guarda múltiples forecasts en localStorage.
Año-1 cumulativo
Número headline para meeting de budget. Plus inference tax toggle.
Comparación rápida
Coste año-1 @ 100M tokens/mes, tráfico flat, ratio 4:1
| Modelo | Mes-1 | Total Año-1 | vs Sonnet |
|---|---|---|---|
| Amazon Nova Lite | $10 | $120 | 0.02× |
| DeepSeek V3 | $80 | $960 | 0.15× |
| Gemini 2.5 Flash | $74 | $888 | 0.14× |
| Claude Haiku 4.5 | $144 | $1,728 | 0.27× |
| Claude Sonnet 4.6 | $540 | $6,480 | 1.00× |
| OpenAI GPT-5 | $1,400 | $16,800 | 2.59× |
| Claude Opus 4.7 | $2,700 | $32,400 | 5.00× |
Asume 80M input + 20M output tokens/mes sin caching.
Cómo usar esta calculadora
Proyecta coste LLM API 12-meses en 22 modelos con modelado growth.
- 1
Entra volumen mes-1
Set requests para primer mes. Sé realista — sobreestimación compound.
- 2
Elige patrón growth
Flat (B2B), linear (10% MoM), exponencial (1.3× MoM viral).
- 3
Set tokens por request
Promedio input + output. Chat ~2k in / 400 out. RAG ~6k in / 600 out.
- 4
Guarda y compara escenarios
Guarda múltiples modelos para comparar año-1 cumulativo.
Por qué usar esta calculadora
- ✓22 modelos trackeados mensualmente
- ✓Modelado patrón crecimiento (flat/linear/exp)
- ✓Prompt cache + batch discounts
- ✓Guarda + compara escenarios
- ✓Toggle inference tax buffer
- ✓Sin login