AITOT

Calculadora

Estimador mensual de API LLM

Pronostica gasto API de 12 meses con guardador de escenarios.

Precios actualizados:

El AITOT LLM API Monthly Cost Estimator forecast 12 meses de gasto en OpenAI GPT-5, Claude Sonnet 4.6, Gemini 2.5 Pro, Llama 4, DeepSeek V3 y 17 modelos más. Inputs: requests mes-1, patrón crecimiento, tokens promedio.

La calculadora outputs gasto mes-a-mes, total año-1 cumulativo, y modelo más barato a tu escala. Toggle prompt caching para modelar 60-90% ahorro input Anthropic, 50% OpenAI, 25% Google.

A 100M tokens/mes, Claude Sonnet 4.6 cuesta $540/mes, GPT-5 $1,400/mes, DeepSeek V3 $80/mes. El spread 17× es por qué la elección de modelo es la mayor palanca 2026.

Total año 1

Anthropic · Claude Sonnet 4.6

$36,529

Mes 1
100,000 sol
$1,668$1,668
Mes 2
115,000 sol
$1,918$3,586
Mes 3
130,000 sol
$2,168$5,755
Mes 4
145,000 sol
$2,419$8,173
Mes 5
160,000 sol
$2,669$10,842
Mes 6
175,000 sol
$2,919$13,761
Mes 7
190,000 sol
$3,169$16,930
Mes 8
205,000 sol
$3,419$20,350
Mes 9
220,000 sol
$3,670$24,019
Mes 10
235,000 sol
$3,920$27,939
Mes 11
250,000 sol
$4,170$32,109
Mes 12
265,000 sol
$4,420$36,529
MensualAcumulado

El forecast asume un único modelo principal. Para agentes multi-modelo, corre varios escenarios y suma.

Qué hace esta calculadora

Forecast mes-a-mes

Curva de gasto 12 meses, no solo total anual.

Patrones crecimiento

Flat (B2B estable), linear (~10% MoM), exponencial (1.3-2× mensual).

Modelado prompt cache

Toggle hit rate para tarifas efectivas Anthropic, OpenAI, Google.

22 modelos comparados

GPT-5, Claude family, Gemini, Llama 4, DeepSeek, Mistral, Nova, Cohere.

Scenario saver

Guarda múltiples forecasts en localStorage.

Año-1 cumulativo

Número headline para meeting de budget. Plus inference tax toggle.

Comparación rápida

Coste año-1 @ 100M tokens/mes, tráfico flat, ratio 4:1

ModeloMes-1Total Año-1vs Sonnet
Amazon Nova Lite$10$1200.02×
DeepSeek V3$80$9600.15×
Gemini 2.5 Flash$74$8880.14×
Claude Haiku 4.5$144$1,7280.27×
Claude Sonnet 4.6$540$6,4801.00×
OpenAI GPT-5$1,400$16,8002.59×
Claude Opus 4.7$2,700$32,4005.00×

Asume 80M input + 20M output tokens/mes sin caching.

Cómo usar esta calculadora

Proyecta coste LLM API 12-meses en 22 modelos con modelado growth.

  1. 1

    Entra volumen mes-1

    Set requests para primer mes. Sé realista — sobreestimación compound.

  2. 2

    Elige patrón growth

    Flat (B2B), linear (10% MoM), exponencial (1.3× MoM viral).

  3. 3

    Set tokens por request

    Promedio input + output. Chat ~2k in / 400 out. RAG ~6k in / 600 out.

  4. 4

    Guarda y compara escenarios

    Guarda múltiples modelos para comparar año-1 cumulativo.

Por qué usar esta calculadora

  • 22 modelos trackeados mensualmente
  • Modelado patrón crecimiento (flat/linear/exp)
  • Prompt cache + batch discounts
  • Guarda + compara escenarios
  • Toggle inference tax buffer
  • Sin login

Preguntas frecuentes

¿Cómo predigo mi gasto LLM API a 12 meses?+
Tres entradas: solicitudes/mes (mes 1), patrón de crecimiento (flat/linear/exponencial), y tokens promedio input/output por solicitud. La calculadora proyecta mes a mes y total año 1. Guarda escenarios para comparar modelos lado a lado.
¿Qué patrón de crecimiento uso — flat, linear o exponencial?+
Flat: tools internas estables o B2B SaaS a escala. Linear: producto creciendo ~10% MoM. Exponencial: startups pre-PMF o consumer viral duplicando cada 1–2 meses. La mayoría termina entre linear y 1.3× exponencial.
¿GPT-5 o Claude Sonnet 4.6 más barato a 100M tokens/mes?+
A 100M tokens (80M input, 20M output): GPT-5 $1,400/mes, Claude Sonnet 4.6 $540/mes — 60% diferencia. Sonnet 4.6 gana en precio a casi cualquier escala. Cambia salvo que necesites features específicas de GPT-5.
¿Esta calculadora incluye ahorros de prompt caching?+
Sí — activa "cache hit rate". Anthropic cobra 10% del input normal en hit, OpenAI 50%, Google 25%. Con 60% hit rate en RAG, el coste input Anthropic baja 54%. Importante en apps con system prompt largo.
¿Qué precisión tiene un forecast LLM de 12 meses?+
En los primeros 3 meses: ±10% si tu estimación es realista. En meses 6–12: ±30% es normal porque cambian precios y modelos. Re-ejecuta el forecast mensual y fija el escenario guardado para reporting executive.
¿Cuál es la forma más barata de servir 1B tokens LLM/mes?+
Tres caminos: (1) DeepSeek V3 a $1.10/M output = ~$220/mes para 200M output, (2) Together Llama 4 70B a $0.88/M = $176/mes, (3) self-host vLLM en 4× H100 a $2.50/h = $7,200/mes plano (vale por encima de ~3B tokens/mes). La calculadora compara las tres.