AITOT

Calculator

Benchmark y costo de inferencia

Mide velocidad y costo por millón de tokens en distintos hardwares y modelos.

Benchmarks refreshed: 2026-05-01

Más barato

DeepInfra

$69.00/mo

Más rápido

SambaNova

580tok/s

ProveedorTokens/segTTFTTiempo de respuesta$ / 1M outTotal / mo
DeepInfra70410 ms7.55 s$0.60$69.00
SambaNova580110 ms0.97 s$0.60$90.00
Groq320180 ms1.74 s$0.79$98.50
Cerebras450120 ms1.23 s$0.85$107.50
Together92320 ms5.75 s$0.88$132.00
Fireworks110290 ms4.84 s$0.90$135.00
Self-host (H100 SXM ×4, vLLM)

AWS p5 spot reference

85380 ms6.26 s$1.95$292.50
Self-host (B200 ×4)165220 ms3.25 s$2.10$315.00

Numbers are batch=1 streaming-decode (chat UX). Production back-end batches can hit 5–20× higher tokens/sec at the same per-token cost. Cross-check against artificialanalysis.ai for the latest.

Preguntas frecuentes

¿Qué tan precisas son estas calculadoras?+
Los precios provienen de la documentación oficial de los proveedores y se actualizan mensualmente. Las facturas reales pueden variar 5–15%.
¿Los precios están en USD?+
Sí, todos los precios están en USD según la moneda de facturación de cada proveedor.
¿Con qué frecuencia se actualizan los datos?+
Las tablas de precios se revisan y actualizan el primero de cada mes.
¿Puedo confiar en esto para presupuestar?+
Úsalas como estimaciones. Para presupuestos en producción, valida con un piloto de 1 semana.