AITOT

Calculator

Benchmark et coût d'inférence

Mesurez la vitesse d'inférence et le coût par million de tokens sur différents matériels et modèles.

Benchmarks refreshed: 2026-05-01

Le moins cher

DeepInfra

$69.00/mo

Le plus rapide

SambaNova

580tok/s

HébergeurTokens/secTTFTTemps de réponse$ / 1M outTotal / mo
DeepInfra70410 ms7.55 s$0.60$69.00
SambaNova580110 ms0.97 s$0.60$90.00
Groq320180 ms1.74 s$0.79$98.50
Cerebras450120 ms1.23 s$0.85$107.50
Together92320 ms5.75 s$0.88$132.00
Fireworks110290 ms4.84 s$0.90$135.00
Self-host (H100 SXM ×4, vLLM)

AWS p5 spot reference

85380 ms6.26 s$1.95$292.50
Self-host (B200 ×4)165220 ms3.25 s$2.10$315.00

Numbers are batch=1 streaming-decode (chat UX). Production back-end batches can hit 5–20× higher tokens/sec at the same per-token cost. Cross-check against artificialanalysis.ai for the latest.

Questions fréquentes

Quelle est la précision de ces calculateurs ?+
Les prix proviennent de la documentation officielle et sont mis à jour chaque mois. Les factures réelles peuvent varier de 5 à 15%.
Les prix sont-ils en USD ?+
Oui, tous les prix sont en USD selon la devise de facturation des fournisseurs.
À quelle fréquence les données sont-elles mises à jour ?+
Les tableaux de prix sont révisés et mis à jour le 1er de chaque mois.
Puis-je m'y fier pour mon budget ?+
Utilisez-les comme estimations. Pour la production, validez avec un pilote d'une semaine.