AITOT

Calculator

Benchmark & Biaya Inference

Ukur kecepatan dan biaya per juta token di hardware dan model berbeda.

Benchmarks refreshed: 2026-05-01

Termurah

DeepInfra

$69.00/mo

Tercepat

SambaNova

580tok/s

HostToken/detikTTFTWaktu respons$ / 1M outTotal / mo
DeepInfra70410 ms7.55 s$0.60$69.00
SambaNova580110 ms0.97 s$0.60$90.00
Groq320180 ms1.74 s$0.79$98.50
Cerebras450120 ms1.23 s$0.85$107.50
Together92320 ms5.75 s$0.88$132.00
Fireworks110290 ms4.84 s$0.90$135.00
Self-host (H100 SXM ×4, vLLM)

AWS p5 spot reference

85380 ms6.26 s$1.95$292.50
Self-host (B200 ×4)165220 ms3.25 s$2.10$315.00

Numbers are batch=1 streaming-decode (chat UX). Production back-end batches can hit 5–20× higher tokens/sec at the same per-token cost. Cross-check against artificialanalysis.ai for the latest.

Pertanyaan yang sering diajukan

Seberapa akurat kalkulator ini?+
Harga bersumber dari dokumentasi resmi provider dan diperbarui bulanan. Tagihan nyata bisa berbeda 5–15%.
Apakah harga dalam USD?+
Ya, semua harga dalam USD sesuai mata uang penagihan provider.
Seberapa sering data diperbarui?+
Tabel harga ditinjau dan diperbarui setiap tanggal 1.
Bisakah saya andalkan ini untuk anggaran?+
Gunakan sebagai estimasi. Untuk anggaran produksi, validasi dengan pilot 1 minggu.