Question 1

Bagaimana cara membandingkan harga token LLM antar provider 2026?

Accepted Answer

Masukkan rata-rata token input + output per request dan volume request bulanan. Comparator menghitung biaya per request dan bulanan di 22 model — OpenAI GPT-5, Claude Opus 4.7, Gemini 2.5 Pro, Llama 4, Mistral, DeepSeek, Amazon Nova dan lainnya. Urutkan menurut output rate karena output mendominasi tagihan produksi.

Question 2

LLM mana yang output token-nya termurah di 2026?

Accepted Answer

Amazon Nova Lite di $0.24 per juta token output adalah opsi production-grade termurah. DeepSeek V3 di $1.10 dan Gemini 2.5 Flash di $2.50 mengikuti. Hindari Claude Opus 4.7 ($75/M output) kecuali butuh kualitas reasoning-nya.

Question 3

Berapa banyak prompt cache mengurangi tagihan LLM saya?

Accepted Answer

Untuk workload RAG dengan system prompt stabil, prompt caching memotong biaya input 60–90% di Anthropic, 50% OpenAI, 75% Google. Cache hit rate steady-state nyata 50–70%. Geser slider "% input cached" untuk lihat harga efektif.

Question 4

Kenapa output lebih mahal dari input di setiap model?

Accepted Answer

Generasi output sekuensial — tiap token butuh forward pass penuh. Token input diproses paralel. Output juga memory-bandwidth-bound di model besar. Mayoritas provider charge 3–5× lebih untuk output mencerminkan GPU time aktual.

Question 5

Apakah kalkulator ini termasuk diskon Batch API?

Accepted Answer

Tidak — kalkulator menampilkan harga real-time. Untuk workload non-realtime (summarization overnight, content moderation backfill), OpenAI dan Anthropic menawarkan 50% off via Batch API. Kurangi 50% dari biaya yang ditampilkan jika traffic Anda bisa tunggu 24 jam.

Question 6

Model mana kualitas per dolar terbaik di 2026?

Accepted Answer

Claude Sonnet 4.6 ($3 input, $15 output) dan GPT-5 mini ($0.40 input, $1.60 output) pemimpin benchmark price-performance. Untuk coding, Claude Sonnet 4.6 menang di SWE-bench. Untuk chat umum, Gemini 2.5 Flash default murah-tapi-mampu di $0.30/$2.50.

Provider	Model	Input / 1M	Output / 1M	Per request	Per bulan
Amazon	Nova Lite	$0.06	$0.24	$0.0001	$14.40
OpenAI	GPT-5 nano	$0.05	$0.40	$0.0002	$20.00
Google	Gemini 2.5 Flash-Lite	$0.10	$0.40	$0.0002	$24.00
Cohere	Command R	$0.15	$0.60	$0.0004	$36.00
Mistral	Mistral Small 3	$0.20	$0.60	$0.0004	$40.00
DeepSeek	DeepSeek V3	$0.27	$1.10	$0.0007	$65.60
OpenAI	GPT-5.4 nano	$0.20	$1.25	$0.0007	$66.00
Google	Gemini 3.1 Flash-Lite	$0.25	$1.50	$0.0008	$80.00
OpenAI	GPT-5 mini	$0.25	$2.00	$0.001	$100.00
Meta (Together)	Llama 4 70B	$0.88	$0.88	$0.0011	$105.60
Google	Gemini 2.5 Flash	$0.30	$2.50	$0.0012	$124.00
DeepSeek	DeepSeek R1	$0.55	$2.19	$0.0013	$131.60
xAI	Grok 4 mini	$0.60	$2.40	$0.0014	$144.00
Amazon	Nova Pro	$0.80	$3.20	$0.0019	$192.00
OpenAI	GPT-5.4 mini	$0.75	$4.50	$0.0024	$240.00
Anthropic	Claude Haiku 4.5	$1.00	$5.00	$0.0028	$280.00
Mistral	Mistral Large 2	$2.00	$6.00	$0.004	$400.00
Meta (Together)	Llama 4 405B	$3.50	$3.50	$0.0042	$420.00
OpenAI	o3	$2.00	$8.00	$0.0048	$480.00
Google	Gemini 3.5 Flash	$1.50	$9.00	$0.0048	$480.00
OpenAI	GPT-5	$1.25	$10.00	$0.005	$500.00
Google	Gemini 2.5 Pro	$1.25	$10.00	$0.005	$500.00
Cohere	Command R+	$2.50	$10.00	$0.006	$600.00
Google	Gemini 3.1 Pro	$2.00	$12.00	$0.0064	$640.00
OpenAI	GPT-5.4	$2.50	$15.00	$0.008	$800.00
Google	Gemini 2.5 Pro (long ctx >200K)	$2.50	$15.00	$0.008	$800.00
Anthropic	Claude Sonnet 4.6	$3.00	$15.00	$0.0084	$840.00
Anthropic	Claude Opus 4.8	$5.00	$25.00	$0.014	$1,400.00
xAI	Grok 4	$5.00	$25.00	$0.014	$1,400.00
OpenAI	GPT-5.5	$5.00	$30.00	$0.016	$1,600.00
OpenAI	GPT-5.5 Pro	$30.00	$180.00	$0.096	$9,600.00

Model	Input	Output	Blended 50:50
Amazon Nova Lite	$0.06	$0.24	$0.15
DeepSeek V3	$0.27	$1.10	$0.69
Gemini 2.5 Flash	$0.30	$2.50	$1.40
GPT-5 mini	$0.40	$1.60	$1.00
Claude Haiku 4.5	$0.80	$4.00	$2.40
Claude Sonnet 4.6	$3.00	$15.00	$9.00
OpenAI GPT-5	$10.00	$30.00	$20.00
Claude Opus 4.7	$15.00	$75.00	$45.00

Pembanding Harga Token

Yang dilakukan kalkulator ini

22 LLM dalam satu tabel

Modeling prompt cache

Per-request + per-month

Workload presets

Rasio output:input

Export + share

Perbandingan cepat

Cara menggunakan kalkulator

Kenapa pakai kalkulator ini

Pertanyaan yang sering diajukan