Question 1

Cara forecast pengeluaran LLM API 12 bulan?

Accepted Answer

Tiga input: request/bulan (bulan 1), growth pattern (flat/linear/exponential), dan token input/output rata-rata per request. Kalkulator proyeksi bulan demi bulan dan total tahun 1. Simpan skenario untuk bandingkan pilihan model berdampingan.

Question 2

Growth pattern mana — flat, linear, atau exponential?

Accepted Answer

Flat: tool internal stabil atau B2B SaaS di skala. Linear: produk tumbuh ~10% MoM. Exponential: startup pre-PMF atau consumer viral dobel tiap 1–2 bulan. Mayoritas berakhir antara linear dan 1.3× exponential.

Question 3

GPT-5 atau Claude Sonnet 4.6 lebih murah di 100M token/bulan?

Accepted Answer

Di 100M token (80M input, 20M output): GPT-5 $1,400/bulan, Claude Sonnet 4.6 $540/bulan — beda 60%. Sonnet 4.6 menang harga di hampir setiap skala. Pindah kecuali butuh fitur spesifik GPT-5.

Question 4

Apakah kalkulator ini termasuk hemat prompt caching?

Accepted Answer

Ya — toggle "cache hit rate" untuk memodelkannya. Anthropic charge 10% harga input normal di cache hit, OpenAI 50%, Google 25%. Di 60% cache hit rate workload RAG, biaya input Anthropic turun 54%. Signifikan untuk app system prompt panjang.

Question 5

Seberapa akurat forecast LLM 12 bulan?

Accepted Answer

Untuk 3 bulan pertama: ±10% jika estimasi traffic realistis. Untuk bulan 6–12: ±30% normal karena pricing berubah dan mungkin ganti model. Re-run forecast bulanan dan pin saved scenario untuk laporan executive.

Question 6

Cara termurah serve 1B token LLM/bulan?

Accepted Answer

Tiga jalur: (1) DeepSeek V3 di $1.10/M output = ~$220/bulan untuk 200M output, (2) Together Llama 4 70B di $0.88/M = $176/bulan, (3) self-host vLLM di 4× H100 di $2.50/jam = $7,200/bulan flat (layak di atas ~3B token/bulan). Kalkulator membandingkan ketiganya.

Model	Bulan-1	Total Tahun-1	vs Sonnet
Amazon Nova Lite	$10	$120	0.02×
DeepSeek V3	$80	$960	0.15×
Gemini 2.5 Flash	$74	$888	0.14×
Claude Haiku 4.5	$144	$1,728	0.27×
Claude Sonnet 4.6	$540	$6,480	1.00×
OpenAI GPT-5	$1,400	$16,800	2.59×
Claude Opus 4.7	$2,700	$32,400	5.00×

Estimator Biaya API LLM Bulanan

Yang dilakukan kalkulator ini

Forecast bulan demi bulan

Pola pertumbuhan

Modeling prompt cache

22 model dibandingkan

Scenario saver

Tahun-1 kumulatif

Perbandingan cepat

Cara menggunakan kalkulator

Kenapa pakai kalkulator ini

Pertanyaan yang sering diajukan