AITOT

Kalkulator

Estimator Biaya API LLM Bulanan

Prediksi pengeluaran API 12 bulan dengan penyimpan skenario.

Harga diperbarui:

AITOT LLM API Monthly Cost Estimator forecast 12 bulan pengeluaran di OpenAI GPT-5, Claude Sonnet 4.6, Gemini 2.5 Pro, Llama 4, DeepSeek V3 dan 17 model lain.

Kalkulator output pengeluaran bulan demi bulan, total tahun-1 kumulatif, dan model termurah di skala Anda. Toggle prompt caching modelkan 60-90% penghematan input Anthropic.

Pada 100M token/bulan, Sonnet 4.6 $540/bulan, GPT-5 $1,400/bulan, DeepSeek V3 $80/bulan. Spread 17× — kenapa pilihan model adalah lever terbesar 2026.

Total tahun 1

Anthropic · Claude Sonnet 4.6

$36,529

Bulan 1
100,000 req
$1,668$1,668
Bulan 2
115,000 req
$1,918$3,586
Bulan 3
130,000 req
$2,168$5,755
Bulan 4
145,000 req
$2,419$8,173
Bulan 5
160,000 req
$2,669$10,842
Bulan 6
175,000 req
$2,919$13,761
Bulan 7
190,000 req
$3,169$16,930
Bulan 8
205,000 req
$3,419$20,350
Bulan 9
220,000 req
$3,670$24,019
Bulan 10
235,000 req
$3,920$27,939
Bulan 11
250,000 req
$4,170$32,109
Bulan 12
265,000 req
$4,420$36,529
BulananKumulatif

Forecast mengasumsikan satu model utama. Untuk agent multi-model, jalankan beberapa skenario dan jumlahkan.

Yang dilakukan kalkulator ini

Forecast bulan demi bulan

Kurva pengeluaran 12 bulan, bukan hanya total tahunan.

Pola pertumbuhan

Flat (B2B stabil), linear (~10% MoM), exponential.

Modeling prompt cache

Toggle hit rate untuk tarif efektif.

22 model dibandingkan

GPT-5, Claude family, Gemini, Llama 4, DeepSeek, Mistral, Nova, Cohere.

Scenario saver

Simpan banyak forecast.

Tahun-1 kumulatif

Angka headline untuk meeting budget.

Perbandingan cepat

Biaya tahun-1 @ 100M token/bulan, traffic flat, rasio 4:1

ModelBulan-1Total Tahun-1vs Sonnet
Amazon Nova Lite$10$1200.02×
DeepSeek V3$80$9600.15×
Gemini 2.5 Flash$74$8880.14×
Claude Haiku 4.5$144$1,7280.27×
Claude Sonnet 4.6$540$6,4801.00×
OpenAI GPT-5$1,400$16,8002.59×
Claude Opus 4.7$2,700$32,4005.00×

Asumsi 80M input + 20M output token/bulan tanpa caching.

Cara menggunakan kalkulator

Proyeksikan biaya LLM API 12 bulan di 22 model dengan modeling growth.

  1. 1

    Masukkan volume bulan-1

    Set requests untuk bulan pertama.

  2. 2

    Pilih pola growth

    Flat, linear (10% MoM), atau exponential.

  3. 3

    Set token per request

    Rata-rata input + output. Chat ~2k in / 400 out.

  4. 4

    Simpan dan bandingkan

    Simpan banyak model untuk bandingkan tahun-1.

Kenapa pakai kalkulator ini

  • 22 model di-track bulanan
  • Modeling pola pertumbuhan
  • Prompt cache + batch discounts
  • Simpan + bandingkan skenario
  • Toggle inference tax
  • Tanpa login

Pertanyaan yang sering diajukan

Cara forecast pengeluaran LLM API 12 bulan?+
Tiga input: request/bulan (bulan 1), growth pattern (flat/linear/exponential), dan token input/output rata-rata per request. Kalkulator proyeksi bulan demi bulan dan total tahun 1. Simpan skenario untuk bandingkan pilihan model berdampingan.
Growth pattern mana — flat, linear, atau exponential?+
Flat: tool internal stabil atau B2B SaaS di skala. Linear: produk tumbuh ~10% MoM. Exponential: startup pre-PMF atau consumer viral dobel tiap 1–2 bulan. Mayoritas berakhir antara linear dan 1.3× exponential.
GPT-5 atau Claude Sonnet 4.6 lebih murah di 100M token/bulan?+
Di 100M token (80M input, 20M output): GPT-5 $1,400/bulan, Claude Sonnet 4.6 $540/bulan — beda 60%. Sonnet 4.6 menang harga di hampir setiap skala. Pindah kecuali butuh fitur spesifik GPT-5.
Apakah kalkulator ini termasuk hemat prompt caching?+
Ya — toggle "cache hit rate" untuk memodelkannya. Anthropic charge 10% harga input normal di cache hit, OpenAI 50%, Google 25%. Di 60% cache hit rate workload RAG, biaya input Anthropic turun 54%. Signifikan untuk app system prompt panjang.
Seberapa akurat forecast LLM 12 bulan?+
Untuk 3 bulan pertama: ±10% jika estimasi traffic realistis. Untuk bulan 6–12: ±30% normal karena pricing berubah dan mungkin ganti model. Re-run forecast bulanan dan pin saved scenario untuk laporan executive.
Cara termurah serve 1B token LLM/bulan?+
Tiga jalur: (1) DeepSeek V3 di $1.10/M output = ~$220/bulan untuk 200M output, (2) Together Llama 4 70B di $0.88/M = $176/bulan, (3) self-host vLLM di 4× H100 di $2.50/jam = $7,200/bulan flat (layak di atas ~3B token/bulan). Kalkulator membandingkan ketiganya.