AITOT

Kalkulator

Pembanding Harga Token

Perkirakan biaya token input/output OpenAI, Anthropic, Google, xAI, Mistral termasuk hemat prompt cache.

Harga diperbarui:

AITOT Token & Pricing Comparator memungkinkan Anda membandingkan biaya per token pada 22 LLM terdepan 2026 — termasuk OpenAI GPT-5, Claude Opus 4.7, Gemini 2.5 Pro, Llama 4 70B, DeepSeek V3, Mistral Large 2, dan Amazon Nova.

Token output mendominasi mayoritas tagihan — biaya 3-5× input token di setiap provider utama. Comparator mengurutkan berdasarkan total cost. Toggle prompt caching memotong biaya input 60-90% di Anthropic dan 50% di OpenAI.

Semua pricing dari dokumentasi resmi dan diperbarui tanggal 1 setiap bulan. Tagihan nyata jatuh dalam 5-15% dari estimasi. Tanpa login; hasil dihitung client-side.

Termurah

Amazon · Nova Lite

$14.40

Per bulan

31 model
ProviderModelInput / 1MOutput / 1MPer requestPer bulan
AmazonNova Lite$0.06$0.24$0.0001$14.40
OpenAIGPT-5 nano$0.05$0.40$0.0002$20.00
GoogleGemini 2.5 Flash-Lite$0.10$0.40$0.0002$24.00
CohereCommand R$0.15$0.60$0.0004$36.00
MistralMistral Small 3$0.20$0.60$0.0004$40.00
DeepSeekDeepSeek V3$0.27$1.10$0.0007$65.60
OpenAIGPT-5.4 nano$0.20$1.25$0.0007$66.00
GoogleGemini 3.1 Flash-Lite$0.25$1.50$0.0008$80.00
OpenAIGPT-5 mini$0.25$2.00$0.001$100.00
Meta (Together)Llama 4 70B$0.88$0.88$0.0011$105.60
GoogleGemini 2.5 Flash$0.30$2.50$0.0012$124.00
DeepSeekDeepSeek R1$0.55$2.19$0.0013$131.60
xAIGrok 4 mini$0.60$2.40$0.0014$144.00
AmazonNova Pro$0.80$3.20$0.0019$192.00
OpenAIGPT-5.4 mini$0.75$4.50$0.0024$240.00
AnthropicClaude Haiku 4.5$1.00$5.00$0.0028$280.00
MistralMistral Large 2$2.00$6.00$0.004$400.00
Meta (Together)Llama 4 405B$3.50$3.50$0.0042$420.00
OpenAIo3$2.00$8.00$0.0048$480.00
GoogleGemini 3.5 Flash$1.50$9.00$0.0048$480.00
OpenAIGPT-5$1.25$10.00$0.005$500.00
GoogleGemini 2.5 Pro$1.25$10.00$0.005$500.00
CohereCommand R+$2.50$10.00$0.006$600.00
GoogleGemini 3.1 Pro$2.00$12.00$0.0064$640.00
OpenAIGPT-5.4$2.50$15.00$0.008$800.00
GoogleGemini 2.5 Pro (long ctx >200K)$2.50$15.00$0.008$800.00
AnthropicClaude Sonnet 4.6$3.00$15.00$0.0084$840.00
AnthropicClaude Opus 4.8$5.00$25.00$0.014$1,400.00
xAIGrok 4$5.00$25.00$0.014$1,400.00
OpenAIGPT-5.5$5.00$30.00$0.016$1,600.00
OpenAIGPT-5.5 Pro$30.00$180.00$0.096$9,600.00

Hanya estimasi. Tagihan nyata dapat bervariasi 5–15% tergantung caching, batching, dan region.

Yang dilakukan kalkulator ini

22 LLM dalam satu tabel

GPT-5, Opus 4.7, Gemini 2.5 Pro, Llama 4, DeepSeek V3, Mistral, Nova, Cohere — semua bisa dibandingkan.

Modeling prompt cache

Toggle cache hit rate 0-100% untuk lihat tarif efektif.

Per-request + per-month

Kalkulator tampilkan biaya per request dan total bulanan.

Workload presets

Chat, RAG, agent, summarization, code-gen presets preset ratio input/output realistis.

Rasio output:input

Chat 4:1; code-gen 3:1; summarization 10:1.

Export + share

Simpan skenario di localStorage, ekspor CSV, bagikan permalink.

Perbandingan cepat

Harga token pada LLM teratas (per 1M token)

ModelInputOutputBlended 50:50
Amazon Nova Lite$0.06$0.24$0.15
DeepSeek V3$0.27$1.10$0.69
Gemini 2.5 Flash$0.30$2.50$1.40
GPT-5 mini$0.40$1.60$1.00
Claude Haiku 4.5$0.80$4.00$2.40
Claude Sonnet 4.6$3.00$15.00$9.00
OpenAI GPT-5$10.00$30.00$20.00
Claude Opus 4.7$15.00$75.00$45.00

Output mendominasi mayoritas workload. Pakai kalkulator dengan rasio nyata Anda.

Cara menggunakan kalkulator

Perkirakan biaya token input + output untuk workload Anda di 22 LLM dalam <60 detik.

  1. 1

    Pilih workload preset

    Pilih chat, RAG, agent, summarization, atau code-gen.

  2. 2

    Set request per bulan

    Masukkan volume bulanan diharapkan.

  3. 3

    Toggle prompt caching

    Jika system prompt stabil, set cache hit rate 50-80%.

  4. 4

    Bandingkan dan pilih

    Sort berdasarkan biaya bulanan. Pilih model termurah yang memenuhi standar kualitas.

Kenapa pakai kalkulator ini

  • Gratis selamanya — tanpa login, tanpa kartu
  • 22 LLM diperbarui bulanan
  • Jalan client-side — input pribadi
  • Workload presets, bukan rata-rata generic
  • Termasuk prompt cache + batch discounts
  • Permalinks untuk berbagi

Pertanyaan yang sering diajukan

Bagaimana cara membandingkan harga token LLM antar provider 2026?+
Masukkan rata-rata token input + output per request dan volume request bulanan. Comparator menghitung biaya per request dan bulanan di 22 model — OpenAI GPT-5, Claude Opus 4.7, Gemini 2.5 Pro, Llama 4, Mistral, DeepSeek, Amazon Nova dan lainnya. Urutkan menurut output rate karena output mendominasi tagihan produksi.
LLM mana yang output token-nya termurah di 2026?+
Amazon Nova Lite di $0.24 per juta token output adalah opsi production-grade termurah. DeepSeek V3 di $1.10 dan Gemini 2.5 Flash di $2.50 mengikuti. Hindari Claude Opus 4.7 ($75/M output) kecuali butuh kualitas reasoning-nya.
Berapa banyak prompt cache mengurangi tagihan LLM saya?+
Untuk workload RAG dengan system prompt stabil, prompt caching memotong biaya input 60–90% di Anthropic, 50% OpenAI, 75% Google. Cache hit rate steady-state nyata 50–70%. Geser slider "% input cached" untuk lihat harga efektif.
Kenapa output lebih mahal dari input di setiap model?+
Generasi output sekuensial — tiap token butuh forward pass penuh. Token input diproses paralel. Output juga memory-bandwidth-bound di model besar. Mayoritas provider charge 3–5× lebih untuk output mencerminkan GPU time aktual.
Apakah kalkulator ini termasuk diskon Batch API?+
Tidak — kalkulator menampilkan harga real-time. Untuk workload non-realtime (summarization overnight, content moderation backfill), OpenAI dan Anthropic menawarkan 50% off via Batch API. Kurangi 50% dari biaya yang ditampilkan jika traffic Anda bisa tunggu 24 jam.
Model mana kualitas per dolar terbaik di 2026?+
Claude Sonnet 4.6 ($3 input, $15 output) dan GPT-5 mini ($0.40 input, $1.60 output) pemimpin benchmark price-performance. Untuk coding, Claude Sonnet 4.6 menang di SWE-bench. Untuk chat umum, Gemini 2.5 Flash default murah-tapi-mampu di $0.30/$2.50.