Calculator
Ước tính chi phí LLM API/tháng
Dự báo chi phí API 12 tháng với scenario saver. Tùy chỉnh request/tháng, tỷ lệ token và model mix.
Pricing cập nhật:
AITOT LLM API Monthly Cost Estimator dự báo chi phí 12 tháng trên OpenAI GPT-5, Claude Sonnet 4.6, Gemini 2.5 Pro, Llama 4, DeepSeek V3 và 17 model khác. Input: volume request tháng 1, growth pattern (flat / linear / exponential), và số token trung bình mỗi request.
Calculator xuất chi phí theo từng tháng, tổng năm 1, và model rẻ nhất ở scale của bạn. Toggle prompt cache để mô phỏng tiết kiệm input 60–90% trên Anthropic, 50% trên OpenAI, 25% trên Google. Lưu scenario để so model choice cho báo cáo executive.
Ở 100M token/tháng (80M input, 20M output), Claude Sonnet 4.6 tốn $540/tháng, GPT-5 $1,400/tháng, DeepSeek V3 $80/tháng. Chênh 17× — đó là lý do model choice là đòn bẩy ngân sách lớn nhất 2026, không phải caching hay batching.
Tổng năm 1
Anthropic · Claude Sonnet 4.6
$36,529
Dự báo giả định 1 model chính. Với agent đa model, chạy nhiều scenario và cộng tổng.
Calculator này làm được gì
Forecast từng tháng
Xem đường cong chi phí 12 tháng, không chỉ tổng năm.
Growth pattern
Flat (B2B ổn định), linear (~10% MoM), hoặc exponential (1.3–2× tháng) — chọn của bạn.
Mô phỏng prompt cache
Toggle cache hit rate để xem giá hiệu dụng Anthropic (10% hit), OpenAI (50%), Google (25%).
So sánh 22 model
GPT-5, Claude family, Gemini, Llama 4, DeepSeek, Mistral, Amazon Nova, Cohere.
Lưu scenario
Lưu nhiều forecast vào localStorage để so model + growth combo.
Tổng năm 1
Số ngân sách trình ban quản trị. Cộng toggle inference tax buffer.
So sánh nhanh
Chi phí năm 1 ở 100M token/tháng, traffic phẳng, input:output 4:1
| Model | Tháng 1 | Tổng năm 1 | So Sonnet |
|---|---|---|---|
| Amazon Nova Lite | $10 | $120 | 0.02× |
| DeepSeek V3 | $80 | $960 | 0.15× |
| Gemini 2.5 Flash | $74 | $888 | 0.14× |
| Claude Haiku 4.5 | $144 | $1,728 | 0.27× |
| Claude Sonnet 4.6 | $540 | $6,480 | 1.00× |
| OpenAI GPT-5 | $1,400 | $16,800 | 2.59× |
| Claude Opus 4.7 | $2,700 | $32,400 | 5.00× |
Giả định 80M input + 20M output token/tháng, không cache.
Cách dùng calculator
Dự báo chi phí LLM API 12 tháng trên 22 model với growth modeling.
- 1
Nhập volume tháng 1
Đặt request/tháng cho tháng đầu. Thực tế — overestimate sẽ phồng to.
- 2
Chọn growth pattern
Flat (B2B ổn định), linear (10% MoM), hoặc exponential (1.3× MoM tăng trưởng viral).
- 3
Đặt token/request
Token input + output trung bình. Chat ~2k in / 400 out. RAG ~6k in / 600 out.
- 4
Lưu và so sánh
Lưu nhiều model choice để so tổng năm 1 song song.
Vì sao nên dùng calculator này
- ✓22 model tracked hàng tháng
- ✓Mô phỏng growth pattern
- ✓Có prompt cache + batch discount
- ✓Lưu + so sánh scenario
- ✓Toggle inference tax buffer
- ✓Không cần đăng nhập