Question 1

Cách forecast chi phí LLM API 12 tháng?

Accepted Answer

Ba input: request/tháng (tháng 1), growth pattern (flat/linear/exponential), và token input/output trung bình mỗi request. Calculator dự báo chi phí từng tháng và xuất tổng năm 1. Lưu scenario để so model choice song song.

Question 2

Growth pattern nên dùng — flat, linear, hay exponential?

Accepted Answer

Flat: tool nội bộ ổn định hoặc B2B SaaS ở scale. Linear: sản phẩm tăng trưởng điển hình +10% MoM. Exponential: startup pre-PMF hoặc app consumer viral nhân đôi 1–2 tháng. Phần lớn sản phẩm AI giữa linear và 1.3× exponential.

Question 3

GPT-5 hay Claude Sonnet 4.6 rẻ hơn ở 100M token/tháng?

Accepted Answer

Ở 100M token (80M input, 20M output): GPT-5 tốn $1,400/tháng, Claude Sonnet 4.6 tốn $540/tháng — chênh 60%. Sonnet 4.6 thắng giá ở hầu hết mọi scale. Đổi trừ khi cần feature đặc thù GPT-5.

Question 4

Calculator này có tính tiết kiệm prompt cache không?

Accepted Answer

Có — toggle "cache hit rate" để mô phỏng. Anthropic charge 10% giá input bình thường khi cache hit, OpenAI 50%, Google 25%. Ở 60% cache hit rate trên RAG workload, chi phí input Anthropic giảm 54%. Đáng kể cho app system-prompt dài.

Question 5

Forecast LLM 12 tháng chính xác đến đâu?

Accepted Answer

Cho 3 tháng đầu: trong 10% nếu ước tính traffic thực tế. Cho tháng 6–12: ±30% là bình thường vì pricing thay đổi và có thể đổi model. Re-run forecast hàng tháng và pin saved scenario cho báo cáo executive.

Question 6

Cách rẻ nhất để serve 1 tỷ token LLM/tháng?

Accepted Answer

Ba đường: (1) DeepSeek V3 ở $1.10/M output = ~$220/tháng cho 200M token output, (2) Together Llama 4 70B ở $0.88/M = $176/tháng, (3) self-host vLLM trên 4× H100 ở $2.50/giờ = $7,200/tháng phẳng (đáng trên ~3B token/tháng). Calculator so cả ba.

Model	Tháng 1	Tổng năm 1	So Sonnet
Amazon Nova Lite	$10	$120	0.02×
DeepSeek V3	$80	$960	0.15×
Gemini 2.5 Flash	$74	$888	0.14×
Claude Haiku 4.5	$144	$1,728	0.27×
Claude Sonnet 4.6	$540	$6,480	1.00×
OpenAI GPT-5	$1,400	$16,800	2.59×
Claude Opus 4.7	$2,700	$32,400	5.00×

Ước tính chi phí LLM API/tháng

Calculator này làm được gì

Forecast từng tháng

Growth pattern

Mô phỏng prompt cache

So sánh 22 model

Lưu scenario

Tổng năm 1

So sánh nhanh

Cách dùng calculator

Vì sao nên dùng calculator này

Câu hỏi thường gặp