Calculator

Calculator chi phí Embeddings AI

Ước tính chi phí embed một lần và định kỳ trên 9+ provider. Nhập kích thước corpus, chunk strategy, tần suất refresh.

Pricing cập nhật: 2026-06-06

AITOT Embeddings Cost calculator ước tính chi phí embed corpus một lần cộng re-embed recurring trên 9 provider — OpenAI text-embedding-3-small/large, Cohere Embed v4, Voyage 3 (Lite + standard), Jina v3, BGE-M3 (self-host), Mistral Embed, Google text-embedding-005, và Azure OpenAI Embed.

Cho corpus 1M doc ở 500 token/doc trung bình = 500M token. OpenAI text-embedding-3-small: $10. OpenAI text-embedding-3-large: $65. Cohere Embed v4: $50. Voyage 3 Lite: $10. Phần lớn hóa đơn embed một lần nhỏ; re-embedding recurring từ update doc mới là cái scale.

Toggle tần suất refresh (0 = không bao giờ, 0.25 = mỗi 4 tháng, 1 = tháng, 4 = tuần). Trên 5B token/tháng, BGE-M3 self-host trên một H100 thắng OpenAI. Calculator hiển thị break-even self-host song song với managed provider.

Rẻ nhất · năm 1

Together · BGE-M3

1024 dim · 8,192 token tối đa

Provider	Model	$ / 1M token	Chi phí embed một lần	Chi phí/tháng	Năm 1
Together	BGE-M3 1024 dim · Self-host open weights for $0	$0.008	$0.40	$0.14	$2
Together	bge-large-en-v1.5 1024 dim	$0.008	$0.40	$0.14	$2
Fireworks	nomic-embed-text-v1.5 768 dim	$0.008	$0.40	$0.14	$2
Jina AI	jina-embeddings-v3 1024 dim · configurable	$0.012	$0.60	$0.21	$3
Jina AI	jina-embeddings-v4 2048 dim · configurable	$0.018	$0.90	$0.31	$5
OpenAI	text-embedding-3-small 1536 dim · configurable	$0.02	$1.00	$0.35	$5
Voyage AI	voyage-4-lite 512 dim · 200M tokens free	$0.02	$1.00	$0.35	$5
Voyage AI	voyage-3-lite 512 dim	$0.02	$1.00	$0.35	$5
Amazon Bedrock	Titan Embed v2 1024 dim · configurable	$0.02	$1.00	$0.35	$5
Voyage AI	voyage-4 1024 dim · configurable · 200M tokens free	$0.06	$3.00	$1.05	$16
Voyage AI	voyage-3 1024 dim	$0.06	$3.00	$1.05	$16
Cohere	embed-english-v3.0 1024 dim	$0.10	$5.00	$1.75	$26
Cohere	embed-multilingual-v3.0 1024 dim	$0.10	$5.00	$1.75	$26
Cohere	embed-english-light-v3.0 384 dim · Smaller, cheaper at inference	$0.10	$5.00	$1.75	$26
Mistral	mistral-embed 1024 dim	$0.10	$5.00	$1.75	$26
Voyage AI	voyage-4-large 1024 dim · configurable · Top MTEB 2026; 200M tokens free	$0.12	$6.00	$2.10	$31
OpenAI	text-embedding-3-large 3072 dim · configurable · Matryoshka — truncate to 256/512/1024 without retrain	$0.13	$6.50	$2.28	$34
Google	Gemini Embedding 3072 dim · configurable · Text-only	$0.15	$7.50	$2.63	$39
Voyage AI	voyage-3-large 1024 dim · configurable · Legacy v3; consider voyage-4-large	$0.18	$9.00	$3.15	$47
Voyage AI	voyage-code-3 1024 dim · Optimized for code retrieval	$0.18	$9.00	$3.15	$47
Google	Gemini Embedding 2 3072 dim · configurable · Multimodal: text $0.20, image $0.45, audio $6.50, video $12 per 1M tokens	$0.20	$10.00	$3.50	$52

Refresh 0.25 nghĩa là re-embed corpus mỗi 4 tháng. Các model "configurable" hỗ trợ Matryoshka — có thể giảm dimension sau khi embed mà không cần làm lại.

Calculator này làm được gì

So sánh 9 provider

OpenAI 3-small/large, Cohere v4, Voyage 3, Jina, Mistral, Google, Azure, BGE-M3 self-host.

Một lần + recurring

Chi phí embed corpus ban đầu + chi phí re-embed tháng hiển thị riêng.

Slider tần suất refresh

Mô phỏng tần suất re-embed (không bao giờ, quý, tháng, tuần).

Break-even self-host

So managed API với BGE-M3 trên H100 thuê. Break-even ~2B token/tháng.

Cắt dimension

Model Matryoshka (OpenAI 3-large) cho phép cắt dimension để tiết kiệm storage.

Mô phỏng query token

Chi phí embedding đối xứng — query token cũng tính. Thường bị bỏ qua.

So sánh nhanh

Chi phí embed corpus 500M token + 50M query token tháng

Provider	Một lần	Tháng	$/1M token
Jina v3	$9	$0.90	$0.018
Voyage 3 Lite	$10	$1	$0.02
OpenAI text-embed-3-small	$10	$1	$0.02
Cohere Embed v4 Light	$50	$5	$0.10
Voyage 3 Large	$65	$6.50	$0.13
OpenAI text-embed-3-large	$65	$6.50	$0.13
Self-host BGE-M3 (H100)	~$45	~$1,300	phẳng/tháng

Self-host thắng trên ~2B token/tháng tổng throughput.

Cách dùng calculator

Tính chi phí embed corpus một lần + re-embed recurring trên 9 provider.

1
Nhập kích thước corpus
Token trong corpus đầy đủ. Documents × token/doc trung bình. Thông thường: 1 doc = 500 token.
2
Đặt tần suất refresh
0 = không bao giờ, 1 = tháng, 4 = tuần. Phần lớn corpus production re-embed theo quý.
3
Thêm query volume
Token query tháng (query × token/query). Thường là line item lớn nhất theo thời gian.
4
So sánh và chọn
Sort theo chi phí tháng. Self-host BGE-M3 thắng trên ~2B token/tháng.

Vì sao nên dùng calculator này

✓9 provider refresh hàng tháng
✓Tách một lần + recurring
✓Mô phỏng break-even self-host
✓Cắt dimension Matryoshka
✓Tính query token
✓Không cần đăng nhập

Câu hỏi thường gặp

Provider embeddings rẻ nhất 2026?+

Cho embed corpus một lần: Voyage 3 Lite ở $0.02/M token. OpenAI text-embedding-3-small ở $0.02/M. Cohere Embed v4 Light ở $0.10/M. Jina v3 ở $0.018/M. BGE M3 self-host miễn phí ở scale. Cho cân bằng chất lượng + giá, OpenAI text-embedding-3-large ở $0.13/M thắng.

Embed corpus 1M doc tốn bao nhiêu?+

Ở 500 token/doc trung bình × 1M doc = 500M token. OpenAI text-embedding-3-small: $10. OpenAI text-embedding-3-large: $65. Cohere Embed v4: $50. Phần lớn embed corpus một lần hóa đơn nhỏ — re-embedding recurring từ update doc là cái scale.

Bao lâu re-embed corpus một lần?+

Data tham khảo tĩnh (luật, khoa học): năm hoặc khi schema thay đổi. Doc cập nhật thường xuyên (catalog sản phẩm, docs site): re-embed delta hàng tuần chỉ chunk đã đổi. Không batch re-embed data không đổi — dùng change-detection trên file hash hoặc timestamp last-modified.

Nên dùng dimension embedding 1536 hay 3072?+

1536 (default OpenAI) đủ cho 90% use case. 3072 thắng cho retrieval long-context (luật, khoa học). 1536 lưu storage rẻ 2× ở vector DB và query nhanh hơn. Dùng Matryoshka truncation test 512 → 1024 → 1536 — gain thường plateau ở 1024.

Self-host BGE-M3 có rẻ hơn embedding OpenAI thật không?+

Trên ~5B token embed/tháng, có. BGE-M3 trên một H100 ($1.85–$2.50/giờ) chạy ~2M token/giây — là 5T token/tháng ở $1.3k/tháng phẳng. OpenAI text-embedding-3-large ở $0.13/M = $650 mỗi tỷ token, nên self-host thắng trên ~2B token/tháng.

Embeddings price theo token hay document?+

Luôn theo input token. Calculator chuyển doc count × token/doc trung bình thành token bill. OpenAI, Cohere, Voyage, Jina đều charge mỗi triệu input token bất kể dimension. Storage tách (trả cho vector DB).