AITOT

Calculator

Calculator chi phí Embeddings AI

Ước tính chi phí embed một lần và định kỳ trên 9+ provider. Nhập kích thước corpus, chunk strategy, tần suất refresh.

Pricing cập nhật:

AITOT Embeddings Cost calculator ước tính chi phí embed corpus một lần cộng re-embed recurring trên 9 provider — OpenAI text-embedding-3-small/large, Cohere Embed v4, Voyage 3 (Lite + standard), Jina v3, BGE-M3 (self-host), Mistral Embed, Google text-embedding-005, và Azure OpenAI Embed.

Cho corpus 1M doc ở 500 token/doc trung bình = 500M token. OpenAI text-embedding-3-small: $10. OpenAI text-embedding-3-large: $65. Cohere Embed v4: $50. Voyage 3 Lite: $10. Phần lớn hóa đơn embed một lần nhỏ; re-embedding recurring từ update doc mới là cái scale.

Toggle tần suất refresh (0 = không bao giờ, 0.25 = mỗi 4 tháng, 1 = tháng, 4 = tuần). Trên 5B token/tháng, BGE-M3 self-host trên một H100 thắng OpenAI. Calculator hiển thị break-even self-host song song với managed provider.

Rẻ nhất · năm 1

Together · BGE-M3

1024 dim · 8,192 token tối đa

$2

ProviderModel$ / 1M tokenChi phí embed một lầnChi phí/thángNăm 1
TogetherBGE-M3

1024 dim · Self-host open weights for $0

$0.008$0.40$0.14$2
Togetherbge-large-en-v1.5

1024 dim

$0.008$0.40$0.14$2
Fireworksnomic-embed-text-v1.5

768 dim

$0.008$0.40$0.14$2
Jina AIjina-embeddings-v3

1024 dim · configurable

$0.012$0.60$0.21$3
Jina AIjina-embeddings-v4

2048 dim · configurable

$0.018$0.90$0.31$5
OpenAItext-embedding-3-small

1536 dim · configurable

$0.02$1.00$0.35$5
Voyage AIvoyage-4-lite

512 dim · 200M tokens free

$0.02$1.00$0.35$5
Voyage AIvoyage-3-lite

512 dim

$0.02$1.00$0.35$5
Amazon BedrockTitan Embed v2

1024 dim · configurable

$0.02$1.00$0.35$5
Voyage AIvoyage-4

1024 dim · configurable · 200M tokens free

$0.06$3.00$1.05$16
Voyage AIvoyage-3

1024 dim

$0.06$3.00$1.05$16
Cohereembed-english-v3.0

1024 dim

$0.10$5.00$1.75$26
Cohereembed-multilingual-v3.0

1024 dim

$0.10$5.00$1.75$26
Cohereembed-english-light-v3.0

384 dim · Smaller, cheaper at inference

$0.10$5.00$1.75$26
Mistralmistral-embed

1024 dim

$0.10$5.00$1.75$26
Voyage AIvoyage-4-large

1024 dim · configurable · Top MTEB 2026; 200M tokens free

$0.12$6.00$2.10$31
OpenAItext-embedding-3-large

3072 dim · configurable · Matryoshka — truncate to 256/512/1024 without retrain

$0.13$6.50$2.28$34
GoogleGemini Embedding

3072 dim · configurable · Text-only

$0.15$7.50$2.63$39
Voyage AIvoyage-3-large

1024 dim · configurable · Legacy v3; consider voyage-4-large

$0.18$9.00$3.15$47
Voyage AIvoyage-code-3

1024 dim · Optimized for code retrieval

$0.18$9.00$3.15$47
GoogleGemini Embedding 2

3072 dim · configurable · Multimodal: text $0.20, image $0.45, audio $6.50, video $12 per 1M tokens

$0.20$10.00$3.50$52

Refresh 0.25 nghĩa là re-embed corpus mỗi 4 tháng. Các model "configurable" hỗ trợ Matryoshka — có thể giảm dimension sau khi embed mà không cần làm lại.

Calculator này làm được gì

So sánh 9 provider

OpenAI 3-small/large, Cohere v4, Voyage 3, Jina, Mistral, Google, Azure, BGE-M3 self-host.

Một lần + recurring

Chi phí embed corpus ban đầu + chi phí re-embed tháng hiển thị riêng.

Slider tần suất refresh

Mô phỏng tần suất re-embed (không bao giờ, quý, tháng, tuần).

Break-even self-host

So managed API với BGE-M3 trên H100 thuê. Break-even ~2B token/tháng.

Cắt dimension

Model Matryoshka (OpenAI 3-large) cho phép cắt dimension để tiết kiệm storage.

Mô phỏng query token

Chi phí embedding đối xứng — query token cũng tính. Thường bị bỏ qua.

So sánh nhanh

Chi phí embed corpus 500M token + 50M query token tháng

ProviderMột lầnTháng$/1M token
Jina v3$9$0.90$0.018
Voyage 3 Lite$10$1$0.02
OpenAI text-embed-3-small$10$1$0.02
Cohere Embed v4 Light$50$5$0.10
Voyage 3 Large$65$6.50$0.13
OpenAI text-embed-3-large$65$6.50$0.13
Self-host BGE-M3 (H100)~$45~$1,300phẳng/tháng

Self-host thắng trên ~2B token/tháng tổng throughput.

Cách dùng calculator

Tính chi phí embed corpus một lần + re-embed recurring trên 9 provider.

  1. 1

    Nhập kích thước corpus

    Token trong corpus đầy đủ. Documents × token/doc trung bình. Thông thường: 1 doc = 500 token.

  2. 2

    Đặt tần suất refresh

    0 = không bao giờ, 1 = tháng, 4 = tuần. Phần lớn corpus production re-embed theo quý.

  3. 3

    Thêm query volume

    Token query tháng (query × token/query). Thường là line item lớn nhất theo thời gian.

  4. 4

    So sánh và chọn

    Sort theo chi phí tháng. Self-host BGE-M3 thắng trên ~2B token/tháng.

Vì sao nên dùng calculator này

  • 9 provider refresh hàng tháng
  • Tách một lần + recurring
  • Mô phỏng break-even self-host
  • Cắt dimension Matryoshka
  • Tính query token
  • Không cần đăng nhập

Câu hỏi thường gặp

Provider embeddings rẻ nhất 2026?+
Cho embed corpus một lần: Voyage 3 Lite ở $0.02/M token. OpenAI text-embedding-3-small ở $0.02/M. Cohere Embed v4 Light ở $0.10/M. Jina v3 ở $0.018/M. BGE M3 self-host miễn phí ở scale. Cho cân bằng chất lượng + giá, OpenAI text-embedding-3-large ở $0.13/M thắng.
Embed corpus 1M doc tốn bao nhiêu?+
Ở 500 token/doc trung bình × 1M doc = 500M token. OpenAI text-embedding-3-small: $10. OpenAI text-embedding-3-large: $65. Cohere Embed v4: $50. Phần lớn embed corpus một lần hóa đơn nhỏ — re-embedding recurring từ update doc là cái scale.
Bao lâu re-embed corpus một lần?+
Data tham khảo tĩnh (luật, khoa học): năm hoặc khi schema thay đổi. Doc cập nhật thường xuyên (catalog sản phẩm, docs site): re-embed delta hàng tuần chỉ chunk đã đổi. Không batch re-embed data không đổi — dùng change-detection trên file hash hoặc timestamp last-modified.
Nên dùng dimension embedding 1536 hay 3072?+
1536 (default OpenAI) đủ cho 90% use case. 3072 thắng cho retrieval long-context (luật, khoa học). 1536 lưu storage rẻ 2× ở vector DB và query nhanh hơn. Dùng Matryoshka truncation test 512 → 1024 → 1536 — gain thường plateau ở 1024.
Self-host BGE-M3 có rẻ hơn embedding OpenAI thật không?+
Trên ~5B token embed/tháng, có. BGE-M3 trên một H100 ($1.85–$2.50/giờ) chạy ~2M token/giây — là 5T token/tháng ở $1.3k/tháng phẳng. OpenAI text-embedding-3-large ở $0.13/M = $650 mỗi tỷ token, nên self-host thắng trên ~2B token/tháng.
Embeddings price theo token hay document?+
Luôn theo input token. Calculator chuyển doc count × token/doc trung bình thành token bill. OpenAI, Cohere, Voyage, Jina đều charge mỗi triệu input token bất kể dimension. Storage tách (trả cho vector DB).