Calculator
Calculator chi phí Embeddings AI
Ước tính chi phí embed một lần và định kỳ trên 9+ provider. Nhập kích thước corpus, chunk strategy, tần suất refresh.
Pricing cập nhật:
AITOT Embeddings Cost calculator ước tính chi phí embed corpus một lần cộng re-embed recurring trên 9 provider — OpenAI text-embedding-3-small/large, Cohere Embed v4, Voyage 3 (Lite + standard), Jina v3, BGE-M3 (self-host), Mistral Embed, Google text-embedding-005, và Azure OpenAI Embed.
Cho corpus 1M doc ở 500 token/doc trung bình = 500M token. OpenAI text-embedding-3-small: $10. OpenAI text-embedding-3-large: $65. Cohere Embed v4: $50. Voyage 3 Lite: $10. Phần lớn hóa đơn embed một lần nhỏ; re-embedding recurring từ update doc mới là cái scale.
Toggle tần suất refresh (0 = không bao giờ, 0.25 = mỗi 4 tháng, 1 = tháng, 4 = tuần). Trên 5B token/tháng, BGE-M3 self-host trên một H100 thắng OpenAI. Calculator hiển thị break-even self-host song song với managed provider.
Rẻ nhất · năm 1
Together · BGE-M3
1024 dim · 8,192 token tối đa
$2
| Provider | Model | $ / 1M token | Chi phí embed một lần | Chi phí/tháng | Năm 1 |
|---|---|---|---|---|---|
| Together | BGE-M3 1024 dim · Self-host open weights for $0 | $0.008 | $0.40 | $0.14 | $2 |
| Together | bge-large-en-v1.5 1024 dim | $0.008 | $0.40 | $0.14 | $2 |
| Fireworks | nomic-embed-text-v1.5 768 dim | $0.008 | $0.40 | $0.14 | $2 |
| Jina AI | jina-embeddings-v3 1024 dim · configurable | $0.012 | $0.60 | $0.21 | $3 |
| Jina AI | jina-embeddings-v4 2048 dim · configurable | $0.018 | $0.90 | $0.31 | $5 |
| OpenAI | text-embedding-3-small 1536 dim · configurable | $0.02 | $1.00 | $0.35 | $5 |
| Voyage AI | voyage-4-lite 512 dim · 200M tokens free | $0.02 | $1.00 | $0.35 | $5 |
| Voyage AI | voyage-3-lite 512 dim | $0.02 | $1.00 | $0.35 | $5 |
| Amazon Bedrock | Titan Embed v2 1024 dim · configurable | $0.02 | $1.00 | $0.35 | $5 |
| Voyage AI | voyage-4 1024 dim · configurable · 200M tokens free | $0.06 | $3.00 | $1.05 | $16 |
| Voyage AI | voyage-3 1024 dim | $0.06 | $3.00 | $1.05 | $16 |
| Cohere | embed-english-v3.0 1024 dim | $0.10 | $5.00 | $1.75 | $26 |
| Cohere | embed-multilingual-v3.0 1024 dim | $0.10 | $5.00 | $1.75 | $26 |
| Cohere | embed-english-light-v3.0 384 dim · Smaller, cheaper at inference | $0.10 | $5.00 | $1.75 | $26 |
| Mistral | mistral-embed 1024 dim | $0.10 | $5.00 | $1.75 | $26 |
| Voyage AI | voyage-4-large 1024 dim · configurable · Top MTEB 2026; 200M tokens free | $0.12 | $6.00 | $2.10 | $31 |
| OpenAI | text-embedding-3-large 3072 dim · configurable · Matryoshka — truncate to 256/512/1024 without retrain | $0.13 | $6.50 | $2.28 | $34 |
| Gemini Embedding 3072 dim · configurable · Text-only | $0.15 | $7.50 | $2.63 | $39 | |
| Voyage AI | voyage-3-large 1024 dim · configurable · Legacy v3; consider voyage-4-large | $0.18 | $9.00 | $3.15 | $47 |
| Voyage AI | voyage-code-3 1024 dim · Optimized for code retrieval | $0.18 | $9.00 | $3.15 | $47 |
| Gemini Embedding 2 3072 dim · configurable · Multimodal: text $0.20, image $0.45, audio $6.50, video $12 per 1M tokens | $0.20 | $10.00 | $3.50 | $52 |
Refresh 0.25 nghĩa là re-embed corpus mỗi 4 tháng. Các model "configurable" hỗ trợ Matryoshka — có thể giảm dimension sau khi embed mà không cần làm lại.
Calculator này làm được gì
So sánh 9 provider
OpenAI 3-small/large, Cohere v4, Voyage 3, Jina, Mistral, Google, Azure, BGE-M3 self-host.
Một lần + recurring
Chi phí embed corpus ban đầu + chi phí re-embed tháng hiển thị riêng.
Slider tần suất refresh
Mô phỏng tần suất re-embed (không bao giờ, quý, tháng, tuần).
Break-even self-host
So managed API với BGE-M3 trên H100 thuê. Break-even ~2B token/tháng.
Cắt dimension
Model Matryoshka (OpenAI 3-large) cho phép cắt dimension để tiết kiệm storage.
Mô phỏng query token
Chi phí embedding đối xứng — query token cũng tính. Thường bị bỏ qua.
So sánh nhanh
Chi phí embed corpus 500M token + 50M query token tháng
| Provider | Một lần | Tháng | $/1M token |
|---|---|---|---|
| Jina v3 | $9 | $0.90 | $0.018 |
| Voyage 3 Lite | $10 | $1 | $0.02 |
| OpenAI text-embed-3-small | $10 | $1 | $0.02 |
| Cohere Embed v4 Light | $50 | $5 | $0.10 |
| Voyage 3 Large | $65 | $6.50 | $0.13 |
| OpenAI text-embed-3-large | $65 | $6.50 | $0.13 |
| Self-host BGE-M3 (H100) | ~$45 | ~$1,300 | phẳng/tháng |
Self-host thắng trên ~2B token/tháng tổng throughput.
Cách dùng calculator
Tính chi phí embed corpus một lần + re-embed recurring trên 9 provider.
- 1
Nhập kích thước corpus
Token trong corpus đầy đủ. Documents × token/doc trung bình. Thông thường: 1 doc = 500 token.
- 2
Đặt tần suất refresh
0 = không bao giờ, 1 = tháng, 4 = tuần. Phần lớn corpus production re-embed theo quý.
- 3
Thêm query volume
Token query tháng (query × token/query). Thường là line item lớn nhất theo thời gian.
- 4
So sánh và chọn
Sort theo chi phí tháng. Self-host BGE-M3 thắng trên ~2B token/tháng.
Vì sao nên dùng calculator này
- ✓9 provider refresh hàng tháng
- ✓Tách một lần + recurring
- ✓Mô phỏng break-even self-host
- ✓Cắt dimension Matryoshka
- ✓Tính query token
- ✓Không cần đăng nhập