Calculator
Ước tính chi phí Vector DB
Ước tính phí hàng tháng dựa trên số vector, dimension và query/ngày. Tách biệt index size và query cost.
Pricing cập nhật:
AITOT Vector DB Cost Estimator so sánh chi phí tháng trên 9 provider — Pinecone Serverless, Pinecone Pod-based, Qdrant Cloud, Weaviate Cloud, Milvus Cloud, Supabase pgvector, Turso, Chroma Cloud, và self-hosted trên VPS.
Nhập số vector (10k đến 100M+), dimension embedding (384 đến 3072), và queries/ngày. Calculator tách riêng chi phí storage, query, và index overhead để bạn xác định line item nào đang đẩy hóa đơn — và tìm provider rẻ nhất ở scale của bạn.
Toggle binary quantization (hỗ trợ bởi Pinecone, Qdrant, Milvus) để xem compression storage 32× với loss recall tối thiểu. Với vector 1536-dim, binary quant cắt storage từ 6KB/vector xuống 192 byte/vector. Thường là chênh giữa hóa đơn Pinecone $90/tháng và $25/tháng.
Rẻ nhất
Turbopuffer · Object-store backed
Kích thước đã index: 6.29 GB (Kích thước thô: 5.72 GB)
$4.98
/tháng
| Provider | Lưu trữ | Đọc | Ghi | Tổng / tháng |
|---|---|---|---|---|
| TurbopufferObject-store backed S3-backed; cold reads slower but radically cheaper at scale | $0.25 | $4.50 | $0.22 | $4.98 |
| LanceDB CloudStandard | $0.69 | $6.00 | $0.30 | $6.99 |
| Zilliz / MilvusServerless 5M free vectors; pay-as-you-go above | $1.49 | $10.50 | $0.53 | $12.51 |
| Weaviate CloudServerless Serverless: per-million-vector + per-query | $0.32 | $7.50 | $0.38 | $25.00phí tối thiểu |
| Supabase pgvectorPro (8GB included) Bundled with Postgres compute; query cost folded into DB hours | $1.07 | — | — | $25.00phí tối thiểu |
| PineconeServerless (s1) us-east-1; reads billed in Read Units (1 RU ≈ 1 query × 1KB result). Standard plan $50/mo min usage. | $2.64 | $24.00 | $0.60 | $27.24 |
| MongoDB AtlasM10 + Vector Search Vector search included with Atlas tier | $2.00 | — | — | $57.00phí tối thiểu |
| Qdrant CloudHybrid Cloud (1×1GB) Per-node billing ~$76/node; small nodes hold ~30 GB indexed | $18.60 | — | — | $76.00phí tối thiểu |
| PineconePod (p1.x1) 1 pod ≈ 5M 768-dim vectors; scale by adding pods (~$70/pod-mo) | $112.15 | — | — | $112.15 |
Index overhead và giá thay đổi theo region. Quantization (int8/binary) đánh đổi recall lấy chi phí — luôn benchmark trước khi deploy.
Calculator này làm được gì
So sánh 9 vector DB
Pinecone Serverless + Pod, Qdrant, Weaviate, Milvus, Supabase pgvector, Turso, Chroma, self-hosted.
Binary quantization
Toggle để xem compression storage 32× trên Pinecone, Qdrant, Milvus.
Dimension scaling
Xem 1536 vs 3072 dimension ảnh hưởng storage + query cost ở scale của bạn.
Tách storage + query
Chi phí tách thành index storage, query operation, và metadata storage.
Break-even self-host
So sánh managed với VPS $80/tháng chạy Qdrant hoặc Milvus.
Hybrid + filter
Tính cả chi phí filter operation nếu provider charge riêng.
So sánh nhanh
Chi phí tháng ở 10M × 1536-dim vector, 100k query/ngày
| Provider | Storage | Query | Tổng/tháng |
|---|---|---|---|
| Supabase pgvector (Pro) | gồm. | gồm. | $25 |
| Qdrant Cloud (basic) | $30 | $10 | $40 |
| Weaviate Serverless | $35 | $10 | $45 |
| Milvus Cloud (Starter) | $50 | $15 | $65 |
| Pinecone Serverless | $50 | $40 | $90 |
| Chroma Cloud | $70 | $20 | $90 |
| Pinecone Pod-based (s1) | $100 | $40 | $140 |
| Self-host trên VPS $80 | $80 | gồm. | $80 |
Chi phí giảm 60–80% với binary quantization khi hỗ trợ.
Cách dùng calculator
So sánh chi phí tháng trên 9 vector DB với corpus và query volume cụ thể.
- 1
Nhập số vector
Documents × chunks per doc. Thông thường: 1 doc = 5–20 chunk @ 500 token mỗi cái.
- 2
Chọn dimension
1536 mặc định (OpenAI text-embedding-3). 3072 gấp đôi storage; 768 chia đôi.
- 3
Đặt query volume
Số query/ngày của app. Caching giảm số này — phần lớn app cache 30–50% query.
- 4
Toggle binary quantization
Trên Pinecone, Qdrant, Milvus, binary quant cắt storage 32× — giảm hóa đơn lớn.
Vì sao nên dùng calculator này
- ✓9 provider tracked hàng tháng
- ✓Mô phỏng binary quantization
- ✓Có so sánh self-host
- ✓Tách chi phí dimension + filter
- ✓Hiển thị giới hạn free tier
- ✓Không cần đăng nhập