AITOT

Calculator

Ước tính chi phí Vector DB

Ước tính phí hàng tháng dựa trên số vector, dimension và query/ngày. Tách biệt index size và query cost.

Pricing cập nhật:

AITOT Vector DB Cost Estimator so sánh chi phí tháng trên 9 provider — Pinecone Serverless, Pinecone Pod-based, Qdrant Cloud, Weaviate Cloud, Milvus Cloud, Supabase pgvector, Turso, Chroma Cloud, và self-hosted trên VPS.

Nhập số vector (10k đến 100M+), dimension embedding (384 đến 3072), và queries/ngày. Calculator tách riêng chi phí storage, query, và index overhead để bạn xác định line item nào đang đẩy hóa đơn — và tìm provider rẻ nhất ở scale của bạn.

Toggle binary quantization (hỗ trợ bởi Pinecone, Qdrant, Milvus) để xem compression storage 32× với loss recall tối thiểu. Với vector 1536-dim, binary quant cắt storage từ 6KB/vector xuống 192 byte/vector. Thường là chênh giữa hóa đơn Pinecone $90/tháng và $25/tháng.

Rẻ nhất

Turbopuffer · Object-store backed

Kích thước đã index: 6.29 GB (Kích thước thô: 5.72 GB)

$4.98

/tháng

ProviderLưu trữĐọcGhiTổng / tháng
TurbopufferObject-store backed

S3-backed; cold reads slower but radically cheaper at scale

$0.25$4.50$0.22$4.98
LanceDB CloudStandard$0.69$6.00$0.30$6.99
Zilliz / MilvusServerless

5M free vectors; pay-as-you-go above

$1.49$10.50$0.53$12.51
Weaviate CloudServerless

Serverless: per-million-vector + per-query

$0.32$7.50$0.38$25.00phí tối thiểu
Supabase pgvectorPro (8GB included)

Bundled with Postgres compute; query cost folded into DB hours

$1.07$25.00phí tối thiểu
PineconeServerless (s1)

us-east-1; reads billed in Read Units (1 RU ≈ 1 query × 1KB result). Standard plan $50/mo min usage.

$2.64$24.00$0.60$27.24
MongoDB AtlasM10 + Vector Search

Vector search included with Atlas tier

$2.00$57.00phí tối thiểu
Qdrant CloudHybrid Cloud (1×1GB)

Per-node billing ~$76/node; small nodes hold ~30 GB indexed

$18.60$76.00phí tối thiểu
PineconePod (p1.x1)

1 pod ≈ 5M 768-dim vectors; scale by adding pods (~$70/pod-mo)

$112.15$112.15

Index overhead và giá thay đổi theo region. Quantization (int8/binary) đánh đổi recall lấy chi phí — luôn benchmark trước khi deploy.

Calculator này làm được gì

So sánh 9 vector DB

Pinecone Serverless + Pod, Qdrant, Weaviate, Milvus, Supabase pgvector, Turso, Chroma, self-hosted.

Binary quantization

Toggle để xem compression storage 32× trên Pinecone, Qdrant, Milvus.

Dimension scaling

Xem 1536 vs 3072 dimension ảnh hưởng storage + query cost ở scale của bạn.

Tách storage + query

Chi phí tách thành index storage, query operation, và metadata storage.

Break-even self-host

So sánh managed với VPS $80/tháng chạy Qdrant hoặc Milvus.

Hybrid + filter

Tính cả chi phí filter operation nếu provider charge riêng.

So sánh nhanh

Chi phí tháng ở 10M × 1536-dim vector, 100k query/ngày

ProviderStorageQueryTổng/tháng
Supabase pgvector (Pro)gồm.gồm.$25
Qdrant Cloud (basic)$30$10$40
Weaviate Serverless$35$10$45
Milvus Cloud (Starter)$50$15$65
Pinecone Serverless$50$40$90
Chroma Cloud$70$20$90
Pinecone Pod-based (s1)$100$40$140
Self-host trên VPS $80$80gồm.$80

Chi phí giảm 60–80% với binary quantization khi hỗ trợ.

Cách dùng calculator

So sánh chi phí tháng trên 9 vector DB với corpus và query volume cụ thể.

  1. 1

    Nhập số vector

    Documents × chunks per doc. Thông thường: 1 doc = 5–20 chunk @ 500 token mỗi cái.

  2. 2

    Chọn dimension

    1536 mặc định (OpenAI text-embedding-3). 3072 gấp đôi storage; 768 chia đôi.

  3. 3

    Đặt query volume

    Số query/ngày của app. Caching giảm số này — phần lớn app cache 30–50% query.

  4. 4

    Toggle binary quantization

    Trên Pinecone, Qdrant, Milvus, binary quant cắt storage 32× — giảm hóa đơn lớn.

Vì sao nên dùng calculator này

  • 9 provider tracked hàng tháng
  • Mô phỏng binary quantization
  • Có so sánh self-host
  • Tách chi phí dimension + filter
  • Hiển thị giới hạn free tier
  • Không cần đăng nhập

Câu hỏi thường gặp

Vector DB nào rẻ nhất ở 10M vector 2026?+
Với 10M × 1536-dim vector ở query volume vừa: pgvector trên Supabase Pro $25/tháng rẻ nhất. Qdrant Cloud $40/tháng và Weaviate Serverless $45/tháng theo sau. Pinecone Serverless $90/tháng và Pinecone Pod-based $140/tháng là premium-priced.
Pinecone Serverless so với Pod-based pricing thế nào?+
Serverless: $0.40/M write + $4 mỗi triệu read + $0.33/GB storage tháng. Pod-based: $0.096/giờ cho s1 starter pod (~$70/tháng base). Serverless thắng ở query volume thấp và traffic bursty. Pod-based thắng ở >500 read/giây steady-state.
Dimension vector ảnh hưởng chi phí nhiều không?+
Có. Từ 1536 (OpenAI text-embedding-3-large) lên 3072 (Cohere Embed v4) gấp đôi storage trên phần lớn provider. Với binary quantization (Pinecone, Qdrant), vector 1536-dim nén còn 192 byte — nhỏ hơn 32×. Check toggle "use binary quantization".
Pinecone vs Weaviate vs Qdrant — chọn cái nào 2026?+
Pinecone: ops dễ nhất, giá premium. Weaviate: tốt nhất cho hybrid search + graph. Qdrant: rẻ nhất ở scale, filtering tốt nhất. Supabase pgvector: tốt nhất nếu đã có Postgres. Calculator hiển thị side-by-side chi phí ở scale của bạn.
Cách cắt hóa đơn vector DB một nửa?+
Ba đòn bẩy lớn nhất: (1) giảm dimension embedding qua Matryoshka của OpenAI — lưu ở 512 thay vì 1536 với loss recall tối thiểu, (2) bật binary quantization khi hỗ trợ, (3) chuyển từ Pinecone Pod-based sang Qdrant Cloud hoặc self-host trên VPS $80/tháng để tiết kiệm 80%.
Self-host Qdrant hoặc Milvus có rẻ hơn thật không?+
Trên 10M vector, có — VPS $80/tháng chạy Qdrant fine cho 50M vector. Dưới 5M vector, managed provider (Pinecone Free, Qdrant Cloud free tier) thường thắng về tổng chi phí khi tính giờ ops. Calculator có ước tính self-host.