AITOT

Calculateur

Estimateur de coût Vector DB

Estimez le coût mensuel selon le nombre de vecteurs, la dimension et les requêtes par jour.

Tarifs actualisés:

Le AITOT Vector DB Cost Estimator compare coût mensuel sur 9 fournisseurs — Pinecone Serverless/Pod, Qdrant Cloud, Weaviate Cloud, Milvus Cloud, Supabase pgvector, Turso, Chroma Cloud, et self-hosted.

Mettez vector count (10k à 100M+), dimension embedding (384 à 3072), queries par jour. Le calculateur surface storage, query, index overhead séparément.

Toggle binary quantization (Pinecone, Qdrant, Milvus) pour voir 32× compression storage. Vecteur 1536-dim compresse de 6KB à 192 bytes.

Le moins cher

Turbopuffer · Object-store backed

Taille indexée: 6.29 GB (Taille brute: 5.72 GB)

$4.98

/mois

FournisseurStockageLecturesÉcrituresTotal / mois
TurbopufferObject-store backed

S3-backed; cold reads slower but radically cheaper at scale

$0.25$4.50$0.22$4.98
LanceDB CloudStandard$0.69$6.00$0.30$6.99
Zilliz / MilvusServerless

5M free vectors; pay-as-you-go above

$1.49$10.50$0.53$12.51
Weaviate CloudServerless

Serverless: per-million-vector + per-query

$0.32$7.50$0.38$25.00minimum
Supabase pgvectorPro (8GB included)

Bundled with Postgres compute; query cost folded into DB hours

$1.07$25.00minimum
PineconeServerless (s1)

us-east-1; reads billed in Read Units (1 RU ≈ 1 query × 1KB result). Standard plan $50/mo min usage.

$2.64$24.00$0.60$27.24
MongoDB AtlasM10 + Vector Search

Vector search included with Atlas tier

$2.00$57.00minimum
Qdrant CloudHybrid Cloud (1×1GB)

Per-node billing ~$76/node; small nodes hold ~30 GB indexed

$18.60$76.00minimum
PineconePod (p1.x1)

1 pod ≈ 5M 768-dim vectors; scale by adding pods (~$70/pod-mo)

$112.15$112.15

L'overhead d'index et les prix varient par région. La quantification (int8/binary) échange le recall contre le coût — toujours benchmarker avant le déploiement.

Ce que fait ce calculateur

9 vector DBs comparées

Pinecone Serverless + Pod, Qdrant, Weaviate, Milvus, Supabase pgvector, Turso, Chroma, self-host.

Binary quantization

Toggle pour 32× compression storage.

Scaling dimension

Voir comment 1536 vs 3072 affecte storage + query cost.

Storage + query split

Coûts splits en index storage, query operations, metadata.

Break-even self-host

Compare managed avec VPS $80/mois Qdrant ou Milvus.

Hybrid + filter pricing

Inclut coûts filter operation.

Comparaison rapide

Coût mensuel à 10M × 1536-dim vecteurs, 100k queries/jour

FournisseurStorageQueriesTotal / mois
Supabase pgvector (Pro)incl.incl.$25
Qdrant Cloud (basic)$30$10$40
Weaviate Serverless$35$10$45
Milvus Cloud (Starter)$50$15$65
Pinecone Serverless$50$40$90
Chroma Cloud$70$20$90
Pinecone Pod-based (s1)$100$40$140
Self-host sur VPS $80$80incl.$80

Coûts baissent 60-80% avec binary quantization.

Comment utiliser ce calculateur

Comparez coût mensuel sur 9 vector databases pour votre corpus et query volume.

  1. 1

    Entrez vector count

    Documents × chunks/doc. Typique: 1 doc = 5-20 chunks à 500 tokens.

  2. 2

    Choisissez dimension

    1536 default OpenAI. 3072 double storage; 768 le divise.

  3. 3

    Set query volume

    Queries quotidiens. Caching réduit — la plupart cache 30-50%.

  4. 4

    Toggle binary quant

    Sur Pinecone, Qdrant, Milvus, binary quant coupe storage 32×.

Pourquoi utiliser ce calculateur

  • 9 fournisseurs trackés mensuellement
  • Modélisation binary quantization
  • Comparaisons self-host
  • Coûts dimension + filter séparés
  • Free tier limits surfaced
  • Sans login

Questions fréquentes

Quelle vector DB est la moins chère à 10M vecteurs en 2026 ?+
Pour 10M × 1536-dim à volume de queries modéré : pgvector sur Supabase Pro $25/mois est la moins chère. Qdrant Cloud $40/mois et Weaviate Serverless $45/mois suivent. Pinecone Serverless $90/mois et Pinecone Pod-based $140/mois sont premium.
Comment est tarifé Pinecone Serverless vs Pod-based ?+
Serverless : $0.40/M writes + $4 par million de reads + $0.33/GB-mois storage. Pod-based : $0.096/heure pour s1 starter (~$70/mois base). Serverless gagne à faible volume et trafic bursty. Pod-based gagne à >500 reads/seconde steady-state.
La dimension du vecteur affecte-t-elle beaucoup le coût ?+
Oui. Passer de 1536 (OpenAI text-embedding-3-large) à 3072 (Cohere Embed v4) double le storage chez la plupart. Avec binary quantization (Pinecone, Qdrant), 1536-dim se compresse à 192 bytes — 32× plus petit. Active "use binary quantization".
Pinecone vs Weaviate vs Qdrant — lequel choisir en 2026 ?+
Pinecone : ops la plus facile, prix premium. Weaviate : meilleur pour hybrid search + graph. Qdrant : le moins cher à grande échelle, meilleur filtering. Supabase pgvector : meilleur si tu as déjà Postgres. Le calculateur montre le coût côte à côte à ton échelle.
Comment couper ma facture vector DB de moitié ?+
Trois leviers majeurs : (1) réduire la dimension via Matryoshka — stocker à 512 au lieu de 1536 avec perte de recall minimale, (2) activer binary quantization, (3) passer de Pinecone Pod-based à Qdrant Cloud ou self-host sur VPS $80/mois pour 80% d'économie.
Self-host Qdrant ou Milvus est-il vraiment moins cher ?+
À 10M+ vecteurs, oui — un VPS $80/mois fait tourner Qdrant pour 50M vecteurs. Sous 5M, les managés (Pinecone Free, Qdrant Cloud free tier) gagnent souvent en coût total une fois compté le temps d'ops. Le calculateur inclut une estimation self-host.