AITOT

Calculateur

Calculateur Coût Embeddings IA

Estimez le coût d'embedding unique et récurrent entre 9+ providers. Branchez taille du corpus, stratégie de chunks, fréquence de refresh.

Tarifs actualisés:

Le AITOT Embeddings Cost calculator estime embedding corpus one-time plus re-embed recurring sur 9 fournisseurs — OpenAI text-embedding-3-small/large, Cohere Embed v4, Voyage 3, Jina v3, BGE-M3, Mistral, Google, Azure.

Pour corpus 1M docs à 500 tokens = 500M tokens. OpenAI text-embedding-3-small: $10. text-embedding-3-large: $65. Cohere Embed v4: $50. La plupart des bills one-time sont petits.

Toggle refresh frequency. Au-dessus de 5B tokens/mois, self-hosted BGE-M3 sur H100 bat OpenAI.

Moins cher · année 1

Together · BGE-M3

1024 dim · 8,192 max tokens

$2

FournisseurModèle$ / 1M tokensCoût embed uniqueCoût mensuelAnnée 1
TogetherBGE-M3

1024 dim · Self-host open weights for $0

$0.008$0.40$0.14$2
Togetherbge-large-en-v1.5

1024 dim

$0.008$0.40$0.14$2
Fireworksnomic-embed-text-v1.5

768 dim

$0.008$0.40$0.14$2
Jina AIjina-embeddings-v3

1024 dim · configurable

$0.012$0.60$0.21$3
Jina AIjina-embeddings-v4

2048 dim · configurable

$0.018$0.90$0.31$5
OpenAItext-embedding-3-small

1536 dim · configurable

$0.02$1.00$0.35$5
Voyage AIvoyage-4-lite

512 dim · 200M tokens free

$0.02$1.00$0.35$5
Voyage AIvoyage-3-lite

512 dim

$0.02$1.00$0.35$5
Amazon BedrockTitan Embed v2

1024 dim · configurable

$0.02$1.00$0.35$5
Voyage AIvoyage-4

1024 dim · configurable · 200M tokens free

$0.06$3.00$1.05$16
Voyage AIvoyage-3

1024 dim

$0.06$3.00$1.05$16
Cohereembed-english-v3.0

1024 dim

$0.10$5.00$1.75$26
Cohereembed-multilingual-v3.0

1024 dim

$0.10$5.00$1.75$26
Cohereembed-english-light-v3.0

384 dim · Smaller, cheaper at inference

$0.10$5.00$1.75$26
Mistralmistral-embed

1024 dim

$0.10$5.00$1.75$26
Voyage AIvoyage-4-large

1024 dim · configurable · Top MTEB 2026; 200M tokens free

$0.12$6.00$2.10$31
OpenAItext-embedding-3-large

3072 dim · configurable · Matryoshka — truncate to 256/512/1024 without retrain

$0.13$6.50$2.28$34
GoogleGemini Embedding

3072 dim · configurable · Text-only

$0.15$7.50$2.63$39
Voyage AIvoyage-3-large

1024 dim · configurable · Legacy v3; consider voyage-4-large

$0.18$9.00$3.15$47
Voyage AIvoyage-code-3

1024 dim · Optimized for code retrieval

$0.18$9.00$3.15$47
GoogleGemini Embedding 2

3072 dim · configurable · Multimodal: text $0.20, image $0.45, audio $6.50, video $12 per 1M tokens

$0.20$10.00$3.50$52

Une fréquence de 0,25 signifie re-embed du corpus tous les 4 mois. Les modèles "configurable" supportent la troncature Matryoshka — vous pouvez réduire les dimensions a posteriori sans ré-embedding.

Ce que fait ce calculateur

9 fournisseurs comparés

OpenAI 3-small/large, Cohere v4, Voyage 3, Jina, Mistral, Google, Azure, BGE-M3.

One-time + recurring

Coût embed initial + coût re-embed mensuel séparés.

Slider refresh frequency

Modèle combien re-embeddear (jamais, trimestriel, mensuel, hebdo).

Break-even self-host

Compare managed APIs avec BGE-M3 sur H100. Break-even ~2B tokens/mois.

Truncation dimension

Matryoshka models permettent truncate dimensions.

Modélisation query tokens

Embedding cost symétrique — query tokens comptent aussi.

Comparaison rapide

Coût embed corpus 500M tokens + 50M query tokens/mois

FournisseurOne-timeMensuel$/1M tokens
Jina v3$9$0.90$0.018
Voyage 3 Lite$10$1$0.02
OpenAI text-embed-3-small$10$1$0.02
Cohere Embed v4 Light$50$5$0.10
Voyage 3 Large$65$6.50$0.13
OpenAI text-embed-3-large$65$6.50$0.13
Self-host BGE-M3 (H100)~$45~$1,300flat /mois

Self-host gagne au-dessus ~2B tokens/mois total throughput.

Comment utiliser ce calculateur

Calculez embed corpus one-time + re-embed recurring sur 9 fournisseurs.

  1. 1

    Entrez taille corpus

    Tokens dans corpus complet. Documents × tokens/doc.

  2. 2

    Set refresh frequency

    0 = jamais, 1 = mensuel, 4 = hebdo.

  3. 3

    Ajoutez query volume

    Query tokens mensuels.

  4. 4

    Comparez et choisissez

    Triez par coût mensuel. Self-host BGE-M3 gagne >2B tokens/mois.

Pourquoi utiliser ce calculateur

  • 9 fournisseurs rafraîchis mensuellement
  • One-time + recurring split
  • Break-even self-host modélisé
  • Matryoshka truncation
  • Query tokens inclus
  • Sans login

Questions fréquentes

Quel est le fournisseur d'embeddings le moins cher en 2026 ?+
Pour embed corpus une fois : Voyage 3 Lite à $0.02/M tokens. OpenAI text-embedding-3-small à $0.02/M. Cohere Embed v4 Light à $0.10/M. Jina v3 à $0.018/M. BGE M3 self-host effectivement gratuit à l'échelle. Pour qualité+prix, OpenAI text-embedding-3-large à $0.13/M.
Combien coûte embedder un corpus 1M docs ?+
À 500 tokens/doc moyen × 1M docs = 500M tokens. OpenAI text-embedding-3-small : $10. OpenAI text-embedding-3-large : $65. Cohere Embed v4 : $50. La plupart des embed initiaux sont bon marché — c'est le re-embed récurrent qui scale.
À quelle fréquence re-embedder mon corpus ?+
Données statiques (légal, scientifique) : annuellement ou changement de schema. Docs fréquemment mis à jour : re-embed delta hebdo seulement des chunks modifiés. Ne pas batch-re-embedder les données inchangées — utilise change-detection sur hash ou last-modified.
1536 ou 3072 de dimension embeddings ?+
1536 (défaut OpenAI) suffit pour 90% des cas. 3072 gagne en long-context (légal, scientifique). 1536 stocke 2× moins cher et requête plus vite. Utilise Matryoshka truncation pour tester 512 → 1024 → 1536 — gains plafonnent souvent à 1024.
Self-host BGE-M3 est-il vraiment moins cher qu'OpenAI ?+
Au-dessus de ~5B tokens embeddés/mois, oui. BGE-M3 sur une H100 ($1.85–$2.50/h) fait ~2M tokens/seconde — soit 5T tokens/mois à $1.3k/mois plat. OpenAI 3-large à $0.13/M = $650 par milliard, donc self-host gagne au-dessus de ~2B tokens/mois.
Les embeddings sont-ils facturés par tokens ou documents ?+
Toujours par input tokens. Le calculateur convertit doc count × tokens/doc en tokens facturables. OpenAI, Cohere, Voyage et Jina facturent par million d'input tokens peu importe la dimension. Le storage est à part (payé à ton vector DB).