Calculateur
Calculateur Coût Embeddings IA
Estimez le coût d'embedding unique et récurrent entre 9+ providers. Branchez taille du corpus, stratégie de chunks, fréquence de refresh.
Tarifs actualisés:
Le AITOT Embeddings Cost calculator estime embedding corpus one-time plus re-embed recurring sur 9 fournisseurs — OpenAI text-embedding-3-small/large, Cohere Embed v4, Voyage 3, Jina v3, BGE-M3, Mistral, Google, Azure.
Pour corpus 1M docs à 500 tokens = 500M tokens. OpenAI text-embedding-3-small: $10. text-embedding-3-large: $65. Cohere Embed v4: $50. La plupart des bills one-time sont petits.
Toggle refresh frequency. Au-dessus de 5B tokens/mois, self-hosted BGE-M3 sur H100 bat OpenAI.
Moins cher · année 1
Together · BGE-M3
1024 dim · 8,192 max tokens
$2
| Fournisseur | Modèle | $ / 1M tokens | Coût embed unique | Coût mensuel | Année 1 |
|---|---|---|---|---|---|
| Together | BGE-M3 1024 dim · Self-host open weights for $0 | $0.008 | $0.40 | $0.14 | $2 |
| Together | bge-large-en-v1.5 1024 dim | $0.008 | $0.40 | $0.14 | $2 |
| Fireworks | nomic-embed-text-v1.5 768 dim | $0.008 | $0.40 | $0.14 | $2 |
| Jina AI | jina-embeddings-v3 1024 dim · configurable | $0.012 | $0.60 | $0.21 | $3 |
| Jina AI | jina-embeddings-v4 2048 dim · configurable | $0.018 | $0.90 | $0.31 | $5 |
| OpenAI | text-embedding-3-small 1536 dim · configurable | $0.02 | $1.00 | $0.35 | $5 |
| Voyage AI | voyage-4-lite 512 dim · 200M tokens free | $0.02 | $1.00 | $0.35 | $5 |
| Voyage AI | voyage-3-lite 512 dim | $0.02 | $1.00 | $0.35 | $5 |
| Amazon Bedrock | Titan Embed v2 1024 dim · configurable | $0.02 | $1.00 | $0.35 | $5 |
| Voyage AI | voyage-4 1024 dim · configurable · 200M tokens free | $0.06 | $3.00 | $1.05 | $16 |
| Voyage AI | voyage-3 1024 dim | $0.06 | $3.00 | $1.05 | $16 |
| Cohere | embed-english-v3.0 1024 dim | $0.10 | $5.00 | $1.75 | $26 |
| Cohere | embed-multilingual-v3.0 1024 dim | $0.10 | $5.00 | $1.75 | $26 |
| Cohere | embed-english-light-v3.0 384 dim · Smaller, cheaper at inference | $0.10 | $5.00 | $1.75 | $26 |
| Mistral | mistral-embed 1024 dim | $0.10 | $5.00 | $1.75 | $26 |
| Voyage AI | voyage-4-large 1024 dim · configurable · Top MTEB 2026; 200M tokens free | $0.12 | $6.00 | $2.10 | $31 |
| OpenAI | text-embedding-3-large 3072 dim · configurable · Matryoshka — truncate to 256/512/1024 without retrain | $0.13 | $6.50 | $2.28 | $34 |
| Gemini Embedding 3072 dim · configurable · Text-only | $0.15 | $7.50 | $2.63 | $39 | |
| Voyage AI | voyage-3-large 1024 dim · configurable · Legacy v3; consider voyage-4-large | $0.18 | $9.00 | $3.15 | $47 |
| Voyage AI | voyage-code-3 1024 dim · Optimized for code retrieval | $0.18 | $9.00 | $3.15 | $47 |
| Gemini Embedding 2 3072 dim · configurable · Multimodal: text $0.20, image $0.45, audio $6.50, video $12 per 1M tokens | $0.20 | $10.00 | $3.50 | $52 |
Une fréquence de 0,25 signifie re-embed du corpus tous les 4 mois. Les modèles "configurable" supportent la troncature Matryoshka — vous pouvez réduire les dimensions a posteriori sans ré-embedding.
Ce que fait ce calculateur
9 fournisseurs comparés
OpenAI 3-small/large, Cohere v4, Voyage 3, Jina, Mistral, Google, Azure, BGE-M3.
One-time + recurring
Coût embed initial + coût re-embed mensuel séparés.
Slider refresh frequency
Modèle combien re-embeddear (jamais, trimestriel, mensuel, hebdo).
Break-even self-host
Compare managed APIs avec BGE-M3 sur H100. Break-even ~2B tokens/mois.
Truncation dimension
Matryoshka models permettent truncate dimensions.
Modélisation query tokens
Embedding cost symétrique — query tokens comptent aussi.
Comparaison rapide
Coût embed corpus 500M tokens + 50M query tokens/mois
| Fournisseur | One-time | Mensuel | $/1M tokens |
|---|---|---|---|
| Jina v3 | $9 | $0.90 | $0.018 |
| Voyage 3 Lite | $10 | $1 | $0.02 |
| OpenAI text-embed-3-small | $10 | $1 | $0.02 |
| Cohere Embed v4 Light | $50 | $5 | $0.10 |
| Voyage 3 Large | $65 | $6.50 | $0.13 |
| OpenAI text-embed-3-large | $65 | $6.50 | $0.13 |
| Self-host BGE-M3 (H100) | ~$45 | ~$1,300 | flat /mois |
Self-host gagne au-dessus ~2B tokens/mois total throughput.
Comment utiliser ce calculateur
Calculez embed corpus one-time + re-embed recurring sur 9 fournisseurs.
- 1
Entrez taille corpus
Tokens dans corpus complet. Documents × tokens/doc.
- 2
Set refresh frequency
0 = jamais, 1 = mensuel, 4 = hebdo.
- 3
Ajoutez query volume
Query tokens mensuels.
- 4
Comparez et choisissez
Triez par coût mensuel. Self-host BGE-M3 gagne >2B tokens/mois.
Pourquoi utiliser ce calculateur
- ✓9 fournisseurs rafraîchis mensuellement
- ✓One-time + recurring split
- ✓Break-even self-host modélisé
- ✓Matryoshka truncation
- ✓Query tokens inclus
- ✓Sans login