AITOT

Calculadora

Calculadora Costo Embeddings AI

Estima costo de embedding único y recurrente entre 9+ providers. Mete tamaño del corpus, estrategia de chunk, frecuencia de refresh.

Precios actualizados:

El AITOT Embeddings Cost calculator estima embedding corpus one-time + re-embed recurring en 9 proveedores — OpenAI text-embedding-3-small/large, Cohere Embed v4, Voyage 3 Lite/standard, Jina v3, BGE-M3 (self-host), Mistral, Google, Azure.

Para corpus 1M documentos a 500 tokens promedio = 500M tokens. OpenAI text-embedding-3-small: $10. OpenAI 3-large: $65. Cohere Embed v4: $50. Mayoría de bills one-time son pequeños; recurring re-embedding es lo que escala.

Toggle refresh frequency (0 = nunca, 0.25 = cada 4 meses, 1 = mensual, 4 = semanal). Sobre 5B tokens/mes, self-hosted BGE-M3 en H100 bate OpenAI.

Más barato · año 1

Together · BGE-M3

1024 dim · 8,192 máx tokens

$2

ProveedorModelo$ / 1M tokensCosto embed únicoCosto mensualAño 1
TogetherBGE-M3

1024 dim · Self-host open weights for $0

$0.008$0.40$0.14$2
Togetherbge-large-en-v1.5

1024 dim

$0.008$0.40$0.14$2
Fireworksnomic-embed-text-v1.5

768 dim

$0.008$0.40$0.14$2
Jina AIjina-embeddings-v3

1024 dim · configurable

$0.012$0.60$0.21$3
Jina AIjina-embeddings-v4

2048 dim · configurable

$0.018$0.90$0.31$5
OpenAItext-embedding-3-small

1536 dim · configurable

$0.02$1.00$0.35$5
Voyage AIvoyage-4-lite

512 dim · 200M tokens free

$0.02$1.00$0.35$5
Voyage AIvoyage-3-lite

512 dim

$0.02$1.00$0.35$5
Amazon BedrockTitan Embed v2

1024 dim · configurable

$0.02$1.00$0.35$5
Voyage AIvoyage-4

1024 dim · configurable · 200M tokens free

$0.06$3.00$1.05$16
Voyage AIvoyage-3

1024 dim

$0.06$3.00$1.05$16
Cohereembed-english-v3.0

1024 dim

$0.10$5.00$1.75$26
Cohereembed-multilingual-v3.0

1024 dim

$0.10$5.00$1.75$26
Cohereembed-english-light-v3.0

384 dim · Smaller, cheaper at inference

$0.10$5.00$1.75$26
Mistralmistral-embed

1024 dim

$0.10$5.00$1.75$26
Voyage AIvoyage-4-large

1024 dim · configurable · Top MTEB 2026; 200M tokens free

$0.12$6.00$2.10$31
OpenAItext-embedding-3-large

3072 dim · configurable · Matryoshka — truncate to 256/512/1024 without retrain

$0.13$6.50$2.28$34
GoogleGemini Embedding

3072 dim · configurable · Text-only

$0.15$7.50$2.63$39
Voyage AIvoyage-3-large

1024 dim · configurable · Legacy v3; consider voyage-4-large

$0.18$9.00$3.15$47
Voyage AIvoyage-code-3

1024 dim · Optimized for code retrieval

$0.18$9.00$3.15$47
GoogleGemini Embedding 2

3072 dim · configurable · Multimodal: text $0.20, image $0.45, audio $6.50, video $12 per 1M tokens

$0.20$10.00$3.50$52

Frecuencia 0.25 significa re-embed el corpus cada 4 meses. Los modelos "configurable" soportan truncamiento Matryoshka — puedes reducir dimensiones después sin re-embedding.

Qué hace esta calculadora

9 proveedores comparados

OpenAI 3-small/large, Cohere v4, Voyage 3, Jina, Mistral, Google, Azure, BGE-M3 self-host.

One-time + recurring

Coste embed inicial + coste re-embed mensual separados.

Slider refresh frequency

Modela cuán a menudo re-embeddear (nunca, trimestral, mensual, semanal).

Break-even self-host

Compara managed APIs con BGE-M3 en H100 alquilado. Break-even ~2B tokens/mes.

Truncamiento dimension

Modelos Matryoshka (OpenAI 3-large) permiten truncar dimensions.

Modelado query tokens

Coste embedding es simétrico — query tokens también cuentan.

Comparación rápida

Coste embed corpus 500M tokens + 50M query tokens/mes

ProveedorOne-timeMensual$/1M tokens
Jina v3$9$0.90$0.018
Voyage 3 Lite$10$1$0.02
OpenAI text-embed-3-small$10$1$0.02
Cohere Embed v4 Light$50$5$0.10
Voyage 3 Large$65$6.50$0.13
OpenAI text-embed-3-large$65$6.50$0.13
Self-host BGE-M3 (H100)~$45~$1,300flat /mes

Self-host gana sobre ~2B tokens/mes total throughput.

Cómo usar esta calculadora

Calcula embed corpus one-time + re-embed recurring en 9 proveedores.

  1. 1

    Entra tamaño corpus

    Tokens en corpus completo. Documentos × tokens/doc. Típico: 1 doc = 500 tokens.

  2. 2

    Set refresh frequency

    0 = nunca, 1 = mensual, 4 = semanal. Mayoría corpus producción re-embed trimestral.

  3. 3

    Añade query volume

    Query tokens mensuales. A menudo el item más grande over time.

  4. 4

    Compara y elige

    Sort por coste mensual. Self-host BGE-M3 gana >2B tokens/mes.

Por qué usar esta calculadora

  • 9 proveedores refrescados mensualmente
  • One-time + recurring split
  • Break-even self-host modelado
  • Matryoshka dimension truncation
  • Query tokens incluidos
  • Sin login

Preguntas frecuentes

¿Cuál es el proveedor de embeddings más barato en 2026?+
Para embed corpus una vez: Voyage 3 Lite a $0.02/M tokens. OpenAI text-embedding-3-small a $0.02/M. Cohere Embed v4 Light a $0.10/M. Jina v3 a $0.018/M. BGE M3 self-host es efectivamente gratis a escala. Para calidad+precio, OpenAI text-embedding-3-large a $0.13/M.
¿Cuánto cuesta hacer embedding de un corpus 1M docs?+
A 500 tokens/doc promedio × 1M docs = 500M tokens. OpenAI text-embedding-3-small: $10. OpenAI text-embedding-3-large: $65. Cohere Embed v4: $50. La mayoría de embed iniciales son baratos — lo que escala es el re-embed por actualizaciones.
¿Cada cuánto re-embedo mi corpus?+
Datos estáticos (legal, científico): anualmente o cuando cambie el schema. Docs frecuentemente actualizados: re-embed delta semanal solo de chunks cambiados. No batch-re-embedear datos sin cambios — usa change-detection en hash o last-modified.
¿Uso 1536 o 3072 de dimensión en embeddings?+
1536 (default OpenAI) basta en 90% de casos. 3072 gana en long-context (legal, científico). 1536 almacena 2× más barato y consulta más rápido. Usa Matryoshka truncation para probar 512 → 1024 → 1536 — las ganancias se estancan en 1024 a menudo.
¿Self-host BGE-M3 es más barato que OpenAI embeddings?+
Por encima de ~5B tokens embebidos/mes, sí. BGE-M3 en una H100 ($1.85–$2.50/h) corre ~2M tokens/segundo — eso es 5T tokens/mes a $1.3k/mes plano. OpenAI 3-large a $0.13/M = $650 por billón, así que self-host gana sobre ~2B tokens/mes.
¿Los embeddings se cobran por tokens o por documentos?+
Siempre por input tokens. La calculadora convierte doc count × tokens/doc en tokens billables. OpenAI, Cohere, Voyage y Jina cobran por millón de input tokens sin importar dimensión. El storage es aparte (lo paga tu vector DB).