Question 1

Provider embeddings termurah 2026?

Accepted Answer

Untuk embed corpus sekali: Voyage 3 Lite di $0.02/M token. OpenAI text-embedding-3-small di $0.02/M. Cohere Embed v4 Light di $0.10/M. Jina v3 di $0.018/M. BGE M3 self-host efektif gratis di skala. Untuk kualitas+harga, OpenAI text-embedding-3-large di $0.13/M.

Question 2

Berapa biaya embed corpus 1M dokumen?

Accepted Answer

Di 500 token/dokumen rata-rata × 1M dokumen = 500M token. OpenAI text-embedding-3-small: $10. OpenAI text-embedding-3-large: $65. Cohere Embed v4: $50. Mayoritas embed sekali kecil — yang scale adalah re-embedding recurring dari update dokumen.

Question 3

Seberapa sering re-embed corpus?

Accepted Answer

Data statis (legal, ilmiah): tahunan atau perubahan schema. Dokumen sering update: re-embed delta mingguan hanya chunks berubah. Jangan batch-re-embed data tak berubah — pakai change-detection di hash atau last-modified.

Question 4

1536 atau 3072 dimensi embeddings?

Accepted Answer

1536 (default OpenAI) cukup untuk 90% use case. 3072 menang di retrieval long-context (legal, ilmiah). 1536 storage 2× lebih murah dan query lebih cepat. Pakai Matryoshka truncation untuk test 512 → 1024 → 1536 — gain sering plateau di 1024.

Question 5

Self-host BGE-M3 benar lebih murah dari OpenAI embeddings?

Accepted Answer

Di atas ~5B token embedded/bulan, ya. BGE-M3 di satu H100 ($1.85–$2.50/jam) jalankan ~2M token/detik — itu 5T token/bulan di $1.3k/bulan flat. OpenAI text-embedding-3-large di $0.13/M = $650 per miliar token, jadi self-host menang di atas ~2B token/bulan.

Question 6

Embeddings dihitung per token atau per dokumen?

Accepted Answer

Selalu per input token. Kalkulator konversi doc count × token/doc rata-rata jadi token billable. OpenAI, Cohere, Voyage, Jina semua charge per juta input token tak peduli dimensi. Storage terpisah (dibayar ke vector DB).

Provider	Model	$ / 1M token	Biaya embed sekali	Biaya bulanan	Tahun 1
Together	BGE-M3 1024 dim · Self-host open weights for $0	$0.008	$0.40	$0.14	$2
Together	bge-large-en-v1.5 1024 dim	$0.008	$0.40	$0.14	$2
Fireworks	nomic-embed-text-v1.5 768 dim	$0.008	$0.40	$0.14	$2
Jina AI	jina-embeddings-v3 1024 dim · configurable	$0.012	$0.60	$0.21	$3
Jina AI	jina-embeddings-v4 2048 dim · configurable	$0.018	$0.90	$0.31	$5
OpenAI	text-embedding-3-small 1536 dim · configurable	$0.02	$1.00	$0.35	$5
Voyage AI	voyage-4-lite 512 dim · 200M tokens free	$0.02	$1.00	$0.35	$5
Voyage AI	voyage-3-lite 512 dim	$0.02	$1.00	$0.35	$5
Amazon Bedrock	Titan Embed v2 1024 dim · configurable	$0.02	$1.00	$0.35	$5
Voyage AI	voyage-4 1024 dim · configurable · 200M tokens free	$0.06	$3.00	$1.05	$16
Voyage AI	voyage-3 1024 dim	$0.06	$3.00	$1.05	$16
Cohere	embed-english-v3.0 1024 dim	$0.10	$5.00	$1.75	$26
Cohere	embed-multilingual-v3.0 1024 dim	$0.10	$5.00	$1.75	$26
Cohere	embed-english-light-v3.0 384 dim · Smaller, cheaper at inference	$0.10	$5.00	$1.75	$26
Mistral	mistral-embed 1024 dim	$0.10	$5.00	$1.75	$26
Voyage AI	voyage-4-large 1024 dim · configurable · Top MTEB 2026; 200M tokens free	$0.12	$6.00	$2.10	$31
OpenAI	text-embedding-3-large 3072 dim · configurable · Matryoshka — truncate to 256/512/1024 without retrain	$0.13	$6.50	$2.28	$34
Google	Gemini Embedding 3072 dim · configurable · Text-only	$0.15	$7.50	$2.63	$39
Voyage AI	voyage-3-large 1024 dim · configurable · Legacy v3; consider voyage-4-large	$0.18	$9.00	$3.15	$47
Voyage AI	voyage-code-3 1024 dim · Optimized for code retrieval	$0.18	$9.00	$3.15	$47
Google	Gemini Embedding 2 3072 dim · configurable · Multimodal: text $0.20, image $0.45, audio $6.50, video $12 per 1M tokens	$0.20	$10.00	$3.50	$52

Kalkulator Biaya Embeddings AI

Yang dilakukan kalkulator ini

9 provider dibandingkan

One-time + recurring

Slider refresh frequency

Break-even self-host

Truncation dimensi

Modeling query tokens

Perbandingan cepat

Cara menggunakan kalkulator

Kenapa pakai kalkulator ini

Pertanyaan yang sering diajukan

Provider	One-time	Bulanan	$/1M tokens
Jina v3	$9	$0.90	$0.018
Voyage 3 Lite	$10	$1	$0.02
OpenAI text-embed-3-small	$10	$1	$0.02
Cohere Embed v4 Light	$50	$5	$0.10
Voyage 3 Large	$65	$6.50	$0.13
OpenAI text-embed-3-large	$65	$6.50	$0.13
Self-host BGE-M3 (H100)	~$45	~$1,300	flat /bulan