Coûts API Embedding 2026 : OpenAI vs Cohere vs Jina AI
Les APIs d'embedding alimentent la recherche sémantique, les pipelines RAG et les moteurs de recommandation. Voici la décomposition des prix 2026.
Comment fonctionne la tarification des embeddings
Toutes les APIs d'embedding facturent par token (entrée uniquement). Les coûts sont exprimés par million de tokens. Un document type de 500 mots ≈ 650 tokens.
Tableau de prix API Embedding 2026
| Modèle | $/1M tokens | Dimensions | Tokens max |
|---|---|---|---|
| Jina AI v3 | 0,018 $ | 1024 | 8192 |
| OpenAI text-3-small | 0,020 $ | 1536 | 8191 |
| Cohere embed-v3 | 0,100 $ | 1024 | 512 |
| Voyage AI large-2 | 0,120 $ | 1536 | 16000 |
| OpenAI text-3-large | 0,130 $ | 3072 | 8191 |
OpenAI text-3-small : Meilleur rapport qualité-prix
À 0,020 $/1M tokens, text-3-small est 5× moins cher qu'ada-002. Supporte Matryoshka Representation Learning — dimensions tronquables à 512 sans perte significative.
Jina AI v3 : Le moins cher à grande échelle
Jina v3 à 0,018 $/1M tokens est 10 % moins cher qu'OpenAI. Supporte l'encodage contextuel et les longs documents (8192 tokens).
Coût à l'échelle : 1 Mrd tokens/mois
| Modèle | 100M tokens | 1 Mrd tokens | 10 Mrd tokens |
|---|---|---|---|
| Jina AI v3 | 1,80 $ | 18 $ | 180 $ |
| OpenAI text-3-small | 2,00 $ | 20 $ | 200 $ |
| Cohere embed-v3 | 10 $ | 100 $ | 1 000 $ |
FAQ
Combien coûte l'embedding OpenAI ?
text-embedding-3-small coûte 0,020 $/1M tokens. text-embedding-3-large 0,130 $/1M. Ada-002 (legacy) 0,100 $/1M.
Quel modèle d'embedding est le moins cher ?
Jina AI v3 à 0,018 $/1M tokens est le moins cher. OpenAI text-3-small à 0,020 $/1M est proche.
Comment réduire les coûts d'embedding ?
Utiliser text-3-small plutôt que text-3-large (6,5× moins cher). Mettre en cache les embeddings. Tronquer les dimensions à 512 si la qualité le permet.
Équipe APICalculators · Calculatrices gratuites pour développeurs. Prix de la documentation officielle, vérifiés mensuellement.