Dernière mise à jour : juin 2026 · Tarifs actuels

Mise en Cache Prompt Calculateur

Calculez les économies exactes du prompt caching sur Claude, GPT-5 et Gemini. Entrez la taille du prompt système et le volume de requêtes — économies mensuelles instantanées.

Publicité

💾 Calculateur d'Économies — Mise en Cache Prompt

Choisir le fournisseur · Entrer la taille et le volume · Voir les économies mensuelles

Économies mensuelles
$0
— % de réduction des coûts de prompt
Sans cache / mois
Coût écriture cache / mois
Avec cache / mois
Économies mensuelles
Économies annuelles

Tarifs de Mise en Cache par Fournisseur

Coût des tokens en cache vs tokens d'entrée standard. Juin 2026.

FournisseurModèleEntrée standardÉcriture cacheLecture cacheRéduction
AnthropicClaude Sonnet 4.6$3,00/1M$3,75/1M$0,30/1M90% RÉDUIT
AnthropicClaude Haiku 4.5$1,00/1M$1,25/1M$0,10/1M90% RÉDUIT
OpenAIGPT-5.4$2,50/1Mauto$1,25/1M50% RÉDUIT
OpenAIGPT-5.4 nano$0,20/1Mauto$0,10/1M50% RÉDUIT
GoogleGemini 3.5 Flash$1,50/1M$1,00/1M$0,375/1M75% RÉDUIT
💡 Anthropic offre la meilleure remise sur le cache

La réduction de 90% sur la lecture du cache d'Anthropic est la plus agressive du secteur. Pour les charges de travail avec un grand prompt système statique, Anthropic est souvent 3× moins cher qu'OpenAI.

Questions Fréquentes

Qu'est-ce que le prompt caching et comment économise-t-il ?+

Le prompt caching permet de réutiliser le début d'un prompt (prompt système, contexte de document) sur plusieurs requêtes. Anthropic facture 90% de moins pour les tokens en cache ($0,30/1M vs $3,00/1M sur Sonnet). OpenAI facture 50% de moins.

Quand le prompt caching n'aide-t-il PAS ?+

Le caching n'aide que lorsque le même préfixe est réutilisé. Si chaque requête a un prompt système unique, il n'y a aucun avantage. Effet minimal pour les prompts de moins de 512 tokens.

Calculateurs Associés