Berechne exakte Einsparungen durch Prompt Caching bei Claude, GPT-5 und Gemini. System-Prompt-Größe und Anfragen eingeben — monatliche Einsparungen sofort sehen.
Anbieter wählen · Prompt-Größe und Volumen eingeben · Monatliche Einsparungen sehen
Kosten gecachter Token vs. Standard-Eingabe-Token. Juni 2026.
| Anbieter | Modell | Standard-Eingabe | Cache-Schreiben | Cache-Lesen | Rabatt |
|---|---|---|---|---|---|
| Anthropic | Claude Sonnet 4.6 | $3,00/1M | $3,75/1M | $0,30/1M | 90% RABATT |
| Anthropic | Claude Haiku 4.5 | $1,00/1M | $1,25/1M | $0,10/1M | 90% RABATT |
| Anthropic | Claude Opus 4.8 | $5,00/1M | $6,25/1M | $0,50/1M | 90% RABATT |
| OpenAI | GPT-5.4 | $2,50/1M | auto | $1,25/1M | 50% RABATT |
| OpenAI | GPT-5.4 nano | $0,20/1M | auto | $0,10/1M | 50% RABATT |
| Gemini 3.5 Flash | $1,50/1M | $1,00/1M | $0,375/1M | 75% RABATT |
Anthropics 90% Cache-Lese-Rabatt ist der aggressivste in der Branche. Für Workloads mit großem statischem System-Prompt ist Anthropic oft 3× günstiger als OpenAI.
Prompt Caching ermöglicht die Wiederverwendung von Prompt-Anfängen (System-Prompt, Dokumentenkontext) über mehrere Anfragen hinweg. Anthropic berechnet 90% weniger für gecachte Token ($0,30/1M vs $3,00/1M bei Sonnet). OpenAI berechnet 50% weniger.
Anthropic: Cache-Schreiben kostet 25% mehr ($3,75/1M bei Sonnet), aber Cache-Lesen kostet 90% weniger ($0,30/1M). Break-even bei etwa 2 Anfragen mit gleichem Präfix. Ab 10+ Anfragen spart man 80–88%.
Caching hilft nur wenn dasselbe Präfix wiederverwendet wird. Bei einzigartigen System-Prompts pro Anfrage gibt es keinen Vorteil. Minimaler Effekt bei Prompts unter 512 Token.