Claude, GPT-5 ve Gemini'de prompt caching tasarruflarını hesapla. Sistem prompt boyutunu ve günlük istek sayısını gir — aylık tasarrufu anında gör.
Sağlayıcı seç · Prompt boyutu ve hacmi gir · Aylık tasarrufu gör
Önbellek token maliyeti vs standart giriş token maliyeti. Haziran 2026.
| Sağlayıcı | Model | Standart Giriş | Önbellek Yazma | Önbellek Okuma | İndirim |
|---|---|---|---|---|---|
| Anthropic | Claude Sonnet 4.6 | $3,00/1M | $3,75/1M | $0,30/1M | %90 İNDİRİM |
| Anthropic | Claude Haiku 4.5 | $1,00/1M | $1,25/1M | $0,10/1M | %90 İNDİRİM |
| OpenAI | GPT-5.4 | $2,50/1M | otomatik | $1,25/1M | %50 İNDİRİM |
| OpenAI | GPT-5.4 nano | $0,20/1M | otomatik | $0,10/1M | %50 İNDİRİM |
| Gemini 3.5 Flash | $1,50/1M | $1,00/1M | $0,375/1M | %75 İNDİRİM |
Anthropic'in %90 önbellek okuma indirimi sektörün en yüksek oranı. Büyük statik sistem prompt'larına sahip iş yükleri için Anthropic, OpenAI'dan genellikle 3× daha ucuz oluyor.
Prompt önbellekleme, bir prompt'un başlangıcını (sistem prompt, belge bağlamı) birden fazla istekte yeniden kullanmanı sağlar. Anthropic, önbelleğe alınmış token'lar için %90 daha az ücret alır (Sonnet'te $0,30/1M vs $3,00/1M). OpenAI %50 daha az alır.
Önbellekleme yalnızca aynı önek yeniden kullanıldığında yardımcı olur. Her istekte benzersiz sistem prompt varsa fayda yoktur. 512 token'dan kısa prompt'larda minimal etki gösterir.