Ana Sayfa

Claude İçin Prompt-caching: %90 Token Tasarrufu Sağlayan Otomatik Önbellekleme

1 dk okuma

Prompt-caching, özellikle Claude modelleriyle çalışan geliştiriciler için tasarlanmış, Anthropic'in önbellekleme API'sini kullanarak token maliyetlerinde önemli ölçüde tasarruf sağlayan bir araçtır. Bu eklenti, sistem istemleri, araç tanımları ve dosya okumaları gibi kararlı içerikleri otomatik olarak algılar ve bu kısımlar için önbellek kesme noktaları ekler. Böylece, tekrarlanan işlemler sırasında aynı içerik için %90'a varan oranlarda daha az ödeme yapılır. Claude Code kullanıcıları için iki basit komutla kurulabilen bu sistem, npm veya ek yapılandırma gerektirmez ve anında tasarruf sağlamaya başlar.

Prompt-caching, farklı kullanım senaryolarına yönelik özel modlar sunar. "BugFix Mode" hata izlemelerini algılayarak hatalı dosyayı ve hata bağlamını önbelleğe alır, böylece sonraki sorgularda sadece yeni soruların maliyeti ödenir. "Refactor Mode" ise yeniden düzenleme anahtar kelimelerini ve dosya listelerini tespit ederek stil kılavuzları ve tip tanımları gibi değişmeyen kısımları önbelleğe alır. "File Tracking" özelliği, dosyaların tekrar tekrar okunması durumunda ikinci okumadan itibaren önbellek kesme noktaları ekleyerek maliyeti düşürür. Ayrıca, "Conversation Freeze" ile belirli bir sayıdaki dönüşten sonra eski mesajlar önbelleğe alınmış bir önek olarak dondurulur, böylece sadece son birkaç dönüş yeni olarak gönderilir ve tasarruflar katlanır.

Yapılan benchmark testleri, Prompt-caching'in gerçek Claude Code oturumlarında Sonnet modeliyle kullanıldığında, hata düzeltme, yeniden düzenleme ve genel kodlama senaryolarında %80 ila %92 arasında token tasarrufu sağladığını göstermektedir. Bu eklenti, Claude Code'un kendi otomatik önbellekleme mekanizmasından farklı olarak, Anthropic SDK ile kendi uygulamalarını veya ajanlarını geliştiren kullanıcılar için tasarlanmıştır. Kurulumu hem Claude Code eklenti sistemi üzerinden hem de npm aracılığıyla diğer MCP uyumlu istemciler için mümkündür.

İçgörü

Bu araç, büyük dil modelleriyle uygulama geliştirenlerin tekrarlayan istem maliyetlerini önemli ölçüde azaltarak geliştirme süreçlerini daha ekonomik hale getiriyor.

Kaynak