Bir geliştirici, Claude Code'un buluta ne tür veriler gönderdiğini anlamak için bir MITM (Man-in-the-Middle) proxy kurarak uygulamanın ağ trafiğini inceledi. Bu inceleme sonucunda, Claude Code'un kullanıcı arayüzünün gösterdiğinden ve çoğu geliştiricinin tahmin ettiğinden çok daha fazla bilgi gönderdiği ortaya çıktı. Kullanıcının yazdığı kod, git geçmişi, proje talimatları gibi hassas veriler, her etkileşimde Anthropic sunucularına paketlenerek gönderiliyor. Hatta o kadar büyük istekler oluşuyor ki, araştırmacı ilk başta loglama sisteminin bozulduğunu düşündü.
Claude Code, gerçek zamanlı metin akışı için WebSockets yerine SSE (Server-Sent Events) kullanıyor. Bunun nedeni, LLM'ler için tek yönlü iletişimin yeterli olması, SSE'nin standart HTTP üzerinde çalışması ve yeniden bağlantı yönetiminin daha basit olmasıdır. Her "enter" tuşuna basıldığında, Claude Code sadece kullanıcının mesajını değil, aynı zamanda mevcut oturumun tüm konuşma geçmişini, yaklaşık 15.000-25.000 token büyüklüğünde devasa bir sistem istemini, kullanabileceği tüm araçların tanımlarını ve kullanıcının ortamına dair bağlam bilgilerini Anthropic sunucularına gönderiyor.
Bu sistem istemi, kullanıcının daha hiçbir şey yazmadan önce enjekte ediliyor ve Claude Code'un kimlik ve davranış kurallarını, CLAUDE.md dosyasının tüm içeriğini, işletim sistemi ve çalışma dizini gibi ortam bilgilerini, araç tanımlarını ve güvenlik yönergelerini içeriyor. Örneğin, beş kelimelik "merhaba, bugün nasılsın?" mesajı bile 101 KB'lık bir JSON isteği oluşturabiliyor. Bu durum, yapay zeka kodlama yardımcılarının veri toplama kapsamı ve gizlilik üzerindeki potansiyel etkileri hakkında önemli soruları gündeme getiriyor.
Yapay zeka kodlama yardımcılarının kullanıcı verilerini ve proje bağlamını beklenenden çok daha geniş bir kapsamda sunucularına ilettiğini ortaya koyarak gizlilik ve performans açısından önemli çıkarımlar sunuyor.