Yapay zeka ajanlarının harici araçları kullanması için standart bir yöntem haline gelen Model Context Protocol (MCP), temelinde önemli bir gerilim barındırıyor: Ajanlar faydalı işler yapmak için birçok araca ihtiyaç duyarken, eklenen her araç modelin bağlam penceresini doldurarak asıl görev için daha az yer bırakıyor. Cloudflare tarafından tanıtılan Code Mode, ajanların araç kullanımında bağlam penceresi kullanımını azaltmayı hedefleyen yenilikçi bir teknik olarak öne çıkıyor. Bu yaklaşım, her işlemi ayrı bir araç olarak tanımlamak yerine, modelin türlenmiş bir SDK'ya karşı kod yazmasına ve bu kodu güvenli bir Dynamic Worker Loader içinde yürütmesine olanak tanıyor. Böylece kod, kompakt bir plan görevi görerek modelin araç işlemlerini keşfetmesini, birden fazla çağrıyı birleştirmesini ve yalnızca ihtiyaç duyduğu verileri döndürmesini sağlıyor.
Cloudflare, bu tekniği kullanarak DNS ve Zero Trust'tan Workers ve R2'ye kadar tüm Cloudflare API'sı için yeni bir MCP sunucusu tanıttı. Sadece search() ve execute() olmak üzere iki araçla, bu sunucu tüm Cloudflare API'sına MCP üzerinden erişim sağlayabilirken, yalnızca yaklaşık 1.000 token tüketiyor. Bu ayak izi, mevcut API uç noktası sayısı ne olursa olsun sabit kalıyor. Cloudflare API gibi geniş bir API için Code Mode, kullanılan girdi token sayısını %99,9 oranında azaltıyor. Code Mode olmadan eşdeğer bir MCP sunucusu, en gelişmiş temel modellerin tüm bağlam penceresinden daha fazla olan 1,17 milyon token tüketecekti.
Cloudflare, bu yeni MCP sunucusunu kullanıma açmasının yanı sıra, kendi MCP sunucularınızda ve yapay zeka ajanlarınızda aynı yaklaşımı kullanabilmeniz için Cloudflare Agents SDK içinde yeni bir Code Mode SDK'sını da açık kaynak olarak sunuyor. Bu sunucu tarafı Code Mode uygulaması sayesinde, ajanlar binlerce araç yerine sadece iki fonksiyonla etkileşime giriyor. Ajanlar, search() fonksiyonunu kullanarak OpenAPI spesifikasyonunu keşfedebilir ve execute() fonksiyonu ile Cloudflare API istekleri yapabilir, sayfalandırmayı yönetebilir ve işlemleri zincirleyebilir. Bu, ajanların daha verimli ve ölçeklenebilir bir şekilde çalışmasını sağlıyor.
Bu teknik, yapay zeka ajanlarının geniş API'lara erişimini dramatik şekilde optimize ederek, model bağlam penceresi sınırlamalarını aşmalarını ve daha karmaşık görevleri yerine getirmelerini sağlıyor.