Yapay zekanın kodlama yeteneği, onu etkili bir şekilde kullanma becerimizi geride bırakıyor ve bu durum, yapay zeka modellerinin sunduğu potansiyel ile mühendislik ekiplerinin gerçek üretkenlik metrikleri arasında bir boşluk yaratıyor. Anthropic gibi şirketlerin 10 günde bir ürün çıkarabilirken, başka bir ekibin aynı modelleri kullanarak basit bir POC'yi bile hayata geçirememesi, bu boşluğu kapatanlarla kapatamayanlar arasındaki farkı ortaya koyuyor. Bu boşluk anında kapanmıyor; sekiz farklı seviyede ilerleyerek kapanıyor ve her seviye, çıktı miktarında büyük bir sıçrama sağlıyor. Model yeteneklerindeki her gelişme de bu kazanımları daha da artırıyor.
Agentic mühendislikteki ilerleme, bireysel yeteneklerin yanı sıra ekip çalışmasının da önemini vurguluyor. Bir ekip üyesinin yüksek seviyede olması, ancak diğerlerinin düşük seviyede kalması, genel verimliliği olumsuz etkileyebilir. Bu nedenle, tüm ekibin seviyesini yükseltmek, bireysel çıktıyı artırmak için kritik öneme sahip. Bu seviyeler, AI destekli kodlama pratiği yapan ekipler ve bireylerle yapılan görüşmeler sonucunda ortaya konmuştur ve tam olarak sıralı olmasa da bir ilerleme yolu sunar.
İlk iki seviye, Tab Complete ve Agent IDE olarak adlandırılır. Tab tamamlama (GitHub Copilot gibi araçlarla başlayan) hareketin başlangıcıydı ve deneyimli geliştiricilerin kod iskeletini oluşturup yapay zekanın boşlukları doldurmasına olanak tanıyordu. Cursor gibi yapay zeka odaklı IDE'ler ise sohbeti kod tabanına bağlayarak çoklu dosya düzenlemelerini kolaylaştırdı. Ancak bu seviyelerin temel sınırlaması her zaman "context" oldu; model ya doğru bağlamı göremiyor ya da çok fazla yanlış bağlam görüyordu. Üçüncü seviye olan Context Engineering ise modellerin belirli sayıda talimatı doğru miktarda bağlamla güvenilir bir şekilde takip etmeye başlamasıyla önem kazandı. Bu seviyede, her bir "token"ın prompt içinde bir amaca hizmet etmesi gerektiği anlayışı benimsenir ve gürültülü bağlamdan kaçınılarak bilgi yoğunluğu artırılmaya çalışılır.
Yapay zeka destekli kodlama süreçlerinde verimliliği artırmak için geliştiricilerin ve ekiplerin belirli bir olgunluk seviyesine ulaşması gerektiğini ve bu seviyelerin her birinin önemli bir çıktı artışı sağladığını gösteriyor.