Yapay Zeka Modelleri Serbest Çalışma Görevlerinin %96'sından Fazlasında Başarısız Oldu

Yeni bir araştırmaya göre, önde gelen yapay zeka modelleri, serbest çalışanların gerçekleştirdiği gerçek dünya görevlerinin %96'sından fazlasını tamamlamakta başarısız oldu. "Remote Labor Index" (RLI) adlı bu çalışma, yapay zekanın insan iş gücünü ne ölçüde ikame edebileceğini ölçmek amacıyla tasarlandı. Araştırmacılar, daha önce gerçek serbest çalışanlar tarafından tamamlanmış ve oyun geliştirme, ürün tasarımı, mimari, veri analizi ve video animasyonu gibi çeşitli alanları kapsayan bir dizi projeyi yapay zeka modellerine verdi. Bu projeler arasında Dünya Mutluluk Raporu için etkileşimli bir kontrol paneli oluşturma, yeni kulaklık tasarımı için 3D animasyonlar hazırlama ve hatta "Watermelon Game" benzeri bir oyun geliştirme gibi zorlu görevler bulunuyordu. İnsanlar tarafından tamamlanması 100 saatten fazla süren ve 10.000 dolara mal olan bu görevler, yapay zekanın yeteneklerini kapsamlı bir şekilde test etmeyi amaçlıyordu.

Çalışmada Manus, Grok 4, Sonnet 4.5, GPT-5, ChatGPT agent ve Gemini 2.5 Pro gibi çeşitli yapay zeka modelleri kullanıldı. Sonuçlar, yapay zekanın bu tür karmaşık ve çok yönlü görevlerde beklentilerin çok altında kaldığını gösterdi. En iyi performans gösteren model olan Manus bile yalnızca %2,5'lik bir otomasyon oranı elde edebildi. Diğer modellerin performansları ise daha da düşüktü; örneğin Gemini 2.5 Pro sadece %0,8'lik bir başarı oranı sergiledi. Araştırmacılar, bu sonuçların, günümüz yapay zeka sistemlerinin uzaktan çalışma platformlarındaki projelerin büyük çoğunluğunu kabul edilebilir bir kalite seviyesinde tamamlayamadığını açıkça ortaya koyduğunu belirtti. Bu durum, yapay zekanın işleri ele geçireceği yönündeki korkuların, en azından şimdilik, abartılı olabileceğini düşündürüyor.

Yapay Zeka Modelleri Serbest Çalışma Görevlerinin %96'sından Fazlasında Başarısız Oldu

LLM'ler Yazılım Sektöründe Bir Dönüm Noktası Yarattı: Geliştiriciler İçin Yeni Bir Çağ

Yapay Zeka Metinlerini Sorgusuz Paylaşmanın Sakıncaları

Büyük Dil Modeli Mimarileri Galerisi: LLM Tasarımlarına Derin Bakış

Yapay Zeka Modelleri Serbest Çalışma Görevlerinin %96'sından Fazlasında Başarısız Oldu

LLM'ler Yazılım Sektöründe Bir Dönüm Noktası Yarattı: Geliştiriciler İçin Yeni Bir Çağ

Yapay Zeka Metinlerini Sorgusuz Paylaşmanın Sakıncaları

Büyük Dil Modeli Mimarileri Galerisi: LLM Tasarımlarına Derin Bakış

Benzer Haberler

LLM'ler Yazılım Sektöründe Bir Dönüm Noktası Yarattı: Geliştiriciler İçin Yeni Bir Çağ

Yapay Zeka Metinlerini Sorgusuz Paylaşmanın Sakıncaları

Büyük Dil Modeli Mimarileri Galerisi: LLM Tasarımlarına Derin Bakış

Benzer Haberler

LLM'ler Yazılım Sektöründe Bir Dönüm Noktası Yarattı: Geliştiriciler İçin Yeni Bir Çağ

Yapay Zeka Metinlerini Sorgusuz Paylaşmanın Sakıncaları

Büyük Dil Modeli Mimarileri Galerisi: LLM Tasarımlarına Derin Bakış