Yapay zeka alanındaki önde gelen laboratuvarlar, Meta, Google, OpenAI ve Anthropic gibi devler, "Dünya Modelleri" (World Models) adı verilen yeni bir araştırma alanına yoğunlaşıyor. Bu modeller, bir ortamın (video oyunu, kod tabanı veya pazar gibi) nedensel yasalarını anlamayı ve bir sonraki durumunu veya gözlemini tahmin etmeyi amaçlar. Bu, mevcut yapay zeka sistemlerinin çoğundan farklı bir yaklaşımdır. Geleneksel transformer modelleri bir sonraki belirteci (token) tahmin ederken veya pekiştirmeli öğrenme (RL) ile eğitilmiş modeller bir ödülü optimize ederken, dünya modelleri bir müdahale sonrası dünyanın nasıl görüneceğini simüle eder.
Örneğin, Meta'nın geliştirdiği Code World Model (CWM), sadece kodun nasıl göründüğünü değil, aynı zamanda yürütüldüğünde ne yapacağını da anlar ve tahmin eder. Bu sayede, 32 milyar parametreli bir CWM, SWE-Bench ve Terminal Bench gibi yürütmeye dayalı kıyaslamalarda daha büyük modellerle aynı veya daha iyi performans gösterebilmektedir. Bu durum, durum geçişleri üzerine eğitim yapmanın, aynı temel bilgilere erişilse bile belirteç dizileri üzerine eğitim yapmaktan daha örnek-verimli olabileceğini ortaya koymaktadır. Aslında, tavsiye motorları gibi sistemler de on yıllardır insan dikkatine yönelik birer dünya modeli olarak işlev görmektedir.
Bu yakınlaşma, yapay zekanın sadece desen eşleştirmeden öteye geçerek, planlama, simülasyon ve çevreyi derinlemesine anlama yeteneklerine doğru evrildiğini göstermektedir. Dünya modelleri, daha sağlam, öngörülebilir ve gerçek dünyayla etkileşime girebilen yapay zeka sistemlerinin geliştirilmesinde kritik bir rol oynayabilir.
Yapay zeka, sadece desen eşleştirmeden simülasyon ve nedensel anlayışa doğru evrilerek daha ileri seviye yetenekler kazanıyor.