Yapay zeka, 1996'da dünya satranç şampiyonunu yendiğinde taşları hareket ettirecek bir insana ihtiyaç duyuyordu. Yirmi yıl sonra AlphaGo, Go şampiyonunu yendiğinde de durum farklı değildi. Günümüzde büyük dil modelleri (LLM) Uluslararası Matematik Olimpiyatı (IMO) altın madalya problemlerini çözebiliyor ancak cevabı bir kalemle yazamıyor. İnsanlar için zor görünen problemlerin makineler için kolay, insanlar için kolay görünen problemlerin makineler için son derece zor olması durumu Moravec Paradoksu olarak adlandırılır. Satranç oynamak, matematik problemleri çözmek veya trafikli yollarda en kısa rotayı planlamak makineler için "kolay"ken, bir satranç taşını kaldırmak, not yazmak veya bulaşık yıkamak gibi basit görünen görevler robotlar için olağanüstü zorluklar sunar.
Bu paradoksu vurgulamak amacıyla Benjie Holson, yakın tarihli bir blog yazısında "Robot Olimpiyatları" adı altında bir dizi meydan okuma görevi önerdi. Bu görevler arasında fıstık ezmesi sürmek, yağlı bir tavayı yıkamak, anahtarı kilide sokmak ve çorapları ters çevirmek gibi günlük, basit davranışlar yer alıyor. Bu görevler, matematik olimpiyatı problemleri kadar bilişsel olarak zorlayıcı görünmese de, robotik uzmanları otonom robotlar için ciddi engeller teşkil ettiğine inanıyor.
Şirketimiz, en son π0.6 modelini ince ayar yaparak bu görevlerden kaçını çözebileceğini görmek istedi. Bu, genel yeteneklerin iyi bir testiydi çünkü görevler bizim tarafımızdan seçilmemişti, çeşitli manipülasyon yeteneklerini test ediyorlardı ve daha önceki robotik sistemlerle gösterilmemişlerdi. Önerilen 5 kategoriden 3'ünde "altın madalya" görevleri için başlangıç çözümleri gösterebildik, diğer 2'sinde ise "gümüş madalya" elde ettik. Çözemediğimiz iki altın madalya görevi, robotumuz için fiziksel olarak imkansızdı. Tüm bunları sadece en son modelimize ince ayar yaparak başardık. Bu, odaklanmış bir araştırma projesi değildi ve çalışmanın çoğu, her görev için veri toplamaktan ibaretti (çoğu görev için 9 saatten az). Standart bir VLM'yi π0.6 modelimiz olmadan ince ayar yapan bir temel çizgi testi, hiçbir görevde başarılı olamadı ve ortalama %9'luk bir görev ilerlemesi gösterdi; bu da büyük ölçekli robot ön eğitiminin bu sonuç için temel olduğunu ortaya koydu.
Yapay zeka ve robotik alanındaki ilerlemelere rağmen, makinelerin gündelik fiziksel görevleri yerine getirmekteki zorlukları, robotik temel model ön eğitiminin kritik önemini ortaya koyuyor.