RynnBrain, Alibaba Damo Academy tarafından geliştirilen, fiziksel gerçekliğe dayalı yenilikçi bir gömülü temel modeldir. Bu model, 2B ve 8B yoğun varyantlarının yanı sıra, 30B-A3B Mixture-of-Experts (MoE) modeliyle birlikte sunulmaktadır. Ayrıca, robot görev planlaması için RynnBrain-Plan, görsel-dilsel navigasyon için RynnBrain-Nav ve nokta zinciri muhakemesi için RynnBrain-CoP olmak üzere üç özel olarak eğitilmiş model de mevcuttur. RynnBrain, kapsamlı benmerkezci anlayış, çeşitli uzamsal-zamansal yerelleştirme, fiziksel alan muhakemesi ve fizik farkındalıklı hassas planlama gibi temel yeteneklere sahiptir.
Model, ince taneli video anlama, benmerkezci biliş (QA, sayma, OCR gibi görevler), nesnelerin, hedef alanların ve hareket yörüngelerinin hassas tespiti gibi konularda üstün performans sergiler. Metinsel ve uzamsal temellendirme arasında geçiş yapan bir muhakeme stratejisi kullanarak, fiziksel çevreye sıkıca bağlı akıl yürütme süreçleri sağlar. Ayrıca, tespit edilen uygunlukları ve nesne bilgilerini planlamaya entegre ederek, alt akım VLA modellerinin karmaşık görevleri ince taneli talimatlarla yürütmesine olanak tanır.
RynnBrain, tek tip bir kodlayıcı-kod çözücü mimarisi (hem Yoğun hem de MoE varyantlarını destekler) kullanarak çok yönlü görsel girdileri ve metinsel talimatları uzamsal yörüngeler, fiziksel işaretleme ve eylem planlaması gibi çok modlu çıktılara dönüştürür. Zengin uzamsal-zamansal, fiziksel alan ve genel bilgi verileri üzerinde yapılan büyük ölçekli eğitim sayesinde, RynnBrain sağlam genel amaçlı yeteneklerini korurken, çeşitli, ince taneli gömülü muhakeme ve karmaşık planlama görevlerinde uzmanlaşmıştır. Minimum bağımlılıklarla kolayca kurulabilir ve kullanılabilir.
RynnBrain, robotik ve yapay zeka alanında fiziksel dünyayı anlama ve etkileşim kurma yeteneğini önemli ölçüde ileri taşıyarak, daha akıllı ve otonom sistemlerin geliştirilmesine kapı aralıyor.