Legend of Elya, Nintendo 64 (N64) için geliştirilmiş, Sophia Elya adlı karakter seviyesinde bir büyük dil modeli (LLM - nano-GPT) içeren orijinal bir homebrew oyunudur. Bu proje, 93 MHz hızındaki VR4300 MIPS CPU'ya sahip N64 donanımı üzerinde tamamen çalışan ilk sinirsel dil modeli olma özelliğini taşıyor. Projenin temel amacı, modern bulut altyapısına veya hileye başvurmadan, 1996 yılına ait gerçek silikon üzerinde gerçek zamanlı sinirsel çıkarım yapmaktır. Bu başarı, sınırlı 4 MB RAM ve N64'ün FPU'sundaki kısıtlamalar nedeniyle kayan nokta aritmetiği yerine Q8.7 sabit nokta aritmetiği kullanılarak elde edilmiştir.
Sophia Elya modeli, 2 transformatör bloğu, 128 gömme boyutu, 4 dikkat başlığı ve 256 kelime dağarcığına sahip nano-GPT mimarisi üzerine kurulmuştur. 32 token'lık bir bağlam penceresi ile çalışır ve ağırlıklar Q4 niceleme (quantization) kullanılarak optimize edilmiştir, bu da modelin sadece yaklaşık 232 KB'lık bir ağırlık dosyası boyutuna sahip olmasını sağlar. Tüm çıkarım yolu boyunca kayan nokta veya çift hassasiyetli sayılar kullanılmamıştır; çarpma, katman normalizasyonu ve softmax gibi işlemlerin tamamı tamsayı yaklaşımları ve sabit nokta aritmetiği ile gerçekleştirilmiştir.
Model, Sophia Elya'nın kimliği, Ocarina of Time evreni, Elyan Labs'in teknolojileri ve N64/MIPS mimarisi gibi çeşitli konuları kapsayan karakter seviyesinde bir veri kümesi üzerinde eğitilmiştir. Bu proje, eski donanım üzerinde modern yapay zeka yeteneklerini göstermesi açısından önemli bir mühendislik başarısıdır ve sınırlı kaynaklara sahip sistemlerde yapay zeka uygulamalarının potansiyelini gözler önüne sermektedir.
Eski nesil oyun konsolu donanımında modern bir yapay zeka dil modelinin gerçek zamanlı çalıştırılması, donanım kısıtlamalarına rağmen yenilikçi mühendislik çözümlerinin mümkün olduğunu gösteriyor.