Mevcut dil modelleri (LM'ler) tabanlı kayıpsız ses sıkıştırma yöntemleri genellikle 8-bit ses ile sınırlı kalmıştır. Ancak pratik uygulamalar için 16-bit ve 24-bit gibi daha yüksek bit derinliklerinde bu yaklaşımların ne kadar etkili olduğu ve mevcut kodeklerle (örneğin FLAC) rekabet edip edemeyeceği belirsizliğini koruyordu. Bu çalışma, dil modelleri tabanlı sıkıştırmanın tam kaliteli ses üzerindeki performansını müzik, konuşma ve biyoakustik gibi çeşitli alanlarda, farklı örnekleme hızları (16kHz-48kHz) ve bit derinlikleri (8, 16, 24-bit) genelinde kıyaslıyor.
Yüksek bit derinliklerinde standart örnek düzeyinde belirteçleme (tokenization) yöntemleri, kelime haznesi boyutunun aşırı büyümesi (16-bit için 65K, 24-bit için 16.7M) nedeniyle kullanılamaz hale geliyordu. Araştırmacılar, bu sorunu çözmek için tam çözünürlüklü ses için bayt düzeyinde bir belirteçleme şeması olan Trilobyte'ı öneriyor. Trilobyte, kelime haznesi ölçeklendirmesini O(2^b)'den O(1)'e düşürerek, 24-bit LM tabanlı kayıpsız sıkıştırmayı ilk kez uygulanabilir hale getiriyor.
Yapılan kıyaslama testlerinde, dil modellerinin 8-bit ve 16-bit ses sıkıştırmasında FLAC'ı sürekli olarak geride bıraktığı ve en güncel (state-of-the-art) sonuçlar elde ettiği gözlemlenmiştir. Ancak, bit derinliği 8-bit'in üzerine çıktıkça sıkıştırma kazançlarının daha mütevazı hale geldiği belirtiliyor. Bu bulgular, dil modellerinin yüksek kaliteli ses sıkıştırmasında önemli bir potansiyele sahip olduğunu, ancak bit derinliği arttıkça karşılaşılan zorlukları da ortaya koyuyor.
Dil modellerinin yüksek kaliteli ses sıkıştırmasında FLAC gibi geleneksel yöntemleri geride bırakarak yeni bir standart belirlemesi ve özellikle 24-bit ses için uygulanabilir bir çözüm sunması, ses teknolojileri alanında önemli bir ilerlemedir.