Turbopuffer'da bir müşteri, binlerce izin tanımlayıcısını içeren bir tam metin (BM25) sorgusunda 220ms gibi yüksek bir gecikme yaşıyordu. Milyonlarca belge üzerinde çalışan benzer sorgular genellikle 50ms'den az sürerken, bu özel sorgu dört katından fazla zaman alıyordu. Sorgu profilleri incelendiğinde, BM25 sıralamasına sadece 10ms harcanırken, geri kalan 200ms'den fazlasının filtre değerlendirmesine gittiği ortaya çıktı. Basit hesaplamalar, filtre değerlendirmesinin 10-20ms sürmesi gerektiğini gösteriyordu, bu da gerçek performans ile beklenti arasında büyük bir fark olduğunu işaret ediyordu.
Bu büyük farkın nedenini araştıran ekip, Rust'ın "sıfır maliyetli" soyutlamalarının beklenmedik bir şekilde vektörleştirmeyi (SIMD) engellediğini keşfetti. Rust'ın yineleyicileri (iterators) genellikle verimli olsa da, bu durumda derleyicinin otomatik vektörleştirme yapmasını sessizce önlüyordu. Bu durum, donanımın çalışma prensiplerini (mekanik sempati) anlamanın önemini bir kez daha gösterdi.
Yapılan optimizasyonlar sonucunda, tam metin arama sorgusunun gecikmesi 220ms'den 47ms'ye düşürüldü. Bu başarı, "sıfır maliyetli" soyutlamaların bile geliştiricileri donanım seviyesindeki performansı göz ardı etmekten kurtarmadığını vurguladı. Geliştiricilerin, yüksek performans gerektiren sistemlerde soyutlamaların altında yatan mekanizmaları anlamaları ve gerektiğinde manuel optimizasyonlara başvurmaları gerektiği anlaşıldı.
Rust'ın "sıfır maliyetli" soyutlamalarının bile donanım seviyesindeki optimizasyonları (SIMD) engelleyebileceği ve mekanik sempati pratiğinin önemini ortaya koyan bir performans iyileştirme hikayesi.