MariaDB, vektör arama performansında önemli iyileştirmelerle dikkat çekiyor. Geçtiğimiz yıl MariaDB 11 sürümünün vektör arama yetenekleri ann-benchmarks testleriyle belgelenmiş ve performansı oldukça beğenilmişti. Yeni blog yazısı, MariaDB 12.3 sürümünün bu alandaki başarısını daha da ileri taşıdığını ortaya koyuyor. Small Datum LLC tarafından MariaDB Vakfı sponsorluğunda yürütülen bu çalışma, özellikle büyük veri kümelerinde MariaDB'nin rakiplerine karşı üstünlüğünü gösteriyor.
Yapılan testler, MariaDB 12.3'ün vektör arama recall ve precision oranlarında MariaDB 11.8'den daha iyi sonuçlar verdiğini gösteriyor. Hatta MariaDB 11.8'in bile pgvector 0.8.1 kullanan Postgres 18.2'den daha iyi performans sergilediği belirtiliyor. MariaDB 12.3'teki bu gelişmeler, özellikle 500 bin ve 1 milyon gibi daha büyük veri kümelerinde çok daha belirgin hale geliyor. Performans artışının temel nedenlerinden biri, MariaDB 12.3'ün sorgu başına daha az CPU kullanması olarak açıklanıyor; bu durum vmstat izlemleriyle de doğrulanmış.
Testler, ann-benchmarks aracı kullanılarak dbpedia-openai-X-angular veri setleri (100k, 500k, 1000k) üzerinde gerçekleştirildi. Donanım olarak 48 çekirdekli, 128 GB RAM'e sahip bir sunucu ve NVMe RAID 10 depolama kullanıldı. MariaDB'nin 11.8.5 ve 12.3.0 sürümleri ile Postgres 18.2 (pgvector ile) kaynak koddan derlenerek test edildi. ps ve vmstat ile yapılan izlemeler, testler sırasında tablo ve dizinlerin bellek tarafından önbelleğe alındığını ve depolama okuması yapılmadığını doğruladı. Sonuçlar, MariaDB 12.3'ün genel olarak en iyi performansı sunduğunu net bir şekilde gösteriyor.
MariaDB'nin vektör arama yeteneklerindeki bu ilerleme, yapay zeka ve büyük veri uygulamaları için daha hızlı ve verimli çözümler sunarak veritabanı teknolojilerinde önemli bir rekabet avantajı sağlıyor.