pgvectorscale, açık kaynaklı PostgreSQL vektör veri uzantısı pgvector'ı tamamlayan ve vektör veri işleme yeteneklerini önemli ölçüde artıran yeni bir eklentidir. Timescale tarafından geliştirilen bu uzantı, pgvector verileri için üç temel yenilik sunar: Microsoft araştırmalarından ilham alan StreamingDiskANN adında yeni bir indeks türü, standart Binary Quantization yöntemini geliştiren Statistical Binary Quantization adlı bir sıkıştırma metodu ve daha hassas sonuçlar için vektör benzerlik aramasını etiket filtrelemeyle birleştiren Label-based filtered vector search.
50 milyon Cohere gömme verisi üzerinde yapılan karşılaştırmalı testlerde, pgvector ve pgvectorscale kullanan PostgreSQL, %99 doğruluk oranında yaklaşık en yakın komşu sorgularında Pinecone'un depolama optimize edilmiş (s1) indeksine kıyasla %28 daha düşük p95 gecikme süresi ve %16 daha yüksek sorgu verimi elde etmiştir. Üstelik bu performans artışı, AWS EC2 üzerinde kendi kendine barındırıldığında %75 daha düşük maliyetle sağlanmaktadır. pgvectorscale, pgvector'ın C ile yazılmasının aksine, PGRX framework kullanılarak Rust dilinde geliştirilmiştir ve PostgreSQL topluluğuna vektör desteğine katkıda bulunmak için yeni bir yol sunmaktadır.
Uygulama geliştiricileri ve veritabanı yöneticileri, pgvectorscale'i PostgreSQL veritabanlarıyla kolayca kullanabilirler. Kurulum için önceden oluşturulmuş Docker konteynerleri, kaynak koddan derleme veya Timescale Cloud hizmetlerinde etkinleştirme gibi çeşitli seçenekler mevcuttur. Bu uzantı, özellikle yapay zeka ve makine öğrenimi uygulamalarında kullanılan büyük ölçekli vektör veritabanı iş yükleri için kritik performans ve maliyet avantajları sağlamaktadır.
Bu uzantı, PostgreSQL'i vektör veritabanı yetenekleri açısından lider çözümlerden biri haline getirerek yapay zeka uygulamalarının temel altyapı ihtiyaçlarını karşılamada önemli bir adım atıyor.