Ana Sayfa

Marginalia Arama Motoru'nda Güven Tabanlı Yeni Sıralama Sistemi

1 dk okuma

Marginalia Arama Motoru, son zamanlarda yaşadığı bir dizi hata düzeltmesi sonucunda beklenmedik bir sorunla karşılaştı: arama sonuçlarında spam ve içerik çiftliği (content farm) sitelerinin artması. Bu istenmeyen durumu gidermek amacıyla, basit ancak şaşırtıcı derecede etkili bir güven tabanlı model geliştirildi ve uygulandı. Bu yeni sistem, varsayılan sıralama algoritmasında radikal bir iyileşme sağlayarak, insan tarafından yazılmış yüksek kaliteli içeriği ön plana çıkarırken, içerik çiftliği sonuçlarının sayısını önemli ölçüde azaltıyor.

Sistem, ilk olarak yüksek kaliteli olduğu bilinen, büyük bir "güvenilir alan adları" (trusted domains) kümesi tanımlıyor. Bu sitelerin çoğu insan tarafından yazılmış ve spam içermiyor. Ardından, bu güvenilir alan adlarına doğrudan bağlantı veren veya bu alan adlarından bağlantı alan diğer sitelerin bağlantı grafiği analiz ediliyor. Siteler, güvenilir alan adlarıyla olan bağlantı türlerine ve sayılarına göre çeşitli kategorilere ayrılıyor. Örneğin, çift yönlü olarak beş veya daha fazla bağlantısı olanlar, sadece gelen veya giden bağlantısı olanlar gibi.

Bu kategorizasyona ve incelenen güvenilir olmayan alan adının büyüklüğüne (dizinlenen belge sayısı) bağlı olarak sitelere bir ceza puanı uygulanıyor. Daha büyük ve güvenilir alan adlarıyla zayıf bağlantısı olan siteler, daha küçük ve güçlü bağlantıları olan sitelere göre daha yüksek cezalar alıyor. Bu yaklaşım, sadece popülerliğe dayalı sıralama algoritmalarının "kazanan hepsini alır" (winner-takes-all) mekanizmasını önleyerek, belirli bir siteyi yapay olarak yükseltmek yerine, alakasız olma olasılığı yüksek siteleri sonuçlardan uzaklaştırıyor. Ayrıca, bir web sitesinin kaç reklam ağına bağlı olduğu gibi diğer sıralama faktörleriyle birleşerek çoğunlukla temiz sonuçlar sunmayı hedefliyor. PageRank gibi algoritmaların kötü niyetli manipülasyonlara açık olma dezavantajını da bu sistemle aşmayı amaçlıyor.

İçgörü

Marginalia Arama Motoru'nun yeni güven tabanlı sıralama sistemi, spam ve içerik çiftliği sitelerini filtreleyerek arama sonuçlarının kalitesini artırıyor ve kullanıcı deneyimini iyileştiriyor.

Kaynak