Cloudflare'ın Yeni Crawl Endpoint'i ile Tek API Çağrısıyla Web Sitesi Tarama

Cloudflare, Browser Rendering hizmetine eklediği yeni /crawl endpoint'i ile web sitelerinin tamamını tek bir API çağrısıyla tarama imkanı sunuyor. Açık beta sürecinde olan bu özellik sayesinde kullanıcılar, başlangıç URL'sini belirterek sayfaların otomatik olarak keşfedilmesini, headless bir tarayıcıda işlenmesini ve HTML, Markdown veya Workers AI destekli yapılandırılmış JSON gibi çeşitli formatlarda geri döndürülmesini sağlayabiliyor. Bu yenilik, özellikle yapay zeka modellerini eğitmek, RAG (Retrieval Augmented Generation) pipeline'ları oluşturmak ve web sitelerindeki içeriği araştırmak veya izlemek için büyük kolaylık sağlıyor.

Tarama işlemleri asenkron olarak yürütülüyor. Kullanıcılar bir URL gönderdiğinde bir iş ID'si alıyor ve sayfalar işlendikçe sonuçları kontrol edebiliyor. Endpoint, tarama derinliği, sayfa limitleri ve belirli URL yollarını dahil etme veya hariç tutma için joker karakter desenleri gibi kapsam kontrolleri sunuyor. Ayrıca, sitemap'lerden veya sayfa bağlantılarından URL'leri otomatik olarak keşfetme yeteneğine sahip.

Verimlilik açısından, modifiedSince ve maxAge parametreleri ile artımlı tarama yapılabiliyor, bu da değişmeyen veya yakın zamanda getirilen sayfaların atlanarak zaman ve maliyet tasarrufu sağlamasına olanak tanıyor. Statik siteler için render: false ayarı ile tarayıcı başlatmadan statik HTML'i daha hızlı getirme imkanı da mevcut. Cloudflare, robots.txt direktiflerine ve crawl-delay kurallarına uyarak "iyi huylu bir bot" gibi davranıyor. Bu yeni özellik, hem Workers Free hem de Paid planlarında kullanıma sunuldu.

Cloudflare'ın Yeni Crawl Endpoint'i ile Tek API Çağrısıyla Web Sitesi Tarama

FFmpeg İş Yükünü Cloudflare ile Hafifletmek

Runflow: Yapay Zeka Görüntü Modellerini Tek API'de Birleştiren Platform

RedwoodSDK 1.0 Çıktı: Sunucu Odaklı React Geliştirme Yeniden Tanımlanıyor

Cloudflare'ın Yeni Crawl Endpoint'i ile Tek API Çağrısıyla Web Sitesi Tarama

FFmpeg İş Yükünü Cloudflare ile Hafifletmek

Runflow: Yapay Zeka Görüntü Modellerini Tek API'de Birleştiren Platform

RedwoodSDK 1.0 Çıktı: Sunucu Odaklı React Geliştirme Yeniden Tanımlanıyor

Benzer Haberler

FFmpeg İş Yükünü Cloudflare ile Hafifletmek

Runflow: Yapay Zeka Görüntü Modellerini Tek API'de Birleştiren Platform

RedwoodSDK 1.0 Çıktı: Sunucu Odaklı React Geliştirme Yeniden Tanımlanıyor

Benzer Haberler

FFmpeg İş Yükünü Cloudflare ile Hafifletmek

Runflow: Yapay Zeka Görüntü Modellerini Tek API'de Birleştiren Platform

RedwoodSDK 1.0 Çıktı: Sunucu Odaklı React Geliştirme Yeniden Tanımlanıyor