5.00 / 1 oy

Splash browser nedir?

Bazı internet siteleri ilk açıldıkları esnada html, css ve javascript kodları açılış esnasında derlenir ve tarayıcıda bir internet sitesinin içeriğini oluşturacak şekilde tamamlanır. Ancak bazı internet sitelerinde ise bu yükleme işlemleri ilk açılışta ya da daha fazla göster gibi butonlara tıklanması suretiyle javascript tarafından yapılır, bu gibi internet sitelerinde Scrapy gibi scraping araçları sayfa içeriğini göremezler, çünkü sayfa ilk yüklendiğinde boş ya da eksik html içeriğine sahip olur.

Splash browser, Python içerisinde HTTP API'si ile çalışan bir javascript rendering servisidir. Özellikle web scraping işlemlerinde javascript ile asenkron olarak çalışacak şekilde geliştirilmiş internet sitelerinin içeriğine erişmek amacıyla yaygın olarak kullanılmaktadır ve öğrenme zorluğu açısından rakibi Selenium'a göre biraz daha kolay öğrenilebilir olduğunu söyleyebiliriz. Splash, aynı zamanda hafif, hızlı ve aynı anda çok sayıda javascript sayfayı tarayabilme özelliğine sahip bir araç olduğu için oldukça yaygın olarak da kullanılmaktadır.

Windows, Mac, Linux gibi işletim sistemlerinde Splash bworser kullanabilirsiniz, bunun için en sık tercih edilen yöntem Docker kullanmaktır.

 

Editör editi: sitedeki bazı diğer benzer başlıklar için;

bkz: Scrapy sonuçlarını export etmek (json, xml, csv)

bkz: Scrapy ile yeni bir proje açmak

bkz: DNS'te autodiscover düzenlemesinin amacı nedir?

bkz: Web Scraping Nedir?

bkz: Scrapy Nedir ve Nasıl Kullanılır?

bkz: Visual Studio Code'da Namespace'i Otomatik Olarak Eklemek (C#)

bora34

02.06.2021 09:14

Bu soru henüz yanıtlanmamış.

Bu soruya sadece kayıtlı kullanıcılar yanıt yazabilirler. Yanıt yazmak için lütfen giriş yapınız.

Reitix
Splash browser nedir?

İnternet sitemizdeki deneyiminizi iyileştirmek için çerezler kullanıyoruz. Bu siteye giriş yaparak çerez kullanımını kabul etmiş sayılıyorsunuz. Daha fazla bilgi.