Scrapy ile oluşturduğunuz projedeki bir spider'ı kullanarak bir internet sitesinde istediğiniz alanları terminalde listelediyseniz, scrape ettiğiniz bu bilgileri kullanabilmek için bir txt dosyasına kopyala yapıştır yapmak işinize muhtemelen yaramayacakır. Çünkü bu verileri muhtemelen farklı bir projede biçimlendirilmiş veri olarak kullanmak için zaten scraping işlemini yapmışsınızdır ve düzenli olarak tarama işlemleri de devam edecekse her seferinde copy paste ile export etmek ve sonrasında da biçimlendirmek büyük bir zaman kaybı olur.
Scrapy'nin kendi içerisinde scraping sonuçlarını export edebilmeniz için zaten hazır kodlar bulunuyor ve bu kodları kullanarak terminalinizde listelediğiniz sayfa içeriklerini csv, xml ve json gibi formatlarda export edebilirsiniz.
Örneğin "orumcek" adında bir spider yazdıysanız bu spider'ı çalıştırmak için normalda aşağıdaki kodu kullanırsınız:
scrapy crawl orumcek
Sonuçlarınızı bir json dosyasına export etmek için kodunuzu şu şekilde yazmalısınız:
scrapy crawl orumcek -o dosyaadi.json
Benzer şekilde xml ve csv formatlarında export alabilmek için de yine aşağıdaki terminal kodlarını kullanabilirsiniz.
scrapy crawl orumcek -o dosyaadi.csv
XML için:
scrapy crawl orumcek -o dosyaadi.xml
Editör editi: sitede daha önce paylaşılan bazı diğer benzer yazılar için;
bkz: Web Scraping Nedir?
bkz: Scrapy ile yeni bir proje açmak
bkz: Scrapy Nedir ve Nasıl Kullanılır?
bkz: Chrome Bağlantınız gizli değil hatası ve çözümü
bkz: Chrome Bağlantınız gizli değil hatası ve çözümü
bkz: Chrome uzaktan masaüstü nedir ve ne işe yarar?