Semalt: Google Chrome Uzantısını Kullanarak Bir Web Sayfasını Kazıma

Ekran kazıyıcı, siteleri okuyan ve web'den faydalı bilgiler alan bir komut dosyasıdır. Ekran kazıma, web sitelerinden ve web sayfalarından gerçek verileri Microsoft Excel'e almak için nihai çözümdür. Google Chrome Extension Scraper, hem Windows hem de Mac OS'de çalışan güçlü bir ekran kazıma aracıdır .

Neden Google Chrome Uzantı Sıyırıcı?

Google Chrome uzantı kazıyıcı, Chrome Web Mağazası'nda ücretsiz olarak kullanılabilecek güçlü bir ekran kazıma aracıdır. Bu kazıma aracı , Chrome tarayıcısına eklenti olarak yüklenir. Eklenti, blogcuların ve pazarlamacıların bir öğeye sağ tıklayarak web sayfalarından veri almasına olanak tanır. Bir öğeye sağ tıklarsanız, ekranda '' Scrape Similar '' görünmelidir.

XPath'lara Giriş

XPath, XML yapılarında önemli bilgileri bulmak için kullanılan bir programlama dilidir. HTML dosyası, XML yapısının mükemmel bir örneğidir. XPath genellikle hedeflenen düğümleri seçmek için kullanılır. Bu bağlamda, XPaths bir web sayfasında çıkarılacak metni belirlemek için kullanılacaktır. XPaths ayrıca İsveç milletvekillerinin parti adlarını ve telefon numaralarını belirlemeye yardımcı olacak.

349 İsveç Milletvekilinin adres ayrıntılarına erişmek için Google Chrome'un kazıyıcısını kullanma

Chrome Scraper ile bir web sayfasından bilgi çıkarmak sadece basit değil aynı zamanda harika. Sürecin ve tekniğin kendisinin tadını çıkaracaksınız.

Web sitesi tüm İsveç üyelerini ve adreslerini listeler. Başlamak için herhangi bir MP'ye sağ tıklayın ve "Benzerini Kazıyın" ı seçin. Ekranınızda aşağıdaki görüntüyü görmelisiniz.

Web sayfasını taramak için adım adım kılavuz

Bir MP'ye sağ tıklayıp "Inspect element" i seçerseniz, "" grid_6 alfa omega arama sonucu kap clist "sınıfı altında alfabetik bir liste oluşturulacaktır. Bu web sayfasını kazımak için iki adım kullanılacaktır. XPath içeren MP verilerinden oluşan etiketler İkinci adım, parti adları, isimler ve telefon numarası gibi verilerin belirli bölümlerinin seçilmesini ve verilerin sütunlar halinde düzenlenmesini içerecektir.

Aşama 1

HTML yapısının derinliklerine inin ve öğeleri olduğu gibi bırakın. Yapınızdaki öğelere karşılık gelen etiket sayısını tanımlamak için etiketleri işaretleyin. Hedeflenen verilerden oluşan son etiketi tanımlayın. "Scrape" yi tıklatarak yapı üzerinde bir XPath testi çalıştırın.

Ekranınızda 349 satırdan oluşan bir liste görüntülenecektir. 349, İsveç Milletvekillerinin toplam sayısını temsil etmektedir.

Adım 2

Sunulan verileri sütunlara bölün. Kullandığınız web sayfasındaki HTML kodunu inceleyin. Bu durumda, çıkarılacak parçalar şu anda sarı ile vurgulanır. XPath'leri oluşturulan sütunlar alanına ekleyin ve eklentiyi çalıştırmak için "Kazıma" yı tıklayın.

Temel XPath bilgisine sahipseniz, programlamayı anlamak sizin için yoğun bir görev olmayacaktır. Yukarıda vurgulanan adımlar, kazıma web sayfasını nasıl tarayacağınız konusunda size rehberlik eder. Birden fazla web sayfasını kazımaya çalışıyorsanız, programlama becerilerine sahip olmanız gerekir.

mass gmail