Semalt útmutató a lehúzó hosszabbításhoz a Chrome-hoz

Ahhoz, hogy bármely vállalkozás fennmaradjon és végül növekedjen, fenn kell tartania a versenytársait és a különféle kockázatokat. Az elemzési adatok alapján történő döntéshozatal biztos módja annak, hogy elfelejtsük ezeket a problémákat. Az ilyen adatok adatcseréléssel szerezhetők be. Itt jön be a könnyű lehúzó kiterjesztés a Chrome-hoz: ez nem csak megkönnyíti az adatgyűjtési folyamatot, hanem lehetővé teszi útközben történő kaparást is bonyolult beállítások nélkül.

Hogyan kell használni a kaparót

    1. Az első dolog, amit meg kell tennie, a telepíteni a bővítményt, tehát menjen a chrome webáruházba, keresse meg a "lehúzót", és kattintson a Hozzáadás a Chrome-hoz elemre.

    2. Keresse meg azt a weboldalt, amelyről adatot szeretne kapni , jelölje meg az érdeklődő tételt annak kiemelésével. Kattintson a jobb egérgombbal, és válassza a megjelenő menüben a „hasonló kaparás” lehetőséget.

    3. Ezzel elindít egy külön lehúzókonzol ablakot. Itt megjelenik a lekaparott adatok listája.

    4. A tartalom mentéséhez kattintson a "Mentés a Google docs-ra" elemre, ez automatikusan exportálja az adatokat egy Google táblázatba.

Bővített kaparás

Abban az esetben, ha több adatot szeretne lekapartítani, használhatja a speciális megközelítést. Megjegyzés: sokkal könnyebb lesz az eszközzel dolgozni, ha ismeri a HTML-et. Tegyük fel, hogy az adatokat egy olyan forrásból akarta lekaparni, amely idősorokra épülő archívummal rendelkezik. Ebben az esetben, ha megpróbálja a fentebb leírt módszert, megkapja az elrontott adatokat.

A probléma megoldásához használhat egy HTML és XML lekérdezési nyelvet, az úgynevezett XPath. Mit csinal? Az XPath felismeri az egyes kiválasztások különböző elemeire vonatkozó adatokat. Az alábbiakban bemutatjuk, hogyan lehet ezt megtenni:

1. Lépjen a Scraper konzolra, a bal felső sarokban egy "XPath" gombra kell kattintania, kattintson rá, és folytassa a kezdeti táblázat összeállításával.

2. A megfelelő elemhez meg kell írnia az XPath-t. A jelenlegi XPath, amely tartalmazza a teljes információt, a következő formátumban jelenik meg: "// div [3] / div [3] / div [2] / div". A <div> elemeket a számítógép felismeri a HTML dokumentumban.

3. A felismert adatok elválasztásához a Scraper oszlopokat kell használnia. Ehhez meg kell keresnie a rendelkezésre álló különféle információkat. A lekapart adattól függően előfordulhat, hogy címei vannak. Ezek a címek minden adatkészlet mellett megtalálhatók. Ezeket egy címke kíséri, ebben az esetben egy <b> címke.

4. Az ellenőrző elem segítségével keresse meg és adja hozzá a <b> címkét XPath-jéhez. Most megnevezheti ezt az első oszlopot "cím oszlopnak", mivel felsorolja a címeket. Folytassa a különböző XPath-ek létrehozásával minden szükséges oszlophoz.

5. Kattintson a kaparásra, és a kiterjesztés automatikusan összegyűjti az adatokat, és a megadott oszlopokba rendezi.