Back to Question Center
0

Chrome Web lehúzó bemutatója a Semalt Expert szakértőjétől

1 answers:

Ha a Google Chrome-ot használja, a böngészőnek van egy kiterjesztése amely segíti a weboldalak felverését. Az úgynevezett "Scrapper", és problémamentesen használható. A Scrapper segítséget nyújt a webhely tartalmának lekerülésében és az eredmények feltöltésében a Google-dokumentumokban.

Hogyan törölni egy weboldalt a Scraper kiterjesztéssel?

1. Válassza ki a Chrome Internetes áruházat a Google Chrome-ban;

2. A kiterjesztéseknél végezzen keresést a "Scrapper" -ről;

3. Az első keresési eredmény a "Scrapper" néven ismert kiterjesztés;

4. Válassza ki a "Hozzáadás a Chrome-hoz" opciót;

5. Visszalépés az Egyesült Királyság parlamenti képviselőihez;

6. Kattintson a következőre ;

7. Most keressen egy MP-t, és győződjön meg róla, hogy a bejegyzést megjelölték;

8. Jobb gombbal válassza ki a "Scrape Hasonló ... "opció;

9. A kaparó konzol egy másik ablakban felbukkant;

10. Tekintse meg a lekapartott tartalmat a lehúzóban konzol;

11. Annak biztosítása érdekében, hogy a tartalmat Google Spreadsheetként mentsük el, válassza a "Mentés a Google Dokumentumokba ..."

Kiterjesztett kaparás

, érdemes megérteni a HTML alapjait. Például egy rövid bevezetést olvashat HTML-en keresztül ezen a linken

Képzeljük el, hogy érdekel minden olyan film, amely az Ázsia Argento- egy híres olasz színésznő

1. Az IMDB-ben szereplõ szereplõk nagyon részletes archívumot tartalmaznak Ázsia Argento honlapja: https://www.imdb.com/name/nm0000782/;

2. Itt megtekintheti a színésznő összes szerepét..Kezdjük elbontani az általunk érdekelt információkat;

3. Próbálja lehúzni a fent leírtak szerint;

4. Láthatja, hogy a lista kicsit torzult. Ez annak köszönhető, hogy az itt felsorolt ​​lista különbözőképpen strukturálható;

5. Menjen a kaparó konzolhoz. A bal felső sarokban megjelenik a kis doboz, amely XPath-et mond;

6. Az Xpath egyfajta lekérdezési nyelv, amely XML és HTML formátumban működik;

7. Az XPath segít megtalálni az Ön által érdekelt oldal részeit. A következő dolog egy megfelelő elem megtalálása és írása az XPath számára;

8. Most rendezzük el asztalunkat;

9. Meg fogja találni, hogy a meglévő XPath, melynek minden szükséges adata van, "// div [3] / div [3] / div [2] / div";

10. XPath tájékoztatja a rendszert, hogy megtekinthesse a HTML dokumentumot, és válassza ki a harmadik elemet, majd a második elemet, majd mindegyiket;

11. De szeretnénk, hogy adataink elváljanak;

12. Használja ki az oszlopok szekcióját a konzolban a kaparóhoz;

13. Először keressük meg címünket: Használja az Inspect elemet a cím megtekintéséhez;

14. Ellenőrizze a címet egy címkén. Adja hozzá a címkét az XPath-hez;

15. A kifejezés úgy tűnik, hogy megfelelően működik, ezért legyen az első oszlopunk;

16. Az "Oszlopok" részben helyezze az első oszlop nevét "cím" -re;

17. Adja hozzá az XPath-ot;

18. Az oszloprészben az XPathok relatívak és azt jelenti, hogy "./b" választja a elemet

19. Az XPath a cím oszlophoz írja be a "./b" szót és válassza a "kaparás" elemet;

20. Most megyünk egy évig. Évek egyszerre találhatók;

21. Hozzon létre egy új oszlopot azáltal, hogy kiválasztja a címhez tartozó oszlop melletti kis plusz pontot;

22. Az XPath "./span" használata oszlopot hoz létre az "év" -re;

23. Kattints a kaparás és megtekintheted az év hozzáadását;

24. Kész!

1 week ago
Chrome Web lehúzó bemutatója a Semalt Expert szakértőjétől
Reply