Back to Question Center
0

Króm Vefur Scraper Tutorial frá Semalt Expert

1 answers:

Ef þú notar Google Chrome er eftirnafn fyrir vafrann þinn sem getur hjálpað til við að skafa vefsíðum. Það er þekkt sem '' Scrapper, '' og það er hægt að nýta án vandræða. Scrapper mun hjálpa við að skafa efni á vefsíðu og hlaða niður niðurstöðum í Google skjöl.

Hvernig á að eyða vefsíðu með því að nota Scraper eftirnafn?

1. Veldu Chrome vefverslun í Google Chrome;

2. Í framlengingu skaltu framkvæma leit að '' Scrapper '';

3. Fyrsta leitarniðurstöðurnar eru viðbætur sem kallast '' Scrapper '';

4. Smelltu á eftirfarandi

8. Hægrismelltu til að velja "Skafta" Svipað ... "valkostur;

9. Spjaldið fyrir scrapper mun skjóta upp í annarri glugga;

10. Skoðaðu ruslfalt efni í skrúfunni

11. Til að tryggja að efnið sé vistað sem Google töflureikni skaltu velja "Vista í Google Skjalavinnslu ..."

Lengri rusl

Áður en þú fylgist með þessari uppskrift , er gagnlegt að skilja grunnatriði HTML. Til dæmis er hægt að lesa stutt kynning á HTML með þessu hlekkur

Við skulum ímynda sér að við höfum áhuga á öllum kvikmyndum sem voru með stjörnur í Asíu Argento, frægur ítalskur leikkona.

1. Það er mjög náið skjalasafn leikara í IMDB. Asía Argentó síða er: https://www.imdb.com/name/nm0000782/;

2. Hér getur þú skoðað alla hlutverk leikarans..Við skulum byrja að eyða upplýsingum sem við höfum áhuga á;

3. Reyndu að skafa það eins og það var lýst hér að framan;

4. Þú munt sjá að listinn er svolítið raskaður. Þetta er vegna þess að listinn hér er hægt að skipuleggja á annan hátt;

5. Höfðu til skraffræðinnar. Efst til vinstri, þú munt sjá litla kassann sem segir XPath;

6. Xpath er eins konar fyrirspurnarmál sem vinnur fyrir XML og HTML;

7. XPath getur hjálpað til við að finna hlutina á síðunni sem þú hefur áhuga á. Næsta er að finna viðeigandi þætti og skrifa XPath fyrir það;

8. Nú skulum við skipuleggja borðið okkar;

9. Þú munt sjá að núverandi XPath okkar, sem hefur allar nauðsynlegar upplýsingar, er "/ div [3] / div [3] / div [2] / div";

10. XPath upplýsir kerfið til að skoða HTML doc og velja þriðja þáttinn, þá seinni þátturinn og þá öll þau;

11. En við viljum að gögnin okkar séu aðskilin.

12. Notaðu dálkahlutann í stjórnborðinu fyrir scrapper til að fá þetta gert;

13. Við skulum fyrst finna titilinn okkar ви“ Notaðu skoðunarþáttur til að skoða titilinn;

14. Athugaðu titilinn innan merkis. Bættu merkinu við XPath;

15. Tjáningin virðist virka á viðeigandi hátt, þannig að það sé fyrsta dálkurinn okkar;

16. Í kaflanum "dálka", skiptu heiti fyrsta dálksins á "titil";

17. Bætið XPath við það;

18. Í dálkasviðinu eru XPaths hlutfallsleg og það þýðir að "./b" mun velja 91 atriði

19. Í XPath fyrir titil dálkinn, bæta við "./b" og veldu "skafa";

20. Nú skulum við halda áfram í eitt ár. Ár er að finna innan eins span;

21. Búðu til nýja dálk með því að velja lítið plús við hliðina á dálknum fyrir titilinn þinn;

22. Notaðu XPath "./span" til að búa til dálk fyrir "ár";

23. Smelltu á skrapa og skoðaðu hvernig árinu var bætt við;

24. Gjört!

6 days ago
Króm Vefur Scraper Tutorial frá Semalt Expert
Reply