Ръководство за Semalt за удължаване на скрепер за Chrome

За да оцелее и в крайна сметка всеки бизнес да оцелее, е необходимо да остане пред конкурентите си и различни рискове. Вземането на решения въз основа на аналитични данни е сигурен начин да забравите за тези проблеми. Такива данни могат да бъдат получени чрез бракуване на данни. Ето откъде идва лесното разширение за скрепер за Chrome: то не само ще улесни процеса на събиране на данни, но и ще направи възможно изстъргването в движение без сложни настройки.

Как да използвате Scraper

    1. Първото нещо, което трябва да направите, е да инсталирате разширението, така че се насочете към уеб магазина на Chrome, потърсете "скрепер" и кликнете върху добавяне към Chrome.

    2. Отворете уебсайта, от който възнамерявате да изстържете данни , маркирайте записа, който ви интересува, като го подчертаете. Кликнете с десния бутон върху него и изберете „изстържете подобно“ в менюто, което се появява.

    3. По този начин ще стартирате отделен прозорец на конзолата за скрепер. Тук ще видите списък на изтритите данни .

    4. За да запазите съдържанието, кликнете върху „запазване в Google документи“, това автоматично ще експортира данните в електронна таблица на Google.

Удължено изстъргване

В случай, че планирате да изтриете повече данни, можете да използвате разширения подход. Имайте предвид, че ще бъде много по-лесно да работите с инструмента, ако имате известни познания по HTML. Да предположим, че сте искали да изтриете данни от източник, който има архив въз основа на данни от времеви серии. В такъв случай, ако опитате описания по-горе метод, ще получите скрити данни.

За да разрешите този проблем, можете да използвате HTML и XML език за заявки, известен като XPath. Какво прави? XPath разпознава данни относно различните елементи, съдържащи се във всяка селекция. Следното е ръководство за това как да се справите:

1. Отидете на конзолата на Scraper, в горната лява част трябва да забележите бутон „XPath“, щракнете върху него и продължете да сглобявате началната таблица.

2. Трябва да напишете XPath за правилния елемент. Настоящият XPath, който включва цялата информация, ще бъде показан във формат като този "// div [3] / div [3] / div [2] / div". Елементите <div> ще бъдат разпознати в HTML документа от компютъра.

3. За да разделите разпознатите данни, трябва да използвате колоните за скрепер. За целта трябва да потърсите различните видове информация, с които разполагате. В зависимост от данните, които записвате, може да имате заглавия. Тези заглавия присъстват до всеки набор от данни. Те са придружени от маркер, в случая - <b> таг.

4. С помощта на инспектирайте елемента намерете и добавете <b> тага към вашия XPath. Сега можете да маркирате тази първа колона като "колона със заглавие", тъй като тя ще изброява заглавията. Продължете да създавате различни XPaths за всяка колона, от която се нуждаете.

5. Кликнете върху скрепа и разширението автоматично ще събере данните и ще ги организира в различните колони, които сте задали.