Как быстро спарсить количество результатов выдачи с помощью Netpeak Spider
КейсыОдин из способов определить популярность и конкурентность запроса или темы — посмотреть результаты выдачи, а точнее их количество. Чем выше цифра, тем, соответственно, популярнее запрос.
Если перед вами стоит задача собрать результаты по десяткам или сотням запросов, ручной метод отнимет много времени, да и монотонные действия быстро наскучат. Чтобы лишний раз себя этим не утруждать, автоматизируйте процесс с помощью Google Таблиц и Netpeak Spider. Сейчас я покажу и расскажу, как это сделать!
Как спарсить выдачу Google по запросу с помощью Netpeak Spider
Для начала подготовьте таблицу, где:
- в первом столбце будут собраны запросы (слова в запросе объедините знаком «+», например, «как+сажать+клубнику»);
- во втором столбце — URL запроса с оператором allintitle:(https://www.google.com/search?q=allintitle:) ;
- в третьем — формула JOIN, которая объединяет данные в первом и втором столбцах.
Скопируйте ссылки из третьего столбца (Ctrl+C) и вставьте их в новый проект Netpeak Spider (Ctrl+V).
Чтобы настроить парсинг количества результатов:
- Откройте код страницы выдачи Google через инструменты разработчика.
- Найдите элемент, где содержится количество результатов, в нашем случае это тег div, который отличается значением «result-stats» атрибута id .
Откройте настройки парсинга в Netpeak Spider:
- Впишите условие #result-stats и выберите режим «CSS-селектор» → «Внутренний текст».
- Добавьте ещё одно условие «X-Path»→ «Внутренний текст» и слэш / в пустую ячейку. Это пригодится для проверки всего контента, если вдруг не получится спарсить числов результатов.
- Дайте названия каждому условию, чтобы быстро ориентироваться в результатах парсинга.
- Перейдите на вкладку настроек «Основные» и включите функцию «Рендеринг JavaScript».
- Откройте вкладку «User Agent» и выберите в качестве юзер агента браузер Chrome.
Обратите внимание, это важная настройка. При выборе другого User Agent парсинг количества результатов осуществить не удастся. Поэтому убедитесь, что в настройках выбран именно браузер Chrome.
- Когда все нужные настройки выставлены, нажмите на кнопку «OK».
- В параметрах на боковой панели отметьте параметры «Код ответа сервера», «Парсинг» и «Конечный URL редиректа». Последний параметр поможет понять, когда появятся редиректы, значит нужно будет подключить прокси (не забывайте определить перед покупкой прокси, а важна ли вам их региональность) или остановить на время парсинг, чтобы Google вас совсем не забанил).
- Нажмите на кнопку «Старт», чтобы запустить сканирование.
У Netpeak Spider есть бесплатная версия без ограничений по времени, в которой у вас будет возможность парсить сайты, используя до 100 условий парсинга! Во Freemium-версии также доступны и многие другие базовые функции программы.
Чтобы начать пользоваться бесплатным Netpeak Spider, просто зарегистрируйтесь, скачайте и установите программу — и вперёд! 😉
Зарегистрироваться и установить бесплатную версию
P.S. Сразу после регистрации у вас также будет возможность потестировать весь платный функционал, а затем сравнить все наши тарифы и выбрать для себя подходящий.
После окончания сканирования откройте результаты парсинга. Для этого:
- Перейдите в «Отчёты» → «Парсинг». Кликните на условие парсинга, затем на «Есть» и «Показать выбранные».
- В дополнительно открывшемся окне выделите столбцы «URL», «Длина» и «Значение» и скопируйте их (Ctrl+C).
- Вставьте скопированные данные в таблицу (Ctrl+V). Это будет выглядеть примерно так:
- Очистите лишние ячейки и пустые строки и оставьте только URL и количество результатов.
- Дальше примените формулу VLOOKUP (ВПР), чтобы совместить результаты парсинга и нужные запросы:
Больше о формулах для Google Таблиц вы можете узнать из нашего поста «9 функций Google Таблиц, которые пригодятся SEO-специалисту».
- Чтобы вытянуть из третьего столбца только числа, примените в соседнем столбцу формулу (
=REGEXEXTRACT(C17;"\d.*")
:
Вот и всё, теперь у нас есть красивая таблица с количеством результатов выдачи по каждому запросу! Если вы видите, что результатов по запросу немного, а он вам очень интересен, например, у него большая частота или точное попадание в вашу тематику, скорее беритесь за работу над попаданием в топ по нему, пока места ещё не разобрали!
Подводим итоги
Если перед вами стоит задача быстро спарсить количество результатов выдачи для анализа популярности какой-то тематики, то способ, который я описал в этом посте, вам поможет. Применяйте его на практике, и делитесь своими впечатлениями.Если возникли вопросы или предложения, задавайте их в комментариях 😊