Как повысить релевантность контента с помощью Netpeak Spider и Checker
Кейсы
Обновление поисковых алгоритмов Google активно обсуждается в среде вебмастеров. Во многих случаях после таких обновлений у некоторых сайтов падают позиции и трафик, и не понятно, почему это происходит. Например, когда это произошло в августе 2018 года при так называемом «Медицинском апдейте».
Обновления алгоритмов Google можно разделить на две категории:
- специализированные (например, выкатка Mobile-first index);
- улучшение релевантности.
Специалисты Google в основном комментируют специализированные обновления, а в случаях с улучшением релевантности просто говорят: работайте над качеством сайта.
Прочитав справку Google, можно примерно понять, как алгоритм определяет релевантность контента:
- Алгоритм анализирует значение слов в запросе.
- На основании языковой модели определяются сочетания слов для поиска в индексе.
- Алгоритмы ищут в индексе подходящие страницы, а также определяют, как часто ключевые слова встречаются на странице и в каких её разделах.
- Поисковик сопоставляет ключевые слова.
- Определяется полнота информации в результатах поиска, а именно представлен ли на страницах нужный контент, например изображения, видео, семантические аналоги.
В рамках этого поста я покажу на примерах, как можно найти релевантные видео и изображения, а также проверить релевантность текстового контента с помощью инструментов Netpeak Software.
1. Как повысить релевантность текстового контента
Задача: дополнить текст семантическими аналогами для улучшения полноты информации, релевантной поисковому запросу. Проще говоря, найти упущенную семантику.
Допустим, вы ведёте блог об исторических личностях, и вам нужна информация по таким запросам:
- Петр Первый;
- Государь;
- Первая императрица.
Далее нужно собрать со страниц, которые ранжируются в поиске по этим запросам, такие данные, как заголовок H1, Title, Description, а также выделенный текст и дополнительные ссылки. Таким образом вы получите от конкурентов данные, которые смогут улучшить ваш готовый контент, а также информацию для создания новых постов.
Для решения этой задачи понадобятся Netpeak Spider и Checker. Дальше я пошагово покажу, как получить нужные данные с помощью этих инструментов.
1.1. Как найти упущенную семантику с Netpeak Checker
- Запускаем Netpeak Checker. Открываем инструмент «Парсер ПС» и вводим эти запросы, каждый с новой строки.
- Переходим в меню «Настройки» → раздел «Парсинг».

- Выставляйте нужные настройки и нажимайте кнопку «Старт». Вы получите вот такой результат:

- Экспортируйте результаты. Вам понадобится информация из столбцов:
- «Заголовок» → заголовок страницы в сниппете поисковой выдачи.
- «Описание» → описание страницы в сниппете поисковой выдачи, которое отображается под заголовком Title.
- «Выделенный текст» → показывает текст, который был выделен жирным в сниппете поисковой выдачи: таким образом поисковые системы выделяют точное совпадение запроса или похожие термины (синонимы). Если значений несколько, то они перечисляются через запятую.
- «Дополнительные ссылки» → дополнительные ссылки в сниппете поисковой выдачи у соответствующего результата. Если ссылок несколько, то они перечисляются через запятую.
1.2. Как найти упущенную семантику с Netpeak Spider
- Заходим в меню «Настройки», переходим в раздел «Парсинг».
- Для сбора информации по блоку поисковых подсказок «Вместе с… часто ищут» используйте CSS-селектор .nVcaUb, а для парсинга дополнительных ссылок — CSS-селектор .fl.
- В настройке User Agent рекомендую выбрать Chrome.
- Формат ссылок по запросу для парсинга должен иметь вид:
https://www.google.com/search?q=[запрос]
- Переходите в меню «Список URL» и добавьте нужные вам ссылки.
- В нашем примере:
https://www.google.com/search?q=петр%20первый https://www.google.com/search?q=государь https://www.google.com/search?q=первая%20императрица
- Нажимайте кнопку «Старт».

- В разделе «Отчёты» нужно выбрать вкладку «Парсинг». Как видно, Netpeak Spider успешно собрал информацию о поисковых подсказках и дополнительных ссылках из сниппета.
- При парсинге дополнительных ссылок в результатах может быть всякий мусор — числа, справочный и вспомогательный текст. Для удаления этого «информационного шума» используйте фильтр. В моём случае он такой:

Экспортируйте результаты парсинга в Excel. Если нужно, почистите их и отсортируйте.
У Netpeak Spider есть бесплатная версия без ограничений по времени, в которой вы сможете находить упущенную семантику с помощью парсинга и извлекать различные данные с сайтов, используя до 100 условий парсинга! Во Freemium-версии также доступны и многие другие базовые функции программы.
Чтобы начать пользоваться бесплатным Netpeak Spider, просто зарегистрируйтесь, скачайте и установите программу — и вперёд! 😉
Зарегистрироваться и установить бесплатную версию
P.S. Сразу после регистрации у вас также будет возможность потестировать весь платный функционал, а затем сравнить все наши тарифы и выбрать для себя подходящий.2. Поиск релевантного видео
Итак, мы помним о том, что алгоритм Google, оценивая полноту информации, ищет на странице сайта релевантное видео.
При помощи Netpeak Checker я спарсил ссылки по запросам. Теперь давайте выясним, на каких из этих URL есть видео, и что это за видео.

- В моём случае Netpeak Spider за 1:06 минут просканировал 49 URL и показал, что только на одном из них есть встроенное из YouTube видео. Но это тоже хороший результат — это видео можно добавить на страницу своего сайта.
3. Поиск релевантных изображений
Google считает изображения и атрибут ALT очень важной для поисковика информацией. Об этом написано в документации для разработчиков:
Посмотрим, какие ALT используются на страницах в топе выдачи по нужному запросу:
- В настройки парсинга Netpeak Spider добавим условие:
XPath: //img
- Извлечение данных: значение атрибута ALT.

- В итоге вы получите примерно такие результаты:

Отфильтруйте нерелевантную и бесполезную информацию, а затем экспортируйте и проанализируйте полученные результаты.
Примечание: изображение желательно иметь своё, так как найденные чужие изображения могут быть защищены авторским правом. Но важно не столько само изображение, сколько содержание тега ALT, которое можно позаимствовать ;)
Подводим итоги
- Очень важно следить за алгоритмами поисковых систем и следовать их рекомендациям.
- Необходимо регулярно улучшать свой контент и проверять релевантность как новых, так и старых публикаций в соответствии с рекомендациями поисковиков.
- Используя возможности парсинга в Netpeak Spider и Netpeak Checker, вы получите дополнительные поисковые запросы для улучшения информационной ценности вашего контента.
Расскажите в комментариях, как вы улучшаете контент с помощью инструментов Netpeak Software ;)