Как повысить релевантность контента с помощью Netpeak Spider и Checker

Use Cases
11Like
5Comments
Share
Как повысить релевантность контента с помощью Netpeak Spider и Checker

Обновление поисковых алгоритмов Google активно обсуждается в среде вебмастеров. Во многих случаях после таких обновлений у некоторых сайтов падают позиции и трафик, и не понятно, почему это происходит. Например, когда это произошло в августе 2018 года при так называемом «Медицинском апдейте».

Обновления алгоритмов Google можно разделить на две категории:

  • специализированные (например, выкатка Mobile-first index);
  • улучшение релевантности.

Специалисты Google в основном комментируют специализированные обновления, а в случаях с улучшением релевантности просто говорят: работайте над качеством сайта.

Прочитав справку Google, можно примерно понять, как алгоритм определяет релевантность контента:

  • Алгоритм анализирует значение слов в запросе.
  • На основании языковой модели определяются сочетания слов для поиска в индексе.
  • Алгоритмы ищут в индексе подходящие страницы, а также определяют, как часто ключевые слова встречаются на странице и в каких её разделах.
  • Поисковик сопоставляет ключевые слова.
  • Определяется полнота информации в результатах поиска, а именно представлен ли на страницах нужный контент, например изображения, видео, семантические аналоги.

В рамках этого поста я покажу на примерах, как можно найти релевантные видео и изображения, а также проверить релевантность текстового контента с помощью инструментов Netpeak Software.

1. Как повысить релевантность текстового контента

Задача: дополнить текст семантическими аналогами для улучшения полноты информации, релевантной поисковому запросу. Проще говоря, найти упущенную семантику.

Допустим, вы ведёте блог об исторических личностях, и вам нужна информация по таким запросам:

  • Петр Первый;
  • Государь;
  • Первая императрица.

Далее нужно собрать со страниц, которые ранжируются в поиске по этим запросам, такие данные, как заголовок H1, Title, Description, а также выделенный текст и дополнительные ссылки. Таким образом вы получите от конкурентов данные, которые смогут улучшить ваш готовый контент, а также информацию для создания новых постов.

Для решения этой задачи понадобятся Netpeak Spider и Checker. Дальше я пошагово покажу, как получить нужные данные с помощью этих инструментов.

1.1. Как найти упущенную семантику с Netpeak Checker

  • Запускаем Netpeak Checker. Открываем инструмент «Парсер ПС» и вводим эти запросы, каждый с новой строки.
  • Переходим в меню «Настройки» → раздел «Парсинг».
  • Netpeak Checker: настройки Парсера ПС
  • Выставляйте нужные настройки и нажимайте кнопку «Старт». Вы получите вот такой результат:
  • Netpeak Checker: экспорт результата парсинга ПС
  • Экспортируйте результаты. Вам понадобится информация из столбцов:
    • «Заголовок» → заголовок страницы в сниппете поисковой выдачи.
    • «Описание» → описание страницы в сниппете поисковой выдачи, которое отображается под заголовком Title.
    • «Выделенный текст» → показывает текст, который был выделен жирным в сниппете поисковой выдачи: таким образом поисковые системы выделяют точное совпадение запроса или похожие термины (синонимы). Если значений несколько, то они перечисляются через запятую.
    • «Дополнительные ссылки» → дополнительные ссылки в сниппете поисковой выдачи у соответствующего результата. Если ссылок несколько, то они перечисляются через запятую.

1.2. Как найти упущенную семантику с Netpeak Spider

  • Заходим в меню «Настройки», переходим в раздел «Парсинг».

    Netpeak Spider: настройки парсинга
  • Для сбора информации по блоку поисковых подсказок «Вместе с… часто ищут» используйте CSS-селектор .nVcaUb, а для парсинга дополнительных ссылок — CSS-селектор .fl.

  • В настройке User Agent рекомендую выбрать Chrome.

  • Формат ссылок по запросу для парсинга должен иметь вид:
    https://www.google.com/search?q=[запрос]

  • Переходите в меню «Список URL» и добавьте нужные вам ссылки.

  • В нашем примере:
    https://www.google.com/search?q=петр%20первый https://www.google.com/search?q=государь https://www.google.com/search?q=первая%20императрица

  • Нажимайте кнопку «Старт».
  • Netpeak Spider: результаты парсинга
  • В разделе «Отчёты» нужно выбрать вкладку «Парсинг». Как видно, Netpeak Spider успешно собрал информацию о поисковых подсказках и дополнительных ссылках из сниппета.

  • При парсинге дополнительных ссылок в результатах может быть всякий мусор — числа, справочный и вспомогательный текст. Для удаления этого «информационного шума» используйте фильтр. В моём случае он такой:
  • Netpeak Spider: фильтр Хлебные крошки

Экспортируйте результаты парсинга в Excel. Если нужно, почистите их и отсортируйте.

2. Поиск релевантного видео

Итак, мы помним о том, что алгоритм Google, оценивая полноту информации, ищет на странице сайта релевантное видео.

При помощи Netpeak Checker я спарсил ссылки по запросам. Теперь давайте выясним, на каких из этих URL есть видео, и что это за видео.

  • В настройки парсинга Netpeak Spider добавим условие:
    XPath: //iframe[contains(@src ,'www.youtube.com/embed/')]

  • Извлечение данных: значение атрибута src.
  • Netpeak Spider: парсинг видео
    • В моём случае Netpeak Spider за 1:06 минут просканировал 49 URL и показал, что только на одном из них есть встроенное из YouTube видео. Но это тоже хороший результат — это видео можно добавить на страницу своего сайта.

    3. Поиск релевантных изображений

    Google считает изображения и атрибут ALT очень важной для поисковика информацией. Об этом написано в документации для разработчиков:

    «Мобильная версия сайта должна содержать те же материалы, что и полная. Обновите основной контент мобильной версии, чтобы он совпадал с полной: тексты, изображения с атрибутом ALT, видео и т. д. в форматах, подходящих для сканирования и индексирования».

    Посмотрим, какие ALT используются на страницах в топе выдачи по нужному запросу:

    • В настройки парсинга Netpeak Spider добавим условие:
      XPath: //img
    • Извлечение данных: значение атрибута ALT.
    • Netpeak Spider: парсинг изображений
    • В итоге вы получите примерно такие результаты:
    • Netpeak Spider: парсинг изображений

    Отфильтруйте нерелевантную и бесполезную информацию, а затем экспортируйте и проанализируйте полученные результаты.

    Подводим итоги

    • Очень важно следить за алгоритмами поисковых систем и следовать их рекомендациям.
    • Необходимо регулярно улучшать свой контент и проверять релевантность как новых, так и старых публикаций в соответствии с рекомендациями поисковиков.
    • Используя возможности парсинга в Netpeak Spider и Netpeak Checker, вы получите дополнительные поисковые запросы для улучшения информационной ценности вашего контента.

    Расскажите в комментариях, как вы улучшаете контент с помощью инструментов Netpeak Software ;)