Как массово собрать email-адреса и телефонные номера c сайтов с помощью Netpeak Checker
КейсыКогда есть острая потребность получить телефонные номера и email-адреса с множества сайтов, тратить время на ручной сбор этих данных вовсе необязательно.
В этом посте я покажу, как ускорить процесс и облегчить себе работу с помощью всего одной программы — Netpeak Checker.
Рассмотрим два случая:
- 1. Когда уже есть список страниц, с которых нужно собрать данные
- 2. Когда сначала необходимо найти сайты определённой тематики, а затем спарсить контакты
Кейс 1. Сбор контактных данных со списка страниц
Когда нужно собрать email и номера телефонов со списка URL, алгоритм следующий:
- Запустите Netpeak Checker.
- Вставьте список страниц в окно программы из буфера обмена или загрузите из файла, либо же введите вручную.
- На боковой панели отметьте чекбоксы «Email-адреса» и «Телефонные номера».
- Запустите сканирование.
- Дождитесь окончания, и вы увидите все найденные данные в таблице.
- Нажмите на «Экспорт», чтобы выгрузить данные на компьютер.
Несколько лайфхаков
- На главных страницах сайтов не всегда есть нужные данные, и чтобы не собирать страницы с контактами вручную, добавьте к каждому хосту фрагменты contacts / kontakty / kontaktu и прочие вариации. В программе нет ограничения по списку страниц, поэтому можете добавлять их сколько угодно.
- Случается так, что сайт переехал на другой протокол или как-либо изменил расположение документа. Чтобы увидеть список актуальных страниц, на которых находятся данные, перед сканированием отметьте параметры «Код ответа сервера» и «Конечный URL редиректа».
- При парсинге множества страниц одного сайта лучше дополнительно использовать прокси, чтобы избежать возможных блокировок. Добавить их можно на вкладке «Прокси» в настройках.
- Если нужно проанализировать огромное количество страниц, например, 10 или 50 тысяч, увеличьте количество потоков для ускорения проверки. Эту настройку вы найдёте на вкладке «Общие».
Кейс 2. Поиск нужных сайтов и сбор контактных данных с них
Если у вас нет списка сайтов, и их нужно собрать, это также можно сделать в Netpeak Checker. Например, вы ищете сайты туристических агентств.
- Перейдите в окно инструмента «Парсер ПС».
- Вставьте список запросов.
- На вкладке «Настройки» выберите поисковые системы, желаемое количество результатов (от 1 до максимума).
- Задайте нужный регион.
- Добавьте несколько прокси-серверов и сервис автоматического разгадывания капчи.
- По окончании парсинга перенесите уникальные домены в основную таблицу → просто нажмите на кнопку «Перенести хосты».
- Далее действуйте согласно алгоритму из предыдущего кейса: отметьте чекбоксы «Email-адреса» и «Телефонные номера» в параметрах на боковой панели и запустите сканирование.
И снова лайфхаки
- Используйте поисковые операторы в запросе, чтобы получить только нужные результаты, например: {{турагентство -путёвка -Египет}}. Также может пригодиться запрос с оператором inurl:contact, чтобы находить сразу страницу контактов. Если хотите добавить один и тот же оператор к каждому запросу, используйте поле «Префикс» в окне инструмента «Парсер ПС», чтобы не проставлять его вручную.
- Если перед вами стоит задача собрать как можно больше сайтов без привязки к определённому региону, попробуйте собрать выдачу, используя различные регионы в настройках поисковых систем. Так вы сможете найти значительно больше подходящих площадок.
Подводим итоги
Массовый сбор контактов может понадобиться в различных кейсах: аутриче, поиску потенциальных клиентов, партнёров и т.д. Для автоматического и быстрого поиска данных воспользуйтесь Netpeak Checker. Алгоритм очень прост:
- Добавить список адресов сайтов, с которых необходимо собрать данные.
- Отметить в параметрах чекбоксы «Email-адреса» и «Телефонные номера».
- Начать сканирование.
По итогу вы получите все данные в одной таблице, которую сможете экспортировать на свой компьютер.
А вы используете Netpeak Checker, когда нужно собрать контактные данные с сайтов? Делитесь в комментариях 😊