ВходящиеВходящие
ВажныеВажные
ВидеоВидео
Категории
ОбновленияОбновления
МануалыМануалы
КейсыКейсы
ПодборкиПодборки
От экспертовОт экспертов
НовостиНовости
ТестыТесты
Входящие
Важные
Видео
Евгений Кобзарь

Евгений Кобзарь

  • Комментарии (5)
  • Посты
Сортировка:
Этот пользователь не опубликовал ещё ни одного поста. Мы помогаем изо всех сил — теперь дело за автором!
Нужно добавить функцию сравнения предыдущего анализа с текущим, чтобы можно было выявить изменения быстро.
Нельзя лайкать самого себя
3Нравится
Ответить
Поделиться
Скопировано
26 февраля 2020
Привет.
Пункт 1.4 можно сделать с помощью екселя.
выделить столбец с урлом, выбрать "текст по столбцам", указать раделитель "/', оставить столбец с доменом. С помощью поиска и змены, найти "www." заменить на ни что. Выделить столбец с хостом, удалить дубли.
Минус такого метода - остаются поддомены, но в целом быстро решается.
Нельзя лайкать самого себя
Нравится
Ответить
Поделиться
Скопировано
26 февраля 2020
Kosta Bankovski
26 февраля 2020
Да, звучит нормально, но не весь получается 1.4, а только извлечение хостов из полных URL.

Я показывал на примере Google таблиц, там есть ограничение в 5 миллионов ячеек, мог в него упереться, потому делал немного иначе, но и ваш вариант рабочий :)
Google sheets не использую для такой работы, валится, если много данных, Ексель себя отлично чувствует при больших объемах.

Недостаток описанного метода, что вы получаете на выходе дроп с непонятной тематикой. Как бы зачем хороший дроп с не нужной тебе тематикой, да, что то можно переиграть, сменить тематику, но все же.

А вообще, чем больше таких мануалов, тем меньше дропов в сети ((
Нельзя лайкать самого себя
Нравится
Ответить
Поделиться
Скопировано
26 февраля 2020
Kosta Bankovski
26 февраля 2020
Да, звучит нормально, но не весь получается 1.4, а только извлечение хостов из полных URL.

Я показывал на примере Google таблиц, там есть ограничение в 5 миллионов ячеек, мог в него упереться, потому делал немного иначе, но и ваш вариант рабочий :)
на счет =REGEXMATCH(A2, “.edu|.gov|.mil|.ua|.jp|.cn|.xxx”)
отсекаются именно домены ua? com.ua и остальные в ua зоне остаются?
gov , edu - отсекаются и gov.ua и gov просто?
Нельзя лайкать самого себя
Нравится
Ответить
Поделиться
Скопировано
Kosta Bankovski
2 марта 2020
Отсекаются все, где есть «.ua». Следовательно все «gov.ua», «com.ua», «edu.ua», тоже уходят. Если хотите оставить какой-то определённый, например «com.ua», можно сделать ещё один столбец, в котором только по нему проверять. Тогда нужно будет удалить все, где первая регулярка (edu|.gov|.mil|.ua|.jp|.cn|.xxx) показала TRUE, а вторая(.com.ua) FALSE.

Ну и аналогично для всех подобных случаев, если надо что-то оставить, нужно проверить конкретное условие. Хоть и можно городить сложнее регулярку, но зачем?)
Зачем отсекать весь .ua? нужно ведь только конкретную ua отсекать, так как для регистрации домена в зоне ua нужна торговая марка, для остальных доменных регистрация свободная.
Нельзя лайкать самого себя
Нравится
Ответить
Поделиться
Скопировано