- (Обновлено: ) Екатерина Еременко
В этот раз поговорим, как найти, проиндексированные в Google, все поддомены сайта с помощью простого и бесплатного плагина для Chrome
Для кого: SEO-специалистам
Предлагаем нашим читателям ознакомиться с советом SEO-специалиста Макса Прина, который упростит работу при поиске всех поддоменов сайта.
Макс Прин — технический SEO-менеджер в маркетинговом агентстве Merkle. Со своей командой специалистов он занимается поиском лучших решений по оптимизации путем проведения исследований и тестов.
Проводите SЕО-аудит? Специалист Макс Прин расскажет, как найти проиндексированные поддомены сайта, используя простой (и бесплатный) плагин для Chrome.
SEO-аудит редко ограничен www (или не-www) версией сайта. В поисках потенциального дублирования контента важно знать о количестве поддоменов и, что более важно, о том, какое их количество проиндексировал Google.
Старые добрые поисковые операторы
Использование поисковых операторов — лёгкий способ найти проиндексированные домены. Как это сделать:
1. Начните с «site:» и корневого домена
2. Один за другим убирайте поддомены (включающие «www») из результатов поиска, используйте при этом оператор «-inurl:».
3. Когда страница выдачи Google опустеет, ваш запрос с поисковыми операторами будет включать в себя все проиндексированные поддомены.
Как бы там ни было, у этой техники есть свои ограничения. Маловероятно, что сайт, по которому вы проводите аудит, имеет такое же количество поддоменов, как wordpress.com. Впрочем, вы можете столкнуться с сайтом, у которого будут несколько десятков поддоменов. Могут возникнуть такие неудобства:
- процесс может занять много времени, особенно если вам нужно проверить несколько доменов;
- вам придётся многократно вводить капчу;
- размер запроса ограничен (около 30 ключевых слов). То есть, если ваш запрос слишком длинный (слишком много операторов –inurl), вы получите 400 ошибку;
- затем вам понадобится время на составление удобного списка поддоменов.
Решение: простое расширение от Google для браузера Chrome
Это расширение, Personal Blocklist, сделает вашу жизнь легче. Оно позволяет «заблокировать» домены от появления в выдаче.
Вся соль в том, что расширение работает на уровне поддоменов и сохраняет адреса в виде списка.
1. После установки расширения начните работу, используя ту же команду — «site:domain.com».
2. Под каждым результатом появится ссылка на блокировку «Block subdomain.domain.com».
3. Нажимайте на каждую ссылку, пока страница выдачи не опустеет.
4. Вы почти закончили! Просто нажмите на иконку плагина, потом на «export»,
а потом — на «Копировать/вставить» в Excel.
Как видите, всё просто!
Первоисточник:
How to quickly find and export all subdomains indexed by Google by Max Prin
Еще по теме:
- Парсим сайт при помощи XPath Что такое XPath Терминология XPath и отношение узлов Синтаксис Предикаты Как парсить данные с помощью Google Spreadsheets Синтаксис XPath-запроса для Google Spreadsheets Распространённые выражения Разметка...
- Как пользоваться операторами Яндекс Wordstat В предыдущей статье «Как узнать частоту ключевого запроса в Яндекс и Google» я разобрал способы, с помощью которых можно узнать частоту запроса, а также рассмотрел...
- Как посмотреть сохранённую копию страницы? Как посмотреть сохранённую копию страницы и должна ли она быть заполненной? Если сохранённая копия страницы пустая — говорит ли это о том, что робот не...
- Правильно ли отображается передача DR по Ahrefs при подклейке дропа к сайту и стоит ли на это ориентироваться? Не пойму, клею к 1 сайту дроп с сылочным DR по ahrefs 15, получаю у своего сайта DR 12. Ну норм, причем вес уже через...
- Как узнать позицию изображения по определенному ключевому слову? Как узнать позицию изображения в картинках по определенному ключевому слову? Или же просто позицию. Может есть какие-то сервисы? Ответ Для определения позиции изображения в выдаче...
Есть вопросы?
Задайте их прямо сейчас, и мы ответим в течение 8 рабочих часов.
Есть ещё один минус у вашего метода: ставя в -inurl, например, «www», вы автоматически блокируете, например, поддомены www-data.site.ru, msk.www.site.ru и т.д.
Лучше минусовать полные домены: site:mail.ru -inurl:https://mail.ru -inurl:https://mail.ru -inurl:https://www.mail.ru -inurl:https://www.mail.ru
Владислав, спасибо за Ваш совет. Автором статьи, Максом Прином, был предложен этот способ как вариант. Безусловно, его стоит применять избирательно.