Ответ
Единственный способ наиболее достоверно узнать сколько страниц сайта в индексе, это Google Search Console. В панели управления вебмастера Google выбираем вкладку «Индексирование», затем — «Страницы». В этом отчете отображается количество и список проиндексированных страниц. Кроме того, тут же показываются и страницы, которые не в индексе по разным причинам:
- Страницы с 404 или 3** кодом сервера: если страница битая или удалена, то поисковый робот со временем выкинет ее из индекса. Тоже самое касается страниц с переадресаций (301 редирект).
- Ошибка сервера (5** код ответа): Если при загрузке страницы возникает ошибка на стороне сервера, то робот просто не сможет просканировать и обработать страницу, так как она не загружается.
- Страницы заблокированы от индексации в robots.txt или noindex.
- Малоценные страницы: сюда относятся смысловые и технические дубли, страницы с get-параметрами, страницы с каноникалом.
- Страницы-сироты: если на страницу не ведут внутренние ссылки и она не добавлена в сайтмап, то бот ее не сможет найти и добавить.
Так как ваш сайт достаточно большой, выгрузить весь список страниц не в индексе с Консоли не получится.
Для этого рекомендуем воспользоваться вспомогательными средствами:
- Проверить индексацию с помощью программ. Такие сервисы, как Screaming Frog Seo или Xenu Links Sleuth автоматически сканируют сайт и показывают страницы, которые не попали в индекс по тем или иным причинам. Чтобы не выгружать весь сайт сразу (что может занять несколько дней), можно разбить сканирование на несколько частей: сначала статьи 2010 года, потом страницы с припиской .html и т.д..
- Специальные онлайн сервисы. Существует большое количество бесплатных онлайн-сервисов для контроля индексации сайта. Кроме того, можно проверить индексацию через Ahrefs и Serpstat.
Хотите получить ответ на свой вопрос? Задайте его нам через телеграм-бота!↓
Еще по теме:
- Нужна ли структура в URL для информационного сайта? Озадачился вопросом – а нужна ли вообще структура в URL для информационного сайта? То есть, не лучше ли просто делать URL вида: site.com/page (без лишних...
- Нужно ли делить собранную семантику на несколько статей? Для молодого сайта (свежерег, кулинарный блог) стоит в статьях собирать максимальный пул семантики или собранную семантику делить на несколько статей и делать более узконаправленные статьи?...
- Как правильно восстанавливать заброшенный информационный сайт? Нашел заброшенный небольшой информационный сайт, страниц на 500. Ссылочное у ресурса не плохое, техническое состояние тоже хорошее, но контент крайне низкого качества (то-ли разворовали, то-ли...
- Как поступать со страницами сайта, которые быстро теряют свою актуальность? Есть сайт с прогнозами погоды, и под каждую неделю у нас отдельная страница. Но, как только неделя меняется, информация перестает быть актуальной, соответственно, и трафик...
- Можно ли расширять тематику информационного сайта? Информационный сайт, занимаемся им давно. Тематика: обзоры и рейтинги гаджетов одного вида. Добились хороших результатов, по интересующим запросам процентов 80 из всех статей занимают ТОПовые...
Есть вопросы?
Задайте их прямо сейчас, и мы ответим в течение 8 рабочих часов.
Отзывы клиентов:
"Получили ответы на все вопросы"
Павел
Kidride.ru"Наблюдаем стремительный и уверенный рост трафика"
Пилицын Василий Сергеевич
Seatscan.ru"Сайт вышел из-под фильтра, переспам был ликвидирован"
Вячеслав Мусякаев
Vprognoze.ru