Ответ
Единственный способ наиболее достоверно узнать сколько страниц сайта в индексе, это Google Search Console. В панели управления вебмастера Google выбираем вкладку «Индексирование», затем — «Страницы». В этом отчете отображается количество и список проиндексированных страниц. Кроме того, тут же показываются и страницы, которые не в индексе по разным причинам:
- Страницы с 404 или 3** кодом сервера: если страница битая или удалена, то поисковый робот со временем выкинет ее из индекса. Тоже самое касается страниц с переадресаций (301 редирект).
- Ошибка сервера (5** код ответа): Если при загрузке страницы возникает ошибка на стороне сервера, то робот просто не сможет просканировать и обработать страницу, так как она не загружается.
- Страницы заблокированы от индексации в robots.txt или noindex.
- Малоценные страницы: сюда относятся смысловые и технические дубли, страницы с get-параметрами, страницы с каноникалом.
- Страницы-сироты: если на страницу не ведут внутренние ссылки и она не добавлена в сайтмап, то бот ее не сможет найти и добавить.
Так как ваш сайт достаточно большой, выгрузить весь список страниц не в индексе с Консоли не получится.
Для этого рекомендуем воспользоваться вспомогательными средствами:
- Проверить индексацию с помощью программ. Такие сервисы, как Screaming Frog Seo или Xenu Links Sleuth автоматически сканируют сайт и показывают страницы, которые не попали в индекс по тем или иным причинам. Чтобы не выгружать весь сайт сразу (что может занять несколько дней), можно разбить сканирование на несколько частей: сначала статьи 2010 года, потом страницы с припиской .html и т.д..
- Специальные онлайн сервисы. Существует большое количество бесплатных онлайн-сервисов для контроля индексации сайта. Кроме того, можно проверить индексацию через Ahrefs и Serpstat.
Хотите получить ответ на свой вопрос? Задайте его нам через телеграм-бота!↓
Еще по теме:
- Как лучше организовать перелинковку информационного ресурса? Есть информационный сайт со 100 статьями, размещенных в 10 категориях. Никаких сквозняков и меню. Ведется закупка ссылочной массы, в основном безанкорная на главную страницу. Какой...
- Нужно ли покупать ссылки для продвижения информационного сайта? Стоит ли покупать ссылки для усиления видимости статей в поиске? Усиление посадочных — понятно, а вот статьи? Или инфо нише ссылочное - это второстепенный фактор...
- Нужно ли делить собранную семантику на несколько статей? Для молодого сайта (свежерег, кулинарный блог) стоит в статьях собирать максимальный пул семантики или собранную семантику делить на несколько статей и делать более узконаправленные статьи?...
- Как продвигать информационный сайт новорег в условиях развития нейросетей? Какие особенности продвижения контентного сайта есть сейчас? Сложно ли продвигать информационные сайты новореги на сегодняшний день во времена развития нейросетей? Ответ Нейросети наоборот должны облегчать...
- Почему не ранжируются статьи на поддоменах информационного сайта в Google? Есть основной информационный сайт, существует давно, чувствует себя хорошо. Решили чуть его расширить, но чтоб не размывать тематику, сделали поддомены для других тем. Больше чем...
Есть вопросы?
Задайте их прямо сейчас, и мы ответим в течение 8 рабочих часов.
Отзывы клиентов:
"Наблюдаем стремительный и уверенный рост трафика"
Пилицын Василий Сергеевич
Seatscan.ru"Сайт был выведен из-под фильтра за 3,5 месяца"
Игорь Логинов
Stomed.ru"Развернутый и структурированный отчет с указанием ошибок"
Владислав Аверьянов
Homesoverseas.ru