Ответ
Причин возникновения таких проблем может быть достаточно много. Например:
- ошибки настройки CloudFlare или подобных CDN;
- блокировка поисковых ботов на сервере;
- блокировка IP адресов, по которым могут заходить поисковые боты;
- блокировка скриптов загрузки страницы, которые например используются в технологии SPA (Single Page Application) сайтов.
Чтобы понять конкретную причину, необходимо проверить как боты поисковых систем видят сайт, каким образом они его сканируют. Для проверки того как видит сайт, например, Google бот, необходимо перейти в GSC и:
1️⃣ Проверить страницу при помощи инструмента Проверка URL;
2️⃣ Запустить проверку страницы непосредственно на сайте при помощи кнопки Проверить страницу на сайте;
3️⃣ Открыть отчет Посмотреть проверенную страницу, в котором можно будет увидеть три вкладки:
— HTML. Код страницы в том виде, в котором его видит Google бот.
— Скриншот страницы.
— Подробнее. В этой вкладке можно увидеть данные о ответе сервера, ресурсах страницы и сообщения из консоли JavaScript.
В результате, вы сможете увидеть и понять, что конкретно не так со страницей и почему бот Google не может обработать код страницы и присваивает ей 404 ошибку.
Важно! Не стоит запрещать к индексации JS и CSS файлы, так как это может привести к тому, что часть страницы бот попросту не увидит и соответственно не проиндексирует.
Также не лишним будет проверить наличие внутренних и внешних ссылок, которые ведут на похожие , но не существующие страницы с ответом сервера 404.
Так, например, пользователь может зайти на страницу site.com/novosti-mira/ и она отдает ответ сервера 200, а в коде внутренняя ссылка может быть такой – site.com/novosti-v-mire/ и она будет отдавать ответ сервера 404, если такой страницы на сайте нет.
Поэтому вам нужно:
- Проверить отчет Не найдено (404) в Google Search Console. Там будет список всех URL адресов, помеченных этим ответом сервера. Обязательно посмотрите, какие страницы ссылаются на несуществующую страницу и в их коде проверяйте ошибки в URL адресах.
- Спарсить сайт при помощи Screaming Frog или Netpeak Spider. В обеих этих программах есть возможность увидеть страницы с ответом сервера 404 и какие страницы ссылаются на несуществующие.
- Проверить ссылочную массу в Ahrefs, Majestic, GSC и др. Когда вы проверите сайт на внешние ссылки и увидите, что есть какое-то количество ссылок, ведущих на страницы с ответом 404, то необходимо связаться с владельцами этих сайтов и попросить исправить ссылки на правильные.
Хотите получить ответ на свой вопрос? Задайте его нам через телеграм-бота!↓
Еще по теме:
- Как правильнее восстановить удаленный раздел на сайте с новыми URL? Подскажите, как правильнее: удалили раздел. Код 404. Восстанавливаем раздел, даем роботу погулять на нем, потом 301 редирект ставим на переименованный? Или сразу ставим редирект, контент...
- Что делать с внешними ссылками, ведущими на страницы 404? Что делать с внешними ссылками, ведущими на страницы 404? Допустим, у нас был ранее товар, на который активно ссылались, товар более не продается, но ссылки...
- Почему робот Яндекса может повторно обходить 404 страницы? Объясните, пожалуйста, почему в статистике обхода Вебмастера регулярно обходятся страницы 404, при этом ссылок на них на сайте нет. И второй вопрос: правильно я понимаю,...
- Как найти ссылки на страницы с 404 ошибками, которые видит Google? Анализируем логи nginx по ответам, которые получают поисковые боты Google и Яндекса. Боты Google видят страницы с 404 ответом. Проверили сайт всеми возможными парсерами. Парсеры...
- Что делать с большим количеством 404 страниц? На постоянно меняющейся структуре большого магазина, при обмене данных, возникает большое кол-во 404 (битых ссылок). Нужно ли обращать внимание на такие страницы — делать 301...
Есть вопросы?
Задайте их прямо сейчас, и мы ответим в течение 8 рабочих часов.
Отзывы клиентов:
"Сайт выведен из-под фильтра"
Коробов С.А.
Pechimax.ru"Ощутимый рост позиций после второго апа"
Абрамов Дмитрий Сергеевич
Dvermezhkom-service.ru"Отчеты и консультации всегда исчерпывающие и действенные"

