Ответ
Сам факт того, что страницы видны через site: оператор не означает, что страницы доступны к индексации и на них нет тега. Это лишь индикатор того, что страницы физически находятся в индексе поисковой системы и, возможно, робот еще не успел их обойти, чтобы обновить статус.
Чтобы понять, в чем именно причина такой проблемы, нужно проверить:
- Как видит бот эти страницы с помощью Search Console. Если X-Robots-Tag есть, то консоль это покажет. Альтернативно можно использовать онлайн-сервисы проверки HTTP-заголовков.
- Сетевые логи в браузере (Network tab в DevTools) при загрузке проблемных страниц — там тоже будут видны все заголовки ответа сервера.
Если по факту тега на страницах нет, но Лягушка показывает их как закрытые от индексации — это явный признак некорректной работы инструмента сканирования или неправильных настроек парсинга.
1️⃣ Различия в User-Agent:
Screaming Frog по умолчанию использует свой User-Agent. Может быть такое, что сервер может отдавать разные заголовки X-Robots-Tag в зависимости от агента. Поменяйте его на User-Agent Googlebot и проверьте результат.
2️⃣ Ошибки в конфигурации:
Неправильные правила в файле .htaccess или в конфигурации Nginx могут приводить к отправке неправильных заголовков X-Robots-Tag. Проверьте эти файлы на наличие ошибок и исправьте их, если необходимо.
3️⃣ Ошибки в Screaming Frog:
Хотя это и менее вероятно, возможны ошибки в самом Screaming Frog. Попробуйте обновить программу до последней версии.
4️⃣ Кэширование заголовков:
Может быть такое, что заголовки X-Robots-Tag закэшировались, из-за чего лягушка их видит, хотя по факту их нет. Попробуйте очистить кэш и пересканировать сайт.
Если проблема не устранится и после этих манипуляций, то попробуйте сканировать сайт с настройкой follow internal «nofollow».
Хотите получить ответ на свой вопрос? Задайте его нам через телеграм-бота!↓
Еще по теме:
- Как замедлить скорость сканирования Googlebot? Как избежать проблем при переносе сайта на другой сервер? Подскажите, пожалуйста, есть ли какой-то метод вынудить google бота cканировать медленнее? Сrawl-rate в консоли я поставил маленький совсем, в robots лишнее закрыто. Бот все равно...
- Как проверить не мешает ли прелоадер индексированию страниц сайта? На сайте есть preloader, который действует, пока контент страницы полностью не загрузится. Вопросы в связи с этим: как вообще поисковики реагируют на такие прелоадеры? Как...
- «Страница проиндексирована, но ее нет в файле Sitemap» — насколько критична эта ошибка? Search Console пишет, что URL категории находится в индексе, но его нет в файле sitemap. В то же время файл sitemap обновляется каждый день и...
- Как ПС с точки зрения текстовой релевантности индексируют и ранжируют страницы? Как с точки зрения текстовой релевантности роботы ПС индексируют страницы и продвигают их в выдаче? Учитывается ли скрытый текст через display: none или появляющийся через...
- Как улучшить индексацию ИМ и влияет ли вложенность URL на обход страниц роботом? Влияет ли структура каталога на индексацию страниц? Прошло 2 месяца с момента запуска ИМ, а проиндексировалось менее 10% страниц. Знаю, что чем меньше вложенность, тем...
Есть вопросы?
Задайте их прямо сейчас, и мы ответим в течение 8 рабочих часов.