+7 (495) 215-53-73

В Москве

Заказать SEO-услуги
Согласен с правилами обработки персональных данных
Скорость ответа - до 30 минут!

Главная    Вопросы по SEO, продвижению и оптимизации сайтов в Яндекс и Google    Малоценные страницы    Анализ и поиск thin контента и неявных дублей на сайте

Анализ и поиск thin контента и неявных дублей на сайте

Заказать SEO-услуги
Согласен с правилами обработки персональных данных
Скорость ответа - до 30 минут!
Есть ли какие-то бесплатные решения для анализа и поиска thin контента (НКС для Яндекса), т.е. парсинга сайта на предмет похожих страниц, но не одинаковых? Например, если на одних и тех же страницах может использоваться плюс минус одинаковый текст или изображения.

Ответ

Screaming Frog может находить не только дубли страниц, но и похожие (неявные дубли). Происходит это следующим образом.

Шаг 1. Переходим в настройки «Configuration» — «Content» — «Duplicates» и настраиваем процент пороговой схожести контента.

настройка процента пороговй схожести контента

Шаг 2. Далее в настройках «Configuration» — «Content» — «Duplicates» задаем исключения и правила для анализа контента, задавая теги, классы и идентификаторы.

задаем исключения и правила для анализа контента

Шаг 3. Парсим сайт. После окончания парса настраиваем данные для анализа парса «Crawl Analysis» — «Configure».

настраиваем данные для анализа парса

Шаг 4. Выполняем анализ: «Crawl Analysis» — «Start».

Шаг 5. После чего во вкладке «Content», выбрав из списка «Near Duplicates» можно увидеть страницы с похожим контентом.

Результат проверки

Итого:

  • Для каждой страницы будет указан процент схожести, а также количество URL с похожим контентом.
  • Во вкладке «Duplicate Details» уже можно увидеть список похожих URL для каждой из страниц.

    список похожих URL для каждой из страниц

  • Выделив URL в столбце «Near Duplicates Address» можно увидеть исходный контент, в котором будет выделены отличающиеся фрагменты.
    Выделение отличающихся фрагментов

Но необходимо понимать, что таким образом мы сможем выявить лишь похожие страницы по текстовом содержимом, но не по смыслу. Более подробно о смысловых дублях можно узнать из нашей статьи: Как выявить смысловые дубли и избавиться от них.

Подписаться на рассылку

Еще по теме:


Сергей З.

SEO-аналитик

Работу в сфере IT начинал с должности контент-менеджера. Уже при создании своих личных проектов постепенно узнавал, что такое SEO, увлекло. Вдохновляюсь сложными и интересными задачами.

Мои увлечения: велоспорт и книги.

Девиз: «Другой жизни не будет!»

s.zaec@siteclinic.ru

Оцените мою статью: 

1 Star2 Stars3 Stars4 Stars5 Stars (5 оценок, среднее: 4,40 из 5)

Есть вопросы?

Задайте их прямо сейчас, и мы ответим в течение 8 рабочих часов.

Отзывы клиентов:

"Санкции были сняты. Весь процесс занял полтора месяца"

Сергей Протасов

Svem.ru

"Прекрасно проработанный аудит"

"Ощутимый рост позиций после второго апа"

Абрамов Дмитрий Сергеевич

Dvermezhkom-service.ru
Все отзывы

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *


Мы продвигаем: