+7 (495) 215-53-73

В Москве

Заказать SEO-услуги
Согласен с правилами обработки персональных данных
Скорость ответа - до 30 минут!

Главная    Форум
Вы должны войти в систему для того, чтобы создавать сообщения и темы. » Авторизоваться
Как избавиться от дублей?

Подскажите, пожалуйста, решение как выйти из следующих ситуаций.
1) Если есть две страницы:
Site.ru/o-proekte
Site.ru/o-pRoekte
Вторая по идее не должна быть доступна, т.е. выдавать 404 Not Found, а не 200 ОК. Подскажите, пожалуйста, как это можно сделать?
2) Если запросить заведомо некорректный URL вида https://site.ru/?N, где N – любой численный или строковый параметр, например https://site.ru/?qwerty, сервер отдаёт 200 ОК. Хотя, по идее, правильно было бы 404 Not Found или 301 Moved Permanently. Что вроде как реализовывается при помощи модуля Mod_rewrite. Прав ли я? И если да, то, как можно исправить ситуацию?
Спасибо.

Здравствуйте, для того, чтобы несуществующая страница отдавала 404 ошибку, её надо настроить в файле .htaccess. Какая CMS у Вашего сайта?

По поводу дублей - чтобы я смогла корректного ответить, пожалуйста, пришлите пример дублей страниц конкретно Вашего сайта.

По поводу первого вопроса. У меня вордпресс. Был бы вам очень признателен, если бы вы подсказали какое правило нужно прописать в .htaccess, чтобы подобных ситуаций не было.

По поводу второго вопроса. Прислать вам адреса дублей не могу, т.к. я их уже удалил. Но ситуация была вот в чём. Мне решили на одном форуме указать на проблемы дублей следующим образом.

А можно ещё и так https://site.ru/ ?p-online (пробел после / уберите)

и увидите в исходном коде страницы

PHP код:

 <ul><li class="active_page"><a href="https://site.ru/?p-online">1</a></li>
<
li><a href="https://
site.ru/page/2?p-online">2</a></li>
<
li><a href="https://
site.ru/page/3?p-online">3</a></li>
<
li><a href="https://
site.ru/page/4?p-online">4</a></li>
<
li><a href="https://
site.ru/page/5?p-online">5</a></li

И после этого примера в Гугле появились эти нехорошие страницы, которые я уже удалил. Хотя в роботсе у меня есть правило Disallow: /*?* Однако это не панацея, и вкачестве примера мне ещё привели такой случай:

https://www.google.ru/search?q=%D1%83%D0%B1%D0%B8%D0%B9%D1%86%D0%B0+%D0%B8%D0%BD%D0%B4%D0%B5%D0%BA%D1%81%D0%B0+404

1 место в выдаче запрещено в роботсе и отдаёт 404

Заранее благодарю. Сайт могу скинуть вам в личку.


код отобразился некорректно, но суть проблемы вроде ясна.

Здравствуйте, вижу Ваш ответ, спасибо, изучаю проблему, отвечу чуть позже.

Здравствуйте, по Вашим примерам дублей не совсем понятно, о чем идет речь, но как я понимаю, проблема была в том, что страницы с несуществующим URL открывались на сайте с определённой информацией, которая уже размещена на другой странице, верно?

Если да, то настройте 404 ошибку.

Здесь - https://elmexicano.ru/kak-nastroit-htaccess-wordpress/ хорошо описано, как настроить ошибку

И вот хорошая статья - https://ktonanovenkogo.ru/wordpress/wordpress_osnovi/stranitsa-oshibok-404-v-wordpress.html - как можно оформить саму страницу, что также Важно. Хорошо оформленная несуществующая страница позволяет не уводить пользователя с сайта, а предлагает перейти на какой-то полезный раздел или на главную страницу.

Вот пример несуществующей страницы, которая не оформлена - https://www.moscowplan.ru/ghhwnbdns - попав на такую страницу, пользователь просто её закроет.

Если попадет на оформленную - https://www.stonasto.ru/ghwnhd - в боьшинстве случаев перейдет на главную и останется на сайте.

Скидываю Вам ссылки, чтобы было как можно более подробно и на данных страницах размещена и другая информация, которая Вам может быть также полезна.

По поводу Вашего примера индексации несуществующей страницы в гугле - на самом деле она не индексируется:

https://clip2net.com/s/2KKGH

Также можно это проверить вручную, набрав в поисковой строке Гугла - site:урл страницы.

Возможно такие страницы появляются в выдаче, потому что там стоит сервис Яндекс.Поиск (https://site.yandex.ru/).

Здравствуйте.

Нашёл некоторую информацию по этому вопросу. Чтобы страницы вида https://site.ru/?qwerty, не отдавали 200 ок, нужно в .htaccess прописать правило
RewriteEngine on
RewriteCond %{QUERY_STRING} ^.+$
RewriteRule ^[^/.]*$ https://site.ru/? [R=301,L]

Может вы прокомментируете всё ли правильно, а то с этим .htaccess я не особо силён.

А по поводу первого вопроса, на блоге Елены Камской если в адресной строке набрать https://optimizatorsha.ru/conTact-me/, то выдаёт 404 ошибку, в то время как у меня 200 ок. Может вы подскажете как и где мне настроить это дело. Мне вот посоветали через регулярку пропускать только буквы с нижним регистром, но как я уже говорил, с .htaccess я не особо силён.

Буду благодарен вам за помощь.

Здравствуйте, я Вам потому и скинула ссылки, что есть несколько вариантов, Вы можете создать специальную страницу для 404 ошибки вида&nbsp; с таким адресом - https://site.ru/404.html, на этой странице можно разместить инфу, что посетитель попал на несуществующую страницу и разместить ссылку, например, на главную.

В этом варианте в файле .htaccess прописываете правило

ErrorDocument 404 https://site.ru/404.html

Либо не создаете никакой страницы и просто прописываете правило в .htaccess

ErrorDocument 404 "здесь пишите любую фразу, например - такой страницы не существует"

Что касается 301-го редиректа, то его лучше применять в крайних случаях, например, для склейки зеркал, избыточный 301-й может негативно восприниматься Яндексом (https://help.yandex.ru/webmaster/?id=1108949)

Что касается блога Елены, то её несуществующая страница отдает ответ сервера - 404 Not found. Проверить можно здесь - https://mainspy.ru/otvet_servera