1

Тема: "Левые" страницы в индексе ПС

Здравствуйте ув. форумчане блога АлычЪ'a!
И так, перейду сразу к сути проблемы:

site.ru/?site=colorzone&bn=colorzone_info
site.ru/?site=colorzone

Вот такие вот странички я недавно обнаружил в индексе и в ошибках вебмастера как дублей. Делал все четко по вашим статьям, ничего не упускал. Левых скриптов никаких нет. Движок тут не при чем.
Что вызывает данные страницы и как это предотвратить?

Re: "Левые" страницы в индексе ПС

Дайте урл сайта...

3 (20.02.2013 00:30 отредактировано Xnokie)

Re: "Левые" страницы в индексе ПС

Не могу тут показать, увы(
Тематика не позволяет...
Вот сайт с такой же проблемой:
http://loto-zabava.info/?site=colorz...colorzone_info

4 (20.02.2013 05:21 отредактировано Axel)

Re: "Левые" страницы в индексе ПС

Хм... Понятия не имею. На DLE я сижу уже лет 6 и подобного не встречал. Могу уверенно могу сказать - дело не в движке.

Погуглил тут маленько... Проблему нигде ранее не поднимали, кроме Вас на серче, как я понимаю smile

Вообще тема актуальная. Дописал эту хрень в адрсе к своему сайту - попадаю на главную. Получается тоже дубль. Этой хренью можно продублировать каждую страницу сайта. В поиске дохрена сайтов с подобными урл. Тему нужно решать...

Бэки на сайт гляньте, может что-то ссылается по такому адресу...

Нужно на подобные страницы сделать ответ 404. А вот как это сделать... нам должет ответить сеньор АлаичЪ, директор всея alaev.info:)

5

Re: "Левые" страницы в индексе ПС

Глянул бэки, ничего подобного не нашел(
Надеюсь Александр поможет...

Re: "Левые" страницы в индексе ПС

Xnokie, возможно, проблема в том, что кто-то добавил в индекс поисковых систем несуществующие страницы Вашего сайта. Ваша проблема только в том, что движок не отдал ошибочный код, поэтому поисковики подумали, что такие страницы существуют. Настройте движок, вопрос отпадёт сам собой.

7

Re: "Левые" страницы в индексе ПС

Сделал следующее:

RewriteCond %{QUERY_STRING} ^site= [NC]
RewriteRule (.*) $1? [R=301,L]

Помогло, теперь перекидывает на гл. стр
Но вот адреса /?blablabla работают, стоит беспокоиться или это не столь важно?

8

Re: "Левые" страницы в индексе ПС

Xnokie пишет:

Здравствуйте ув. форумчане блога АлычЪ'a!
И так, перейду сразу к сути проблемы:

site.ru/?site=colorzone&bn=colorzone_info
site.ru/?site=colorzone

Вот такие вот странички я недавно обнаружил в индексе и в ошибках вебмастера как дублей. Делал все четко по вашим статьям, ничего не упускал. Левых скриптов никаких нет. Движок тут не при чем.
Что вызывает данные страницы и как это предотвратить?

Я в жизни не поверю, что движок тут не при чем!!!
Такой урл может генерить, например какойнить модуль, возможно ты его потер еще хер знает когда, но вот такая загагулина осталась!
Во первых, проверь все правила в хтаксессе, во вторых, проверь свою сайтмапу и свой шаблон, на наличие ссылания на данные адреса(возможно не ты их ставил) проделаешь пиши будем всем скопом гадать!
А если по хорошему, то астрал сегодня затуманен, не плохо бы на пациента взглянуть!)

9

Re: "Левые" страницы в индексе ПС

Перепроверил, шаблон не ссылается, карта тоже в норме.
Насчет движка... Есть сайты и на джумле и на вп с такой же траблой...
Может быть конечно как сказал DVE, хз

DVE пишет:

Xnokie, возможно, проблема в том, что кто-то добавил в индекс поисковых систем несуществующие страницы Вашего сайта.

10

Re: "Левые" страницы в индексе ПС

Xnokie пишет:

Xnokie, возможно, проблема в том, что кто-то добавил в индекс поисковых систем несуществующие страницы Вашего сайта.

Что за бред???
ОНИ БЫ САМИ ПО СЕБЕ ПОТОМ ОТПАЛИ НАХ!
тут дело в движке 90%

11

Re: "Левые" страницы в индексе ПС

Hooligan пишет:

Что за бред???
ОНИ БЫ САМИ ПО СЕБЕ ПОТОМ ОТПАЛИ НАХ!

)))
Есть какая нибудь софтина или сервис, что бы проверить все файлы движка? Или легче будет втупую пооткрывать все файлы и вбивать в поиске "colorzone" ?

12

Re: "Левые" страницы в индексе ПС

Честно говоря не знаю как объяснить, но у меня случилась подобная проблема возникли не дубли а 404 ошибки, подобные: site.ru/demotivatory/category.php?sex=&name=&style=&cat_id=80402,
так вот приставки /category.php?sex=&name=&style=&cat_id=80402 тянулись из шаблона, в одном из блоков были такие ссылки, при этом блок был закомментирован. Поэтому поищите все таки в шаблоне.

13

Re: "Левые" страницы в индексе ПС

Axel пишет:

А вот как это сделать... нам должет ответить сеньор АлаичЪ, директор всея alaev.info:)

Я для вас писал огромный пост про 301 редирект - там разобраны типичные случаи и варианты борьбы с подобными ситуациями. Что я еще могу нового сказать?
Такие ссылки берутся только из-за двух причин - внутренние ссылки или внешние ссылки. Внутренние ссылки - это или косяки шаблона или модуль (остатки модуля). Внешние ссылки - причин миллион и удалить такие ссылки в 99.9% случаев невозможно.

14

Re: "Левые" страницы в индексе ПС

Ну это понятно, как я уже выше написал, я решил это с помощью:
RewriteCond %{QUERY_STRING} ^site= [NC]
RewriteRule (.*) $1? [R=301,L]

Кстати, возник вопрос:
А могли ли swf файлы (флеш игры) сгенерировать такую "байду" ?

15

Re: "Левые" страницы в индексе ПС

Xnokie пишет:

могли ли swf файлы (флеш игры) сгенерировать такую "байду" ?

Нет, не должны, если только в них нет ссылок, переходя по которым можно попасть на подобный адрес, который в последствии будет проиндексирован благодаря пингу ЯндексМетрики или Хрома. Я думаю, что это маловероятно...

16 (26.02.2013 04:20 отредактировано Xnokie)

Re: "Левые" страницы в индексе ПС

Увидев только что ещё кучу дублей в вебмастере, я как бы так мягко сказать - замерз.

Xnokie пишет:

RewriteCond %{QUERY_STRING} ^site= [NC]
RewriteRule (.*) $1? [R=301,L]

Как ни странно но это не помогло.

Стал копать логи, обнаружил следующее:

109.124.154.72 - - [26/Feb/2013:00:03:54 +0100] "GET /?site=colorzone&bn=colorzone_info HTTP/1.0" 301 290 "http://www.google.com.ua/url?sa=t&r … Vhdxa6gVYw" "Mozilla/5.0 (Windows NT 6.1; rv:19.0) Gecko/20100101 Firefox/19.0"
109.124.154.72 - - [26/Feb/2013:00:03:54 +0100] "GET / HTTP/1.0" 200 5797 "http://www.google.com.ua/url?sa=t&r … Vhdxa6gVYw" "Mozilla/5.0 (Windows NT 6.1; rv:19.0) Gecko/20100101 Firefox/19.0"

37.25.133.127 - - [25/Feb/2013:03:03:48 +0100] "GET /uploads/posts/2013-02/1360654280_1.jpg HTTP/1.1" 200 80158 "http://webcache.googleusercontent.com/s … =firefox-a" "Mozilla/5.0 (Windows NT 6.1; rv:19.0) Gecko/20100101 Firefox/19.0"

И такой лажи полно, внатуре.  У меня нет слов. Я перепроверил все файлы на хостинге, которые можно открыть текстовым редактором, ничего подобного не нашел. Что делать? Выручайте...

17

Re: "Левые" страницы в индексе ПС

Xnokie, Все ок в логах, видно же:

"GET /?site=colorzone&bn=colorzone_info HTTP/1.0" 301
"GET / HTTP/1.0" 200

Робот переходит по ссылке, происходит 301-редирект на главную - все окей!

18

Re: "Левые" страницы в индексе ПС

А как заставить Гугл их выплюнуть?
Удаление урл в вебмастере не помогает, ибо он считает что это весь сайт
Или они  со временем сами выпадут?
Продублировалась новость пять раз благодаря этой байде...

19

Re: "Левые" страницы в индексе ПС

Xnokie, Сами отвалятся со временем.

20 (13.02.2014 21:21 отредактировано club-16)

Re: "Левые" страницы в индексе ПС

Такая же ерунда недавно появилась с концовкой  "/?site=colorzone". Решил может уже кто, как убрать?