Как определить дубли страниц
Если вы регулярно или время от времени просматриваете форумы, которые относятся к тематике вебмастринга и СЕО, то скорее всего встречали вопросы: а почему в индексе ПС Яндекса находится порядка двух тысяч страничек, а в Гугл аж двадцать тысяч. Большинство специалистов сходится во мнении, что все дело в дублях страниц на вашем вебдетище.
Уже давно известно, что дубли вебстраниц могут накликать на ваше вебдетище немилость поисковиков. И едва ли мы желаем очутиться под АГС, и дубли страничек могут быть той недостающей деталью, которая отгораживает вебмастера и его сайт от фильтров.
Для нахождения на веб-ресурсе наличия дублей вы можете осуществить анализ вебдокументов, проиндексированных ПС. Метод этот довольно несложный. Вам необходимо вписать запрос site:вашдоменточкару. После вы увидите странички, которые поглотил поисковик.
Также можно во время анализа адресов искать наиболее не типичные адреса, которые отличаются от структуры УРЛ, используемой на сайте. Для этого нужно спарсить выдачу с помощью прекрасной утилиты ЯндексПарсер, после чего уже можно анализировать полученный массив адресов. К сожалению, в настоящий момент почти нет альтернативы этой утилиты для ПМ Гугл. После этого нужно ликвидировать дублирующиеся странички.