Drupal – мощная и гибкая система управления контентом и разработки приложений. Огромное число плюсов у этой CMS, относительная простота в освоении и дружественное сообщество пользователей и разработчиков (например, наше) позволяют привлекать всё больше и больше единомышленников в наши ряды. А чем больше будет друпалеров, тем лучше будет всем им, ведь коллективный разум способен решать более сложные задачи, быстрее находить ошибки и исправлять их.
Но, как и всё в нашем мире, Drupal имеет свои недостатки. Один из них – это одинаковые страницы, которые не несут смысловой нагрузки. Например, страницы с формой отправки комментария или регистрации пользователей. О том, как избавиться от таких лишних страниц пойдёт речь в этой заметке.
Легендарный персонаж, от имени которого по слухам пишет целый отдел Яндекса, Платон Щукин, не раз вещал нам о пагубном влиянии дублированных страниц на поисковую выдачу (один из ответов на вопросы):
На Вашем сайте много дубликатов и полудубликатов. Таких страниц у Вас на сайте много. Поэтому есть только одна рекомендация: индексировать в поисковой машине оригинальные страницы, которые несут пользователям максимум информации.
О том, как скрыть от поисковиков такие страницы недавно рассказал Андрей в своей статье о продвижении сайта:
Проблема с дубликатами страниц возникает, если на вашем сайте на Drupal анонимным юзерам запрещено оставлять комментарии, а сама форма отправки комментариев показывается на отдельной странице. В этом случае под каждым анонсом статьи появляется такой текст:
» Войдите или зарегистрируйтесь, чтобы получить возможность отправлять комментарии.
Здесь слова "войдите" и "зарегистрируйтесь" являются гиперссылками, которые ведут на страницы-пустышки (дубликаты). Основное содержание этих страниц - форма для входа на сайт и форма для регистрации соответственно.
Для решения этой проблемы Андрей советует внести в файл robots.txt следующие директивы:
Disallow: /user/register?
Disallow: /user/login?
Не лишним будет скрыть и RSS-фиды категорий:
Disallow: /taxonomy/term*/feed
Добавить и проверить правильность файла robots.txt можно из панели вебмастера гугла и Яндекса.
Андрей уже давно и очень успешно применяет этот метод на своём астрофизическом портале, а я ещё только буду пытаться улучшить файл robots.txt на своих сайтах: студенты БГУ и форекс дневник.
На картинке: ножницы с лазерным прицелом - лучший инструмент для вебмастера
Disallow: /user/register?
Disallow: /user/login?
Уже есть в robots.txt Drupal5.
Есть, но не в такой форме. А разница всего в один символ существенна. Смотрите здесь полную версию рассказа и сами убедитесь.