Создание XML файла Sitemap для WordPress блога (плагин)
В процессе работы в Интернете и параллельного изучения мат.части я постоянно открываю для себя какие-то новые моменты (нюансы). Некоторое время проходит на их испытание, внедрение на своих проектах, а дальше без них уже никуда — добавляю в некий список «нужных манипуляций» для каждого следующего сайта/блога. Чуть позже я пишу пост в данный блог дабы поделиться своим опытом и наработками:) Получается весьма удобно — закрепление материала для себя + тема для новой статьи. Приблизительно в этом стиле (и с такими же целями) написан пост про настройку FeedBurner.
Сегодня хочу рассказать о такой незаменимой штуке как Sitemap. Вообще существует 2 типа: в формате HTML — карта сайта для посетителей (чтобы они лучше ориентировались на вашем ресурсе) и в формате XML — для поисковых роботов. В принципе, рекомендую создавать их обе — это лучший вариант. Для создания стандартной HTML Sitemap особых знаний не нужно — тут можно использовать какой-то плагин для той или иной CMS либо вручную создать отдельную страницу, где разместить ссылки на главные разделы и важные страницы проекта.
По поводу XML Sitemap все немного сложнее. Данный файл сообщает поисковым системам чуть более подробную информацию о вашем сайте — кроме перечня страниц, доступных для сканирования, в XML содержатся метаданными, связанными с каждым URL`ом:
- дата последнего изменения
- частота изменений — например, страницы архива блога меняются раз в месяц, а посты публикуются еженедельно.
- приоритетность (значимость) страниц сайта. Здесь хочу заметить, что приоритетность не влияет на рейтинг страниц в результатах поиска, используется для поискового робота.
Кроме того, Sitemap исполняет ряд других полезных целей, рекомендуется использовать в случаях если ваш сайт:
- имеет динамическое содержание;
- содержит страницы, которые трудно обнаружить поисковому роботу (сложные файлы AJAX или Flash);
- новый и на него мало ссылок;
- содержит большой архив страниц, которые слабо связаны друг с другом или не связаны совсем.
В общем, получается, что XML файл Sitemap здорово помогает поисковикам найти как можно больше страниц вашего сайта, тем самым, ускоряя его индексацию. Ну а там и до поисковой выдачи недалеко:)
Google, Яндекс и некоторые другие поисковые системы ориентируется на протокол Sitemap версии 0.9. Здесь вы можете найти немного информации о нем. Но дабы не вдаваться в детали подробно многие системы управления сайтами имеют механизмы для создания XML файла Sitemap.
В WordPress для этого имеется специальный плагин — Google XML Sitemaps. Он имеет достаточно неплохую функциональность, поэтому является самым популярным плагином для данных целей. Кроме формирования Sitemap, модуль оповещает поисковые системы о наличии новых изменений в XML файле. Кстати, все это делается автоматически — вы просто пишете или редактируете статьи в блога, а плагин Google XML Sitemaps делает все остальное. Процесс установки достаточно прост:
- После скачивания архива плагина нужно распаковать и залить его содержимое в директорию wp-content/plugins.
- Далее создаете в корневой папке блога (там где находится wp-config.php) 2 файла — sitemap.xml и sitemap.xml.gz, причем устанавливаете для них права на запись (CHMOD 777) дабы система сама могла формировать их содержимое.
- Затем активируете плагин в админке.
- Открываете в меню страницу с настройками плагина Google XML Sitemaps в меню «Options» — «XML-Sitemap». Если получите сообщение об ошибке — проверьте права новых созданных файлов. Здесь вы можете установить ряд настроек для плагина, а также создать файл Sitemaps.
После этого, как я уже говорил, обновления файла будет производиться автоматически, и ни о чем вам не нужно будет беспокоится.
Кроме проверки статуса (состояния) работы плагина Google XML Sitemaps, а также общих настроек можно:
- Добавить в карту страницы, не принадлежащие блогу (если он размещается, например, по адресу domen.com/blog).
- Указать расположение файла sitemap.xml.
- Определить содержание карты сайта — какие страницы туда включать (посты, архивы, категории).
- Исключить определенные категории или посты.
- Указать частоту обновления страниц (это не команда для поисковиков, просто информация).
- Ну и указать приоритеты для страниц.
В общем, плагин Google XML Sitemaps обладает всем необходимым для создания файла XML Sitemaps для поисковиков. Поэтому, если у вас есть блог на WordPress, то лучшего варианта не найти.
P.S. Любишь футбол? новости футбола и результаты матчей на одном сайте.
Тоже только недавно стал использовать карту сайту. А именно xml версию. Для генерации тоже использую Google XML Sitemaps, очень хороший плагин. Ну и естественно «скармил» в пенели веб мастеров google и яндекс.
Для владельцев блогов на Blogger:
Для того что бы скормить сайтмап блога на Blogger гуглмастерс нужно просто в разделе https://www.google.com/webmasters/tools/sitemaps/ добавить строку:
atom.xml?redirect=false&start-index=1&max-results=100
где последнее число (100) — количество скармливаемых постов (можно добавлять, но рекомендуется не более 500 почему то…)
Хороший мануал по site map, сам недавно пытался настроить его для вордпреса, но в этом посте все четко и детально развернуто, спасибо Тод=)
как подробно расписал =) для начинающих самое то…
и что тут нового и подробного? никаких ньюансов не открыто. хотя б примерные значения приоритетности былы б указаны.
файлы самому можно не создавать — плагин сам это сделает.
слабая заметка
Всё делал по инструкции, но почему-то пишет что прав на запись нет. Хотя я поставил 777…
Я уже думаю плагин глючный качнул…в чём промблемс?
Станиславович, про создание Google Sitemap для блога на Blogspot я уже писал в другом блоге.
vVv, sitemap — это одна из тех вещей, о которой знают многие, но используют не все. Я сам лишь недавно начал активно ее юзать, это можно сказать и про роботс.тхт, панели вебмастеров и т.п. Подробной информации в сети очень много, в посте есть, кстати, на нее ссылка — смыслу перепечатывать все это не вижу, я сохранил лишь общую суть, чтобы было понятно для новичков в основном.
Константин, в инструкции сказано 666, попробуй постучаться в сапорт хостинга, возможно там запрещена запись в файл или что-то в этом роде.
Написал для себя программу, чтобы создавать карты статических сайтов. Может кому пригодится:
http://www.motorocker.ru/soft-sitemap.htm
Для таких сайтов единственная возможность создать карту – это с помощью онлайн сервиса выкачать сайт целиком.
Возможно ли как то передавать по xml одновременно несколько параметров, кроме самого поста еще добавлять в сайдбар к примеру какую то информацию?
man, sitemap — это sitemap, не вижу смысла передавать «еще что-то». Для этого используются другие возможности системы.
А для Joomla есть какой-нибудь site map generator?
Для джумлы можно поискать плагины (думаю должны быть 100%) или в крайнем случае — посмотри генераторы для создания xml файла sitemap любых сайтов.
спасибо.
Наконец, нашел нормальную статью, где подробно описано как устанавливать плагин, спасибо автору.
Можно ли xml создаваемый этим плагином прикрутить в качестве карты «для людей» на отдельную страницу.
Дмитрий сергеевич, для карты сайтов людям лучше использовать другой плагин. Завтра об этом напишу в своем новом блоге. Можешь следить за обновлениями в разделе плагины wordpress.
А что делать, если сама карта отображается не как положено, а сплошным текстом?
Да, меня тоже немного смущают малые интервалы, а в остальном плагин очень даже неплохой.
У меня почему то плагин в атомате грузит сервер и карта получается не полная. Приходится запускать в ручную из панели. Как выйти с такой ситуёвины?
Твою налево, а я не мог понять в чем дело, пока не установил права 666 (интересная цифра, конечно). Вывод: внимательней читайте посты:) Все работает, спасибо!
Sitemap штука очень полезная, вопрос в том, что Google XML Sitemaps начиная с 15000 страниц на блоге, начинает подглючивать… Можно конечно не публиковать в файле Sitemap всех статей, но тогда смысл пропадает…
Вот, задался вопросом, есть ли для WordPress плагин, который может создавать отдельные XML файлики каждого раздела на блоге?
Например для Joomla плагин Xmap именно это и позволяет провернуть. Там можно для каждого меню свой XML файл создать.
Еще вопрос, как относятся поисковики к файлам Sitemap, в которых более 20 000 записей?
На мой неискушенный взгляд — им просто «слабо» такой файл обрабатывать…
Цитирую «Можно предоставить несколько файлов Sitemap, однако в каждом из этих файлов должно быть не более 50000 URL, а размер каждого из этих файлов не должен превышать 10 МБ. При необходимости файл Sitemap можно сжать с помощью архиватора gzip, чтобы уменьшить требования к пропускной способности канала. Однако размер файла sitemap без сжатия не должен превышать 10 МБ. Если необходимо перечислить более 50000 URL-адресов, следует создать несколько файлов Sitemap.» Подробнее читайте здесь _http://www.sitemaps.org/ru/protocol.php
Ну, вот нашел ответ на свой вопрос, заметку про sitemap-generator.php прочитал не внимательно. Спасибо, за подробные инструкции.
хорошо обрисована информация о sitemap. Автору респект!
Хорошая статья. Помогла мне разобраться с sitemap. Ссылку сохраню в закладках. Автору респект
В закладки не ставила — сразу карту по вашему руководству организовала.)) До этого мучилась с плагином от dagondesign. Видимо, он только «для людей» — гугл его так и не захотел принять, формат не тот. По вашей заметке только что xml sitemap поставила — съел прямо на лету. Спасибо!
Спасибо за статью,всё подробно и ясно.
sitemap.xml.gz этот файл для чего нужен?
Илья, я точно не помню, но мне кажется это что-то вроде «архивированного» варианта карты сайта, который некоторые сервисы воспринимают и скачивают быстрее. Но я сильно в дебри не вникал — сказано в описании плагина создать 2 файла, так и сделал)
XML SItemap — у меня в каждом файле хранить записи толи за месяц в один файл толи еще как-то но файлы небольшие и есть карта этих файлов
А вот дурость в том что XMLSitemap сам себя в meta прописал как noindex, и Яндекс с недавнего времени стал выкидывать sitemap. т.е. перестал его индексировать, и соответственно стали выпадать заметки которые я писал для GGL, а там начал падать процент проиндексированных заметок и соответственно я перестал получать заявки на размещение.
Пойду бить плагин по почкам.
Чтобы исправить баг надо в sitemap.xls noindex,follow изменить на ALL или index, follow
А я тему на GGL форуме поднял, мне там такого не подсказали, раньше кстати все в индексе было, а вот буквально наверное месяц назад где-то стало вываливаться.
Палю тему! — проще не бывает!
Что касается Гугла, то ему в качестве сайтмапа от Вордпресса (и некоторых других движков) вполне можно отправлять RSS-ленту. :) Кушает с удовольствием и не кашляет.
То есть в гугловской панели вебмастера в разделе сайтмапа указываем http://адрес_сайта.бэмц/feed/
Повторяю ключевой кусок: /feed/ — это адрес ленты RSS в Вордпрессе.
Фсьо. Пользуйтесь на здоровье.
DivaDii, если скармливать для гугла RSS, то есть несколько вопросов — что делать, если для RSS настроена переадресация на Feedburner, как быть с индексацией страниц меток, категорий, которые в карте можно разместить? Учитывая эти проблемы + то, что не все поисковики «кушают» RSS фид есть смысл разок сделать XML файл Sitemap и не париться (тем более что для wordpress это элементарно).
Тоже поставил данный плагин. Как же все просто с этими плагинами!!
Спасибо! А это только в Гугл индексации помогает? А как же Яндекс?
И ещё вопрос: как Вы так в одной статье столько много постовых оставляете? Это же запрещено! Вас не банят ни в поисковых системах ни в биржах где Вы продали эти самые постовые?
RusFreeBlog, та это вообще полезно для любой индексации. По постовым — это заказы напрямую и давно это было, сейчас я ставлю меньше, с околоссылочным, тексты большие, уникальные, площадка трастовая поэтому все пока что ок) Плюс некоторые ссылки мои собственные.
А сколько лет Вашему блогу?
Создал свой первый блог на WordPress, решил создать sitemap. Доступно статья написана, с первого раза все получилось)
Спасибо. Попробую установить. До этого ставил для пробы бета версию: google-sitemap-generator.4.0b8.zip, там вообще не надо устанавливать файлы на хостинг и в роботс тхт прописывать путь, карта весит на чем то сам не понял???
Альберт, может в других версиях эти файлы и сами создаются, я пока что по старинке добавляю их на ФТП вручную.
Очень оказался полезным Ваш материал. Более часа лазил, пока не нашел нормальный материал. Все у Вас понятно и очень разжевано. Спасибо.
Спасибо! Именно Ваша статья коротко и толково написана. Я со вчерашнего вечера пыталась сделать карту сайта. Много каких материалов пеперыла! Я новичок, трудно во всем разобраться. А тут так доходчиво! Успеха вам!
Хорошая статья, все понятно про карту сайта, а я все пыталась добавить в поисковики сгенерированную карту, так поисковики вроде и проиндексировали, а вроде и нет. А с плагином теперь все в порядке
подскажите новичку. а права обязательно менять в файлах sitemap.xml и sitemap.xml.gz? Я открыл и у меня там другие буквы и цифры. и папки сами сформировались, я их не создавал.
Сергей, насколько я понимаю, зависит от настроек хостинга — иногда эти файлы могут создаться автоматически, иногда нужно создать и установить права 666 (через FileZilla легко делается).
Как бы там ни было, попробуйте создать карту сайта и если все сработало — значит вы все правильно сделали, если нет — нужно искать причину, в том числе и проверить права редактирования файлов.
у меня на сервере (sweb) выбираю файл sitemap.xml и нажимаю правой кнопкой мыши, выскакивает: редактировать удалить и изменить права. меняю права, ставлю галочки пока не показывается 666. таким способом можно???
Сергей, да, конечно так можно.
Спасибо за ответы и полезную статью!!!!Й
Спасибо большое статья познавательна. Но права на файлы «sitemap.xml.gz» «sitemap.xml» нужно поставить не 666 а 777
kingdomplay, статью исправил, спасибо за поправку. На самом деле в описании установки плагина на официальном сайте вордпресс стоят права 666, хотя я всегда также использовал 777. Видимо, там была ошибка.