Онлайн заработок, создание и монетизация сайтов, веб-разработка, SEO и SMO продвижение, фриланс, партнерки, полезные сервисы вебмастерам, блоггинг.

Получение всех сообщений блога Blogger в формате RSS 2.0

В процессе переезда столкнулся с данной проблемой. Для начала рассмотрим одну особенность движка, позволяющую «достать» с блога нужное количество сообщений или комментариев. Итак, если в блоге насчитывается N сообщений (точное количество отображается в панели управления), то нужно использовать ссылку вида:

http://имя_вашего_блога/search?max-results=N

Примечательно, что при использовании числа N, больше реального количества сообщений, вы получите все тот же верный результат. Кроме того, мы можем получить все эти сообщения и в формате XML:

http://имя_вашего_блога/feeds/posts/default?max-results=N

По аналогии с данной ссылкой, есть возможность считывать из блога записи комментариев в формате XML. Для этого используем ссылку следующего формата:

http://имя_вашего_блога/feeds/comments/default?max-results=1000
(поскольку общее их число подсчитать навскидку слегка затруднительно, то указываем значение N равное, к примеру, 1000. Или еще проще:

http://имя_вашего_блога/feeds/comments/full
(за наводку спасибо Dan Rastor`у)

ВНИМАНИЕ! В это всем процессе есть 2 тонких нюанса, которые нужно учитывать.

1. Перенаправление потоков с помощью FeedBurner

Если вы пользуетесь услугами FeedBurner для управления вашим RSS потоком, то перед считыванием всех сообщений блога в формате XML, перенаправление на FeedBurner нужно отключить. Поскольку сервис выводит лишь определенную часть последних сообщений, то его использование нам не походит. Возможно, кто-то нашел способ задавать нужные параметры там – поделитесь информацией.
Чтобы выключить перенаправление заходите в меню блога «Настройки», закладка «Канал сайта» и удаляете значение поля «URL переадресации канала сообщений». После сохранения можете использовать приведенные выше ссылки для получения N количества постов в формате XML. При рабочем перенаправлении у вас ничего не получится. Главное не забудьте включить перенаправление после проделанной работы.

2. Конвертация Atom в RSS

Момент второй. Формат полученного XML файла – Atom, насколько я понимаю, Atom 1.0. Но этого, например, недостаточно для импорта в WordPress. Поскольку последний использует только импорт из формата RSS 2.0 (This importer allows you to extract posts from an RSS 2.0 file into your blog).
Честно говоря, не думал, что конвертация окажется настолько проблематичной и даже поиск по англоязычным ресурсам будет насколько хлопотным. Банальным запросом «convert Atom to RSS» и ему подобным я нашел весьма сомнительные ресурсы, для работы с которыми нужно сесть и разобраться что к чему.

Только потом, когда я уже начал искать возможность импорта в WordPress через формат Atom на третьей странице выдачи(!) я наткнулся на очень полезную страницу: http://atom2rss.semiologic.com/

Огромнейшее спасибо автору за это чудо, ибо работает точно и безукоризненно! Пользоваться ресурсом предельно просто – указываем ссылку на ваш поток в формате Atom, жмем кнопку convert и получаем потом уже в RSS 2.0. Остается только сохранить с помощью меню «Save as». Проще некуда! Но найти это решение оказалось не так быстро.

11.11.07

Категории: Blogger.com (Blogspot), Блоггинг.

Теги: , , , , ,

7 Comments
  1. Dan Rastor

    1) FeedBurner спокойно переводит Atom в RSS 2.0

    2) Все записи комментариев здесь http ://имя_вашего_блога/feeds/comments/full

  2. Tod

    1. Нашел такую возможность, только я FeedBurner отбросил сразу, поскольку на нашел как вывести в фид все сообщения. Есть такой способ?

  3. LuckyStar

    Привет товарищ Tod, не получается сохранить комменты даже в формате XML :(
    Я не могу понять каким образом их сохранить? я захожу через ссылку http://имя_вашего_блога/feeds/comments/default?max-results=1000, появляются комменты такого формата :
    http://i52.tinypic.com/315bl6r.jpg
    и что с ними делать? как сохранить в формат XML? не могу въехать :(
    + не появляются все комменты, у меня их больше 3000, а появляются максимум с сентября 2010 года до сегодня.

    Также забегу не много вперед, нужно в пункте «1. Перенаправление потоков с помощью FeedBurner» было выключить перенаправление на FeedBurner и удалить значение поля «URL переадресации канала сообщений», так вот, оно у меня и не существует — т.е. пустое, а вот все сообщения из блога все равно вывести не могу…
    Ох, надеюсь на помощь… :)

  4. Tod

    LuckyStar, чтобы сохранить в XML заходишь в меню браузера и жмешь «сохранить как» :) Возможно, для комментариев есть ограничение. Что касается постов блога, то все у меня получается
    _http://luckystar-earnmore.blogspot.com/feeds/posts/default?max-results=5
    Кстати, сейчас в Blogger есть «импорт» и «экспорт» блога в самой админке, да и вообще кое-что изменилось с тех пор.

  5. LuckyStar

    :)
    Тю блин, так и сохранял комменты, просто файл получался с расширением .XHT , что я и не мог понять, сейчас все норм сохраняется в формате xhtml.
    Про эспорт и импорт я знаю давно, просто думал что работает только для импорта в blogger только, в общем надо пробовать в WP запихнуть сохраненный файл.
    Кстати при ручном созранении — получается файл в формате .xhtml, а вот при использовании функции експорта — как раз получается файл с расширением XML :).
    Я вообще експорт использовал для создания бекапа, так сказать, на всякий случай + html код сохранял на всякий случай, для сохраненния стрктуры настроенного шаблона :).

    ЗЫ. Плохо что нельзя все комменты вывести :(, просто интересно при экспорте комменты переносятся с постами или нет…

  6. Артем

    Есть еще варинат http://ваш-сайт/feeds/posts/default?alt=rss&max-results=1000
    Но в таком переносе есть проблема с рубриками (тэгами).
    У меня возникла проблема при переносе с блоггер при помощи плагина на wordpress. Все перенеслось, но остались ссылки читать далее, который просто переносят меня на старый блог. У кого есть идея, как это решить ?

  7. Tod

    Артем, если ссылки были прописаны в самом тексте постов, то решить можно только ручной правкой. Сейчас переносится через плагин (админку) wordpress, не обязательно получать все посты блога — статья устаревшая)

Добавить комментарий

Ваш e-mail не публикуется. Обязательные поля помечены *
Если вы комментируете впервые, то текст будет отправлен на модерацию.