среда, 9 января 2008 г.

Получение всех сообщений блога Blogger в формате RSS 2.0


В процессе переезда столкнулся с данной проблемой. Для начала рассмотрим одну особенность движка, позволяющую «достать» с блога нужное количество сообщений или комментариев. Итак, если в блоге насчитывается N сообщений (точное количество отображается в панели управления), то нужно использовать ссылку вида:

http://имя_вашего_блога/search?max-results=N

Примечательно, что при использовании числа N, больше реального количества сообщений, вы получите все тот же верный результат. Кроме того, мы можем получить все эти сообщения и в формате XML:

http://имя_вашего_блога/feeds/posts/default?max-results=N

По аналогии с данной ссылкой, есть возможность считывать из блога записи комментариев в формате XML. Для этого используем ссылку следующего формата:

http://имя_вашего_блога/feeds/comments/default?max-results=1000

(поскольку общее их число подсчитать навскидку слегка затруднительно, то указываем значение N равное, к примеру, 1000. Или еще проще:

http://имя_вашего_блога/feeds/comments/full
(за наводку спасибо Dan Rastor`у)

ВНИМАНИЕ! В это всем процессе есть 2 тонких нюанса, которые нужно учитывать.

1. Перенаправление потоков с помощью FeedBurner

Если вы пользуетесь услугамиFeedBurner для управления вашим RSS потоком, то перед считыванием всех сообщений блога в формате XML, перенаправление на FeedBurner нужно отключить. Поскольку сервис выводит лишь определенную часть последних сообщений, то его использование нам не походит. Возможно, кто-то нашел способ задавать нужные параметры там – поделитесь информацией.


Чтобы выключить перенаправление заходите в меню блога «Настройки», закладка «Канал сайта» и удаляете значение поля «URL переадресации канала сообщений». После сохранения можете использовать приведенные выше ссылки для получения N количества постов в формате XML. При рабочем перенаправлении у вас ничего не получится. Главное не забудьте включить перенаправление после проделанной работы.

2. Конвертация Atom в RSS

Момент второй. Формат полученного XML файла – Atom, насколько я понимаю, Atom 1.0. Но этого, например, недостаточно для импорта в WordPress. Поскольку последний использует только импорт из формата RSS 2.0 (This importer allows you to extract posts from an RSS 2.0 file into your blog).
Честно говоря, не думал, что конвертация окажется настолько проблематичной и даже поиск по англоязычным ресурсам будет насколько хлопотным. Банальным запросом «convert Atom to RSS» и ему подобным я нашел весьма сомнительные ресурсы, для работы с которыми нужно сесть и разобраться что к чему.

Внимание! Привожу их на всякий случай! Если у вас не сработает вариант, приведенный далее, можете к ним вернуться и покопать немного:

http://www.2rss.com/software.php?page=atom2rss

http://www.goldenfeed.com/atom2rss.aspx

http://www.codeproject.com/useritems/ATOM_To_RSS_Converter.asp

Только потом, когда я уже начал искать возможность импорта в Wordpress через формат Atom на третьей странице выдачи(!) я наткнулся на очень полезную страницу:

http://atom2rss.semiologic.com/

Огромнейшее спасибо автору за это чудо, ибо работает точно и безукоризненно! Пользоваться ресурсом предельно просто – указываем ссылку на ваш поток в формате Atom, жмем кнопку convert и получаем потом уже в RSS 2.0. Остается только сохранить с помощью меню «Save as». Проще некуда! Но найти это решение оказалось не так быстро.

Оригинал статьи тут

4 комментария:

Анонимный комментирует...

Автор, о копирайтах ты наверное ничего не слышал?
Оригинал статьи здесь!
Снизу же четко написано - при использовании материалов - гиперссылка обязательнА!

RaZoR комментирует...

Сори, исправил.

Анонимный комментирует...

Спасибо:)

Анонимный комментирует...

Полезная статья. И автор к месту ее разместил на своем сайте. В тему http://litemoney.blogspot.com/