ArtReal logo
На грани иронии
 

<! doctype content //public >
<! xref location=/Toweek/2004 >

 
23.05.2004

Вадим Артамонов

LJ Book

Техника преобразования LJ в PDF

Чем бы дитя не тешилось... впрочем, дитя уже потешилось палкой колбасы из холодильника.

    Специфика LiveJournal такова, что лента имеет небольшую глубину, а дальше1 смотреть записи уже неудобно. Как же тогда ностальгировать, перечитывая собственные записи (или записи друзей)? Редкий жижист откажется от возможности получить свой дневник в полном и хорошо читаемом виде (и, желательно, на блюдечке с голубой каемочкой и с бантиком). Кроме того, резервная копия никогда не помешает.
    Есть два основных пути "выковыривания" записей - экспорт средствами самого LJ и скачивание методом перебора записей (ljsm). Только вот полученные записи в неудобном для использования формате. А есть ли способ получения записей в более удобном виде?
    Оказывается, есть. Например, получить свой LJ в PDF. Для этого есть новый интересный сервис LJ Book. Для ленивых предусмотрен вариант "все скопом". Указываем период, уровень секретности2, параметры форматирования - и получаем pdf. Правда, необходимо поделиться паролем к своему LJ - без этого лошадка отказывается бегать.
    Для параноиков, не желающих делиться паролем (например, как я) есть другой сервис: LJ Book.xml, конвертирующий xml в pdf. xml необходимо добыть самостоятельно - экспортом средствами LJ3. Впрочем, подсунуть можно все, что угодно. Главное - чтобы оно имело формат экспорта из LJ и кодировку utf-84.
    Для извращенцев - есть возможность отпечатать свой LJ в виде бумажной книги.

    Для тестирования сервиса я использовал два xml-файла. И вот какие результаты:
   - из xml в 11310 байт получился pdf размером в 141395 байт, время конвертации: 10 минут
   - "сборный" xml за несколько месяцев жужжал минут 40, после чего отказался отдавать pdf - ошибка при конвертации; из-за чего - не совсем понятно.

    Что же касается практического смысла конвертации LJ в PDF, то тут есть большие сомнения. Все очень просто - при наличии xml с записями, мы можем конвертировать их во что угодно, в зависимости от того, как именно мы хотим с ними работать. И PDF - это не самое удобное представление LJ в "удобно-читаемой форме", поскольку линейное представление записей удобно для чтения книжек, а не интерактивных дневников. Наибольший интерес представляет иерархическая модель LJ с раскладкой записей по уровням и с группировкой записей... но программное обеспечение для этого придется писать самому.

   ---
   1 - то есть назад по временной оси
   2 - если pdf нужен не для себя, то необходимо указывать security level "Public", чтобы в pdf не попали приватные записи
   3 - насколько я понимаю, [LJpdf] требует пароль для того, чтобы самостоятельно сделать экспорт из LJ
   4 - в кодировке windows-1251 конвертация не идет

На печать  

<! xref location=/Toweek/2004 >
<! doctype links //site-relative >