Прошу помочь с формирование .djvu

Не так давно таки добрался до издавашегося в ЕМНИП 1821 году типографией Московского Университета под редакцией Писарева альманаха "Калужские вечера".
Унёс некоторое количество интересующих меня верноподданических виршей.

3.5 мегабайта в формате .png. По сути (просто текст, "монохромный" в понимании сканера, т.е. на самом деле - дихромный) должно жаться хорошо.
Заливать в таком виде на Либрусек стыдно.
Разбираться с формированием .djvu или с шрифтами той эпохи сейчас возможности нет :(

Прошу помочь мне сформировать .djvu (естественно в первую очередь с целтю размещения на Либрусеке, для размещения резеврных копий есть на примере ещё пара ресурсов).

Комментарии

DjVuLibre и т.д.

jno@xxx:~$ man -k djvu
DjVu (1) [djvu]      - DjVu and DjVuLibre.
any2djvu (1)         - Convert .ps/.ps.gz/.pdf to .djvu
bzz (1)              - DjVu general purpose compression utility.
c44 (1)              - DjVuPhoto encode.
cjb2 (1)             - Simple DjVuBitonal encoder.
cpaldjvu (1)         - DjVuDocument encoder for low-color images.
csepdjvu (1)         - DjVu encoder for separated data files.
ddjvu (1)            - Command line DjVu decoder.
djview (1)           - Standalone DjVu viewer
djview4 (1)          - Standalone DjVu viewer
djvm (1)             - Manipulate bundled multi-page DjVu documents.
djvmcvt (1)          - Convert multi-page DjVu documents.
djvu (1)             - DjVu and DjVuLibre.
djvudump (1)         - Display internal structure of DjVu files.
djvuextract (1)      - Extract chunks from DjVu image files.
djvumake (1)         - Assemble DjVu image files.
djvups (1)           - Convert DjVu documents to PostScript.
djvused (1)          - Multi-purpose DjVu document editor.
djvutoxml (1)        - DjVuLibre XML Tools.
djvutxt (1)          - Extract the hidden text from DjVu documents.
djvuxml (1)          - DjVuLibre XML Tools.
djvuxmlparser (1)    - DjVuLibre XML Tools.
nsdejavu (1)         - DjVu browser plugin

" - Папа, папа, как мне посмотреть, что у меня есть на диске ?
- man ls
- Ой, а что такое man ?
- man man" :)
По делу - есть пакет под названием Document Express Enterprise with DjVu v5.1.946,
позволяющий из упорядоченного набора страничек получить 1 djvu. При удаче - с текстовым слоем (дореформенный русский не понимает, увы). Программа под Винды, довольно простая. Подробности лучше посмотреть на Инфанате, они там почти монографию по ней написали. Могу залить на onlinedisk. Или предложить не париться, залить на Либрусек архив с отдельными страничками, наверняка найдется добрая душа и сконвертит. Тот же jno, например.... :)

вовсе и не так было...

Цитата:
- Папа, а как телевизор работает?
- RTFM!
< ребёнок безнадёжно вздыхает >
- man что?
:)

А список я привёл, что бы было что погуглить...

jno написал:
А список я привёл, что бы было что погуглить...

$ apropos djvu выводит список поинтереснее.

Благодарю тов. aut.
С учётом приведённой им подсказки постараюсь разобраться самостоятельно (всё таки лчший вариант).

хм... "man man" не пробовали?
man -k [ apropos options] regexp ...
это он и есть, apropos.

а "выводит список поинтереснее" потому, что у вас, видимо, больше всякого разного установлено :)

А отсканировано в b/w? Положите куда-нибудь пару страничек.
Вообще сканировать лучше все-таки в сером, а потом преобразовывать в черное/белое и далее в djvu.
Получается очень хорошо.

Реактор DjVu Editor 6.0 Pro
http://lib.rus.ec/soft#comment-26717

Вот здесь приводится готовый скрипт для такого преобразования:

--------------------
Файлы изображений помещаются в отдельный каталог, после чего переходим в этот каталог и даём команду:
./any2djvu-bw
Эта команда - вызов скрипта оболочки, текст которого приведён ниже:

#!/bin/bash
#
# any2djvu-bw
#

if [ -z `which anytopnm` -o -z `which ppmtopgm` -o -z `which pgmtopbm`\
-o -z `which cjb2` ]; then
usage
echo "Error: anytopnm, ppmtopgm, pgmtopbm and cjb2 are needed"
echo
exit 1
fi

shopt -s extglob

# DEFMASK="*.jpg"
DEFMASK="*.png"
DPI=300
# uncomment the following line to compile a bundled DjVu document
OUTFILE="#0-bw.djvu"

function usage() {
echo
echo "usage:"
echo
echo "$0 ["REGEXP"]"
echo " converts single pages with the default mask $DEFMASK (or REGEXP if provided)"
echo " in the current directory to single-page black and white djvu documents"
# uncomment the following line to compile a bundled DjVu document
echo " and bundles them as a djvu file $OUTFILE"
echo
}

if [ -n "$1" ]; then
MASK=$1
else
MASK=$DEFMASK
fi

for i in $MASK; do
if [ ! -e $i ]; then
usage
echo "Error: current directory must contain files with the mask $MASK"
echo
exit 1
fi
if [ ! -e $i.djvu ]; then
echo "$i"
anytopnm $i | ppmtopgm | pgmtopbm -value 0.499 > $i.pbm
# in netpbm >= 10.23 the above line can be replaced with the following:
# anytopnm $i | ppmtopgm | pamditherbw -value 0.499 > $.pbm
cjb2 -dpi $DPI $i.pbm $i.djvu
rm -f $i.pbm
fi
done

# uncomment the following line to compile a bundled DjVu document
djvm -c $OUTFILE $MASK.djvu

Красным в скрипте выделена строчка, где определяется, какой формат файлов будет преобразован в DJVU. В данном примере это png.

Итак, в результате работы скрипта появятся промежуточные файлы djvu и файл #0-bw.djvu - это и есть конечный файл, содержащий в себе все страницы. Переименовываем его в то, что более приятно глазу, и готово. После этого можно открыть полученный файл при помощи djview или evince.
-------------------------

Благодарю. Всех тех, кто откликнулся с предложением помочь и Вас в особенности.
Это было то, что надо!

Справился сам (правда в ленивом режиме, странички можно было бы покрутить и масштаб согласовать, но меня от любого редактирования графики воротит).
Сформированный файл уже залит: http://lib.rus.ec/b/130620

ЗЫ: Теперь ещё как-нибудь добавить бы описание автора (которое, впрочем, любой желающий может посмотреть в словаре Брокгауза) - и было бы вообще счастье.

Я наверное тупой сложно как то

pasan написал:
Я наверное тупой сложно как то

Ничего сложного здесь нет совершенно. Создаёте файл, копируете в него буквально приведённый по ссылке код (там есть вариант на bash и perl), делаете его исполняемым, и помещаете его в один из системных каталогов bin из под root, либо куда вам нравится в домашнем каталоге (например в тот, в котором у вас находятся сканы) из под обычного пользователя, запускаете его, и получаете готовый output.djvu. Что здесь сложного?

Aristarch Platonov написал:
Что здесь сложного?

(прищурившись, прочитал пример с точки зрения виндузятника, и мерзко хихикнул)

pkn написал:
Aristarch Platonov написал:
Что здесь сложного?

(прищурившись, прочитал пример с точки зрения виндузятника, и мерзко хихикнул)

Специально для форм жизни, которые эволюционировали в млекопитающих из кишечнополостных минуя все остальные стадии — компанией Lizardtech был создан инструмент под названием "Document Express Editor & Co" Там, у членистоногих вообще никаких вопросов возникать не должно, последовательность действий запрограммирована на уровне ганглий — "Нажать Большую зелёную кнопку -> Найти подходящий по цвету значок -> Открыть папку… -> Большая красная кнопка -> Получить результат.

Не удержался и тоже хихикнул :)
А теперь - вопрос. Чем под Linux можно сконвертировать в B/W ошибочно сосканированный в цвете лист/книг ?

GIMP'ом - точно.
Если это - оверкилл, то можно и пикасой, скажем...

Кто такой пикаса ? Даже не слышал.... :(

приблуда такая. изначально - форточная, правда. но есть сборка и для Linux (пока - на базе wine, правда). впрочем, работает же...

А забросьте на .

А нафиг именно djvu ? сделал бы FB2 и все спасибо сказали и страданий меньше.

Да, с учётом того, что в Ленинской библиотеке при наличии микрофильма оригиналы не трогают (да и качество оригинала тоже, увы, оставляет желать лучшего) качество сканов (и как следствие - итогового .djvu) "несколько" оставляет желать лучшего. :(
Рисованием многого не исправишь.
Так что с шрифтами всё же придётся разбираться и делать нормальный .latex...

Заметки постороннего.
1) Зачем сразу latex ? Finereader -> doc|rtf -> fb2 не лучше ли будет ?
2) "Завалы" страниц могут быть подправлены программным способом. Под Винь - scankromsator'ом, под Линукс - unpaper'ом.

Ulenspiegel написал:
1) Зачем сразу latex ? Finereader -> doc|rtf -> fb2 не лучше ли будет ?

Смотря что ставить целью.
Если аутентичное вопроизведение (шрифты эпохи), то первое преобразование видится мне заметно гемморойнее, а второе - просто нереализуемым.

Ulenspiegel написал:
2) "Завалы" страниц могут быть подправлены программным способом. Под Винь - scankromsator'ом, под Линукс - unpaper'ом.

Знаю :)
Но у меня практически аллергия на такого рода шаманства.
Особенно с учётом того факта, что полное исправление недочётов невозможно (портебует неадекватный на мой взгляд трудозатрат).

to Anarchist: Цитата: "Эта мини-инструкция в картинках, описывающая полный цикл создания электронной версии научно-технической книги, и предназначена для человека, искренне захотевшего сделать приемлемого качества е-книгу, но не знающего с чего начать." - здесь все "разжевано" с нуля http://www.djvu-soft.narod.ru/scan/scan_and_share_1_07.htm На том же сайте можно качнуть)) весь необходимый софт. ИМХО, более подробной и толковой инструкции в природе не существует, сам начинал с нее...

X