Chm, docx и XXX

С форматами получается полная, простите, порнография.

По моим нехитрым наблюдениям.

Форматы типа chm почти НИКТО не читает. Да и DOC тоже. Они никому не нужны. Выкладывая книжку в формате, отличном от FB2, мы ее просто кладем в подвал. На дальнюю полку. В коробочку. Никто не будет лазить в подвал - никто про нее даже не узнает. А если и полезет, ему будет лень открывать коробочку. Люди такие...

Я тоже выкладываю книжки в формате DJVU и PDF. С одной надеждой - найдется человек, который ее перекодирует.

Но я не понимаю логики людей, которые живут на библиотеке 2 года, и выкладывают TXT-файлы с СамИздата, запиханные в DOCX, а вместо названия книжки - фамилия автора латиницей.
НАХЕРА ЭТО ДЕЛАТЬ?! Книгу никто не скачает. Абонент не отобьется. Никакого смысла - а только увеличиение хаоса. Давайте уже делать осмысленные вещи.

По-моему, в диалог добавления файлов надо прописать жесткий список из скажем 6-ти форматов: fb2, rtf, doc, djvu, pdf, chm, txt. Если файл в другом формате - не добавлять.
То же самое и с языком. Язык не русский по умолчанию, а выбирается из списка наподобие жанров. Не выбран - не добавлять.

Комменты только по делу, пожалуйста. Стонать о несовершенстве Либрусека и говорить "я предупреждал" - не надо, я это уже слышал.

Комментарии

Спасибо, поставил. ))
Что-то он установился, но не открывает. Может я не умею его готовить?

Там в меню "файл" появилась строка "Open Chm files".

Таф, увидел. (В жизни бы не полез туда)

Попробовал. Нормально конечно, но я надеялся, что он ВЕСЬ файл объединит на одной вкладке.

Ну, там же переходы всякие... Много чего мы хочем, не всегда получаем...
А чем народ разбирает файл chm? Есть утилита для создания и декомпиляции:
"HTML Help Workshop"

TaF написал:
Ну, там же переходы всякие... Много чего мы хочем, не всегда получаем...
А чем народ разбирает файл chm? Есть утилита для создания и декомпиляции:
"HTML Help Workshop"

А ещё есть СHM Dekoder: http://gridinsoft.com/rus/chm.php

TaF написал:
Ну, там же переходы всякие... Много чего мы хочем, не всегда получаем...
А чем народ разбирает файл chm? Есть утилита для создания и декомпиляции:
"HTML Help Workshop"

htm2chm и ещё вот тут можно посмотреть.

Мне тоже пришлось этот "ребус" разгадать...

TaF написал:
Мне тоже пришлось этот "ребус" разгадать...

На странице скачивания адд-он есть скриншот. В-)

Таф. прог много для разборки. но они все разбирают постранично. Я всё мечтаю найти в один клик. чтобы на выходе готовый Ворд получить

Цитата:
На странице скачивания адд-он есть скриншот. В-)

Ну дык мы же грамотные - на фига нам скрины рассматривать ? :-))

Такая вроде есть. IceBookReader, но она конвертит кривовато. Главы идут по тексту неравномерно. Это я помню на примере учебника по Delphi7...

Аватар пользователя Isais

wotti, есть такая прога. Переписываю с ее выходных данных - копипастить не дает.

CHMBOOKCREATOR - программа для создания CHM-книг (у меня версия 2005 г.). Она же их и разбирает, в т.ч. на цельный файл RTF! Сейчас перепроверил на файле с Л. - работает. Один клик - и 184 страницы.

//smallweb.ru/library/CHMBOOKCREATOR.htm
Автор: Тимур Вильданов aka Spider, (но предупреждаю: mail.ru с воскресенья убит).

Isais написал:
CHMBOOKCREATOR - программа для создания CHM-книг (у меня версия 2005 г.). Она же их и разбирает, в т.ч. на цельный файл RTF! Сейчас перепроверил на файле с Л. - работает. Один клик - и 184 страницы.
Ага, спасибо, вот тут его сайт http://smallweb.ru/library/chmbookcreator.htm
Но на сайте предупреждение, что не всегда корректно работает. Будем посмотреть. Спасибо, Isais!

Вообще я пользуюсь для разборки CHM виндовой прогой:
Из адресной строки (или например какого-нибудь Коммандера)
hh -decompile ИМЯ_ПАПКИ_ДЛЯ_РАЗБОРКИ ИМЯ_ФАЙЛА.CHM

например:

HH.EXE -decompile D:\Temp\karabanga_files c:\my_books\karabanga.chm

Аватар пользователя s_Sergius

А вот есть ещё маленькая чу́дная программа CHM Decoder. Декомпилирует любые CHM, в т.ч. и сделанные ChmBookCrеator.

Аватар пользователя Isais

И разбирает на пачку HTML-страничек с менюшкой.
Но действительно - маленькая.

Исаис, спасибо. Скачал и попробывал. Вроде даже стили сохраняет! Магарыч проставлю. )))

Adan75 написал:

По-моему, в диалог добавления файлов надо прописать жесткий список из скажем 6-ти форматов: fb2, rtf, doc, djvu, pdf, chm, txt. Если файл в другом формате - не добавлять.

Так будут от балды указывать что угодно, лишь бы добавилось.
Кто будет проверять что формат соответствует тому, что указали? Автомат?
Зачем тогда вообще указывать формат вручную, если его можно определить по файлу автоматически?

aina написал:
Adan75 написал:

По-моему, в диалог добавления файлов надо прописать жесткий список из скажем 6-ти форматов: fb2, rtf, doc, djvu, pdf, chm, txt. Если файл в другом формате - не добавлять.

Так будут от балды указывать что угодно, лишь бы добавилось.
Кто будет проверять что формат соответствует тому, что указали? Автомат?
Зачем тогда вообще указывать формат вручную, если его можно определить по файлу автоматически?

Вот и я не понимаю - зачем указывать вручную? О_о
По-моему, этот кусок движка был рассчитан на человека грамотного. Но в условиях массовости нужна защита "от дурака". Все ошибаются, я тоже.

Аватар пользователя Mylnicoff

aina написал:
Так будут от балды указывать что угодно, лишь бы добавилось.

И получат вместо пользы блокировку за вредительство. Люди же скачивать будут и выяснят, что формат не тот.

Сделал следующим образом.
Библиотекари могут добавлять файлы любых типов.
Все остальные - только популярных.
Популярным типом файла считается такой, каковой уже встречается не менее ста раз.
На данный момент это: fb2, djvu, pdf, doc, txt, html, rtf, chm.

(*довольно улыбается*) Спасибо!

А с языком как? А то вот в одной из добавленных книжек с СамИздата язык был "СИ". О_о

Adan75 написал:
(*довольно улыбается*) Спасибо!

А с языком как? А то вот в одной из добавленных книжек с СамИздата язык был "СИ". О_о


ООО?
Программер писал?
А на Паскале, Дельфи, ассемблере не пишут?

Видимо человек хотел написать что это СамИздат, но ошибся полем.

Аватар пользователя Isais

Вчера у одной книжули язык был GB. Долго думал, пока не закачал этот долбанный doc, содержащий txt с книгой на английском (!). Понимаете, GB - это грейт-британский язык, оказывается. А вы все о форматах...

Isais написал:
Вчера у одной книжули язык был GB. Долго думал, пока не закачал этот долбанный doc, содержащий txt с книгой на английском (!). Понимаете, GB - это грейт-британский язык, оказывается. А вы все о форматах...

Ну, вообще логично, а US- это ЮСовский язык. Он несколько отличается от Грейт-британского
:D

Предлагаю разместить на либрусеке оптимальный, проверенный софт для создания, редактирования, конвертации книг.. в каких-то случаях ;) ограничиться ссылками на него. Т.е. страничку "Софт".

Аватар пользователя Isais

Олег Оранжевый написал:
Т.е. страничку "Софт".
А это что - справа вверху, предпоследняя строчка, перед ЖЖ?

Он непроверенный, увы. Там на один FBE ТРИ ссылки. : (
Надо уже выбрать что-нибудь одно.

На FictionBook Designer ссылка не работает, перекидывает на корень сайта.

И почему ссылки на exe-шники, должно быть по идее как на OOO FBTools - страничка со ссылками на загрузку, описанием и прочим, а не тупо на файл.

Аватар пользователя Isais

Adan75 написал:
Он непроверенный, увы. Там на один FBE ТРИ ссылки. : (
Надо уже выбрать что-нибудь одно. .
Кажется, там все ясно: одна прога в трех версиях сборки: от июля 2009, от 26 января и от 28 января - со встроенными свежими скриптами от Sclex'a. Не хватает только иконок для всех скриптов.
Adan75 написал:
И почему ссылки на exe-шники, должно быть по идее как на OOO FBTools - страничка со ссылками на загрузку, описанием и прочим, а не тупо на файл.
Кому должно? А вот мне удобнее - сразу ссылку на .exe, чтоб одной командой из Оперы "сохранить объект как", а не тупо ждать пересылки на лишнюю для меня страницу. Поспорим, как лучше?

Отлично, разве не должно быть ОДНОЙ версии программы, рабочей и со всеми скриптами, чтобы люди не путались? Ну, так обычно делают. : )

Удобнее скачивать экзешник законченной правильной программы, а не того ....... что представляют из себя написанные на коленке проги.

Если программа обновляется регулярно - должна быть ссылка на ее страницу, нет?

Аватар пользователя s_Sergius

Adan75 написал:
Отлично, разве не должно быть ОДНОЙ версии программы, рабочей и со всеми скриптами, чтобы люди не путались? Ну, так обычно делают. : )

Ну, так-то оно так. Но версия от 2010 года появилась совсем недавно (да и не одна, а сразу две), еще не испытана как следует, так что безоговорочно рекомендовать ее пока никто не решается.
Кроме того, не следует забывать, что все они бета-версии, а автор на либрусеке не работает, задания мы ему давать не можем! :)

Аватар пользователя Isais

Adan75 написал:
Отлично, разве не должно быть ОДНОЙ версии программы, рабочей и со всеми скриптами, чтобы люди не путались? Ну, так обычно делают. : )

Еще раз обращаю внимание уважаемого собеседника на даты: последняя версия от 28.01.2010, предпоследняя - от 26.01.2010. А до того одна и лежала.
Adan75 написал:
Удобнее скачивать экзешник законченной правильной программы, а не того ....... что представляют из себя написанные на коленке проги.
Колхоз - дело добровольное. Не пользуйтесь, раз не нравится. Или напишите лучше. Тогда все будут пользоваться Вашей "законченной правильной программой, а не тем...", и будет Вам слава.

Хоть и FBE более архаичный и иногда ошибается, но если хорошо подготовить исх. текст, убрать кривые кавычки и длинные тире, то получишь стабильный результат. А к FBD еще надо приноровиться... виснет на Очень больших файлах... после аварийного завершения (в три пальца) вообще пришлось переустановить.

Олег Оранжевый написал:
Хоть и FBE более архаичный и иногда ошибается, но если хорошо подготовить исх. текст, убрать кривые кавычки и длинные тире, то получишь стабильный результат. А к FBD еще надо приноровиться... виснет на Очень больших файлах... после аварийного завершения (в три пальца) вообще пришлось переустановить.

Новая версия ФБЕ работает стабильно, а все эти замены тире, кавычек (и многого другого элементарно делаются уже установленными скриптами)

Ну да... я на это надеялся... только он отказался принять текст с неисправленными символами.

wotti написал:

Новая версия ФБЕ работает стабильно, а все эти замены тире, кавычек (и многого другого элементарно делаются уже установленными скриптами)

Я бы добавила "давно делаются".

golma1 написал:
wotti написал:

Новая версия ФБЕ работает стабильно, а все эти замены тире, кавычек (и многого другого элементарно делаются уже установленными скриптами)

Я бы добавила "давно делаются".

Совершенно верно. Я неправильно выразился. Имел ввиду, что в новой версии скрипты уже установлены и скомпонованы, и не нужно думать в какую папку их распаковать
Аватар пользователя s_Sergius

Олег Оранжевый написал:
Хоть и FBE более архаичный и иногда ошибается...

Это шутка, да? Весело.

Мдя... старею...

Здравствуйте. Я закачала на ftp девять книг Дика Фрэнсиса на английском в формате lit. К сожалению, в других форматах эти книги я не нашла, но очень хочется, чтобы в библиотеке они были. Поэтому большая просьба библиотекарям - если у кого есть возможность и желание, пожалуйста, сконвертируйте эти книжки в fb2 и залейте на сайт. Названия файлов начинаются с имени автора - Dick Francis.

Формат lit довольно таки паршивый. Его почти ничем нельзя прочитать без преобразования (есть только старючая прога Microsoft Reader PC, ну и "комбайн" Calibre), а на ридерах вообще невозможно. Тем более большинство книг на английском языке распространяются сразу в трех форматах — EPUB, MOBI и LIT. А EPUB читается практически на всех ридерах, т.к. что он предпочтителен. Так что вероятно эти книги можно найти и в других форматах.

PS: непонятно почему на Либрусеке запрещена заливка в Epub, ведь в этом формате, потенциально, есть около 500 тысяч книг на английском языке

Речь о том и шла, чтобы перевести редкий формат lit во что-либо более приемлемое, в идеале fb2 (это все-таки наиболее предпочтительный формат для библиотеки). Насколько я понимаю, сделать это не так уж трудно, используя вышеупомянутую Calibre или ABC Amber LIT Converter, почитать о которой и скачать можно здесь www.vamplation.easyforum.ru/viewtopic.php?id=127. Сама я программу скачала и, если понадобится, могу выложить, но вот использовать ее на кпк (пк нет) не получится:) Поэтому и прошу о помощи.

Calibre криво переводит файлы в Fb2, теряется структура заголовков документа, картинки неправильно переименовываются, да и вообще файл получается невалидным, приходится вручную допиливать.
Зато в Epub прекрасно конвертируется. Только я как понял, Либрусек не сильно заинтересован в иностранной литературе. Я предлагал залить несколько тысяч высококачественных файлов EPUB на английском и французских языках, но все морозятся или отказываются.

larin написал:
Сделал следующим образом. Библиотекари могут добавлять файлы любых типов. Все остальные - только популярных. На данный момент это: fb2, djvu, pdf, doc, txt, html, rtf, chm.
Хотели как лучше, а получилось как всегда.
CHM — Формат абсолютно не предназначен для книг, и нормально смотреть его можно только в винде. FBReader даже простые файлы криво отображает.
HTML — это вообще ужасный вариант. Книга может быть в формате HTML 3.2, HTML 4.0, XHTML 1.1, HTML5. Как читалке разобраться в этом? Зачастую это книги низкого качества или просто скопированные странички с интернета, а если еще есть картинки, то это получается тупо набор файлов.
TXT — Как исходник — очень плохо, надо гадать что и как должно выглядеть. А если еще файл с фиксированным форматирование — то вообще ужас.
А вот зато очень популярные на Западе форматы EPUB и MOBI запретили.

ravenger написал:
Я предлагал залить несколько тысяч высококачественных файлов EPUB на английском и французских языках

Простите за оффтоп, эти файлы можно взять на каком-то ресурсе, или это ваша личная библиотека?

Moon Cat написал:
Простите за оффтоп, эти файлы можно взять на каком-то ресурсе, или это ваша личная библиотека?

- книги от магазина Barnes & Noble — больше 2000 книг (в основном новинки), брал на IRC канале Undernet
- книги с сайта FeedBooks.com — больше 20000 книг (классика на английском и французском)
- книги с сайта EpubBooks.com — около 500 книг (классика на английском)

ravenger написал:
А вот зато очень популярные на Западе форматы EPUB и MOBI запретили.

Вообще-то это русскоязычная вроде библиотека. И форматы популярные там, не всегда популярны тут. А с вашими, я лично, вообще ни разу не сталкивался. Так что про "...как всегда." вы немного погорячились.

Star-zan написал:
Вообще-то это русскоязычная вроде библиотека.

Библиотека то русскоязычная, но это не значит, что книги должны быть только на русском. Многие люди изучают иностранные языке по книгам, а на Либрусеке даже Шекспира в оригинале толком нет.

Star-zan написал:
И форматы популярные там, не всегда популярны тут

Это да, но если формат популярен на западе, значит в нем есть много литературы на ихних языках

Star-zan написал:
А с вашими, я лично, вообще ни разу не сталкивался

Формат MOBI (он же prc, он же azw) формат разработанный компанией MobiPocket в 2000 году, а сейчас поддерживаемый Amazon. На нем продается около 500 000 книг, газет и журналов на английском языке. Поддерживается в ридерах Kindle, и других ридерах содержащих FBReader.
Формат EPUB — открытый формат, который разработали в 2007 году, и который является сейчас лидирующим на западе. Все крупнейшие издатели продают книги в этом формате. Два из трех крупнейших игрока на американском книжном рынке Sony и Barnes&Noble используют его как основной. Книги можно просматривать в программах Adobe Digital Editions, FBReader, CoolReader3, на сайте BookWorm. Так же формат читается почти на всех современных ридерах, включая наши PocketBook 301+ и lBook V3

Страницы

X