Нужен совет по форматированию

Речь идёт об этой книге: Поэтические сборники.
FBE не может открыть файл. Обычно в таких случаях я открываю при помощи FB Investigator, исправляю ошибки и тогда уже открываю в FBE.
Но в данном случае Investigator не находит никакой ошибки, кроме "namespace error; tree view is skipped". Т.е. файл открывает и при валидации выдаёт "no errors". Значит, никаких ошибок я исправить не могу, и файл по-прежнему не открывается в FBE.

У кого есть какие-то идеи?

Все равно, открой его в FBI и пересохрани. А затем уже, открывай в FBE.

Точно!
Спасибо.

В таких случаях, я поступаю следующим образом:
1. Проверяю книгу Fiction Book Validator`om, который с давних пор идет в комплекте с редакторами. Обычно его можно вызвать по правой кнопке.
2. Смотрю в какой строке и какая ошибка.
3. Открываю документ в обычном текстовом редакторе, у меня это EditPlus + файл подсветки синтаксиса.
4. Правлю ошибку вручную, сверяясь со схемами http://jurgennt.nm.ru/images/fb2.1schema.png http://jurgennt.nm.ru/images/fb2.1decription.png

Спасибо. Занесла ссылки в фавориты. ;-)

golma1 написал:
Спасибо. Занесла ссылки в фавориты. ;-)

Это не ссылки :-) Это картинки.

Это ссылки на картинки. :-Р
Во всяком случае, я их могу из фаворитов снова вызвать.
Или Вы хотите сказать, что следует их сохранить на диске, потому что их могут удалить оттуда, где они сейчас хранятся?

Лучшее и сохранить и распечатать. На А3. Очень удобно иногда, когда схемка под рукой, а не на компе. )

Угу. Наверное, Вы правы. Подумаю.
Спасибо.

golma1 написал:
Речь идёт об этой книге: Поэтические сборники.
FBE не может открыть файл. Обычно в таких случаях я открываю при помощи FB Investigator, исправляю ошибки и тогда уже открываю в FBE.
Но в данном случае Investigator не находит никакой ошибки, кроме "namespace error; tree view is skipped". Т.е. файл открывает и при валидации выдаёт "no errors". Значит, никаких ошибок я исправить не могу, и файл по-прежнему не открывается в FBE.

У кого есть какие-то идеи?


Строка & 134. ОСЛЕПИТЕЛЬНОЕ .
Использование символа & в fb2 не разрешено (считается ошибкой по namespace). При проверке файла (перед его загрузкой в FBI) парсер находит этот символ и ругается. Во время же загрузки этот "плохой" символ автоматом преобразуется в html-эквивалент (& amp;), который в fb2 допустим. В результате файл становится валидным, поэтому при нажатии на "validate" выдается "no errors".
Вообщем, загрузите этот файл, потом сделаете "save", и файл станет валидным. Но, судя по структуре текста, символ & там вообще лишний...

Да-да. Я сохранила файл в Investigator'e, а потом при вычитке увидела именно этот знак. Так что Вы правы.

Спасибо за желание помочь. :-)

golma1 написал:
в данном случае Investigator не находит никакой ошибки, кроме "namespace error; tree view is skipped". Т.е. файл открывает и при валидации выдаёт "no errors".
Если найти ошибку всё-таки надо (например, пересохранение не помогает) - в FBI рядом с кнопочкой "validate" (с жёлтой молнией) есть бокс со словом "schema" - надо ткнуть в слово, выбрать из списка "namespace" и вызвать валидацию ещё раз. Возможно, попался непарный тэг, или ещё что-то нехорошее - FBI ткнёт курсором в нужное место и подскажет причину.

Рыжий Тигра написал:
golma1 написал:
в данном случае Investigator не находит никакой ошибки, кроме "namespace error; tree view is skipped". Т.е. файл открывает и при валидации выдаёт "no errors".
Если найти ошибку всё-таки надо (например, пересохранение не помогает) - в FBI рядом с кнопочкой "validate" (с жёлтой молнией) есть бокс со словом "schema" - надо ткнуть в слово, выбрать из списка "namespace" и вызвать валидацию ещё раз. Возможно, попался непарный тэг, или ещё что-то нехорошее - FBI ткнёт курсором в нужное место и подскажет причину.

Ага. Увидела. Буду знать.
Спасибо.

Не за что: я не сам нашёл, мне тоже подсказали - с условием, что подскажу кому-то ещё. :)

Интересно, судя по приведенной выше схеме. Возможно создание таблиц. Не мог ли кто-нибудь дать ссылку на книги где использована эта возможность.

Вопрос не по форматированию, а скорее, по распознаванию.

Investigator сильно ругается: не определённый Entitat 'shy' (связано со знаками переноса).
Как избежать при распознавании? Или в случае невозможности - как убрать сразу во всём документе?

edit:
Иногда при открытии файлом редактора видно {&shy ;}
В этом случае всё решается просто. Но я не могу найти закономерность, когда это видно. От кодировки, вроде бы, не зависит.

Это символ для "мягкого переноса" в html. В доке удаляете его с помощью "замена": в найти вставляете из специальный мягкий перенос, а заменить оставляете пустым.

Аватар пользователя Captain Scarlett

А как его удалить из уже готового fb2 файла?

izaraya написал:
А как его удалить из уже готового fb2 файла?

Открыть файл в редакторе. Потом при сохранении опять указать формат fb2.

Самое то! Спасибо большое.

OCR pad (http://www.the-ebook.org/rus/?dl_id=29) поможет со склейкой и чисткой текста после ФР.
К нему файлик с регулярными выражениями (http://www.savefile.com/projects/808649681) настройки очистки и склейки надо добавить.
Также макрос мой для ворда (http://www.the-ebook.org/rus/?dl_id=30) - уже после OCR pad можно запускать.
Все чистенько получается почти на автомате.

TaKir написал:
OCR pad (http://www.the-ebook.org/rus/?dl_id=29) поможет со склейкой и чисткой текста после ФР.
К нему файлик с регулярными выражениями (http://www.savefile.com/projects/808649681) настройки очистки и склейки надо добавить.
Также макрос мой для ворда (http://www.the-ebook.org/rus/?dl_id=30) - уже после OCR pad можно запускать.
Все чистенько получается почти на автомате.

Только что опробовала на новой книге (правда, без Вашего макроса - жду Вашего ответа насчёт совместимости с Ворд2007) - очень удобно.
Ещё раз - огромное спасибо!

Скачала, буду разбираться. Спасибо.

А Ваш макрос для Word2007 работать будет, не пробовали? ;-)

golma1 написал:
Скачала, буду разбираться. Спасибо.
А Ваш макрос для Word2007 работать будет, не пробовали? ;-)

По идее должен, там ничего такого несовместимого нет - глобальные замены, для массы типичных случаев, проверенных опытным путем.
Если не заработает - удалить его не проблема.

ПС. файлик для окрпада надо кинуть в папку OcrPad\BookCleaner открыть нужный ртф, и подгрузить, нажав иконку метелки вверху, там появится кнопочка load. Указать нужный *.bcf. Он самый большой по весу. После чего нажать replace all.
Ртф с разделением на строки (но не на страницы) из ФР надо сохранять.
ППС. Можно и без "вы" ))

Будут еще вопросы - всегда готов ответить )

С файликом я разобралась - по аналогии со скриптами для FBE. А другие скрипты, которые там есть, Вы... ой... ты ;) используешь?

Макрос попробую тоже. Отпишусь.
Но позже, на другой книге. Эта уже готова. ;-)

Почти все другие "скрипты" неполнофункциональные... Пробные, так сказать...
Любой из них можно дополнить-улучшить или вообще свой написать.

Я так понимаю, что принцип написания тот же, что и в Investigator'e?

Там регулярные выражения используются.
Примерно как вот тут описано.
http://artefact.lib.ru/design/text_khozyainov.shtml
Там в папке help есть небольшой поясняющий справочник по их использованию:
OcrPad\help\RegExp.htm
Вроде здесь в библиотеке был справочник на эту тему.

Настольная книга. :)

Простейшие регулярные выражения я сама могу писать. А вот со сложными - тут я в себе не уверена. Предпочитаю проверенные. ;)
Спасибо за ссылку, прочту.

Очередная проблема. :(

Сделала книгу. Валидную. Во всех программах - no errors.
Но при сохранении в FBE появляется сообщение: "Сode 80004003 [ungültiger Zeiger]" в переводе с немецкого что-то типа "недействительный показатель".
При этом после сохранения, как обычно: "документ сохранён. ошибок не обнаружено".

Всеми известными скриптами подчистила - без результата. Оно бы всё ничего, коль файл валидный, но хочется понять, чего FBE ругается.

Возможно "недействительный указатель"? Это означает что где-то болтается "непривязанная" сноска.

"Ungültiger Zeiger" означает в компьютерном контексте "недействительный указатель". Это значит, что на каком-то этапе в памяти содержится не то, что должно бы. Означает как правило внутренний баг в приложении, в данном случае в FBE. Если известны координаты разработчика, то можно отослать ему, авось исправит в следующей версии.

Спасибо за быстрые ответы. Сносок. вроде, вообще нет. Но я ещё раз просмотрю на Source.

Это новая версия FBE. Может, и глючит.
Ещё раз спасибо.

Кажется, я нашла, в чём дело.
Сноски формируются по типу (конечно, БЕЗ пробелов после открывающих угловых скобок):
< a l:href="file:///C:/Program%20Files/FictionBook%20Editor2/main.html#n_6" type="note">[6] < /a>
Корректура на
< a l:href="#n_6" type="note">[6] < /a>
пользы не приносит, поскольку при новой загрузке файла восстанавливается первый вариант.

Может причина быть в этом? И как с этим бороться?

Как насчет снести нафиг сноски и расставить их заново?
А вот это: <a l:href="file:///C:/Program%20Files/FictionBook%20Editor2/main.html#n_6" type="note">[6]</a> - однозначный глюк FBE.

Так и сделала. Помогло.

Ещё один момент. После конвертации rtf при помощи any2fb2 при открытии файла сразу возникает такое же сообщение. А потом исчезает. Самопроизвольно. Загадка, блин!

X