Вы здесьFineReader 11: вниманию книгоделов!
Опубликовано вс, 11/12/2011 - 06:12 пользователем golma1
Уважаемые коллеги! В ФР11 обнаружился серьёзный баг. А именно: фрагменты текста, распознанные в стиле "Оглавление", при сохранении напрямую в fb2 исчезают бесследно. Способов борьбы с багом, учитывая, что простая замена стиля (и даже объединение стилей НЕ в пользу "оглавления") ничего не приносит, оказалось немного. 1. После распознавания захожу в редактор стилей (рядом с названием стилей кнопка с сине-красной буквой "А") и смотрю, есть ли там стиль "Оглавление". Для полной уверенности сохраняю только эту страничку в fb2, чтобы проконтролировать сохранность фрагмента. Если кто-то найдёт более изящный способ побороть этот баг, пожалуйста, делитесь.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 4 мин.
Леди Стервa RE:Подайте бедному копеечку на книжку с литреса... 6 часов Isais RE:Древний Рим. Подборка книг 2 дня Isais RE:Семейственность в литературе 4 дня kopak RE:Таинственная личность админа Флибусты 1 неделя kopak RE:О группе Дятлова. О той самой, того самого... 1 неделя babajga RE:Ласси возвращается домой 1 неделя sem14 RE:Подборка о Первой Мировой 1 неделя Isais RE:удаление "двойников" 1 неделя Isais RE:Кармен Мола - Пурпурная сеть [litres] 2 недели Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 2 недели Isais RE:Катя Водянова - Дом и два жениха в придачу 3 недели Aleks_Sim RE:Прошу переформатировать, распознать, etc... 4 недели Isais RE:Дмитрий Анатольевич Горчев - ЖЖ Дмитрия Горчева (2009–2010) 1 месяц Саша из Киева RE:Детям о Ленине (Издание 1965 года) 1 месяц Саша из Киева RE:Приключения Мишки-Ушастика (Перевод Марата Брухнова) 1 месяц babajga RE:Белая княжна 1 месяц Isais RE:Файл достаточно хорош. Нет смысла в его улучшении. Ага,... 1 месяц Впечатления о книгах
iggy71 про Маканин: Валечка Чекина (Современная проза)
25 02 Писатель намеревался, видимо, создать загадочный образ провинциалки, "в которой что-то есть", и типа все хотят с ней познакомиться поближе, и она такая себе любвеобильная, духовная и проч. Автор ей симпатизирует, но вот образ ……… Оценка: плохо
konst1 про Рубина: Окна [Авторский сборник] (Современная проза)
25 02 Вдруг Борис заметил: – Между прочим, знаешь ли ты, что еще совсем недавно, в XVIII веке, жители Корнуолла промышляли таким вот способом: в особо сильный шторм выносили на берег большие фонари и расставляли рядами там, ……… Оценка: отлично!
Дей про Господин следователь
25 02 Очень интересно. Детективная и, скажем так, бытовая линии отличные, любовная же не понравилась. Влюбился с первого взгляда, лучше её нет (это ещё даже не разговаривал с ней ни разу), вот эти китайские церемонии с ухаживаниями ………
Олег Макаров. про Капба: Как приручить дракона - 4 [СИ] (Альтернативная история, Киберпанк, Фэнтези, Попаданцы, Самиздат, сетевая литература)
24 02 Капба прекрасен как всегда. Четвёртый том не хуже (лучше!) предыдущих, хотя казалось бы куда ещё. Очень отличная книга. Оценка: отлично!
obivatel про Калинин: Вторая Отечественная [litres] (Альтернативная история, Боевая фантастика, Попаданцы)
24 02 Автор датэл: "если именно благодаря революционерам Россия потеряла шанс выйти из нее в качестве главного победителя". . Если пишешь что-то о периоде, не поленись узнать как оно было. Царя опрокинули крупнейшие промышленники ……… Оценка: плохо
mysevra про Себастьянович: Новая книга о сыроедении, или Почему коровы хищники (Здоровье)
24 02 Подход для таких ленивых как я - нет обязательных самостоятельных чисток. «Мягким тканям потребуется не менее 2 лет, а скелету - около 7.» Непонятно, есть ли это время. Оценка: отлично!
mysevra про Артюшкина: Голем [litres] (Детективная фантастика, Социальная фантастика, Научная фантастика)
24 02 Такой замечательный мир, отличный язык, но невыносимо неспешное развитие событий – кажется вот-вот случится что-то значимое, а нет, очередной проходной момент. Оценка: неплохо
Isais про Абдуллаев: Заговор в начале эры (Исторический детектив, Политический детектив)
24 02 Скучно, нудно, нехудожественно. Вместо живых картин -- картонные декорации, никто из персонажей не вызывает эмоций -- ни любви, ни ненависти, каждый абзац сопровождается таким же по размеру морализаторским поучением, высказанным ……… Оценка: плохо
Nevskaya про Сушков: «Ленинградское дело»: генеральная чистка колыбели революции (Документальная литература)
22 02 Бралась за книгу с трепетом, родная тема, Блокада, Ленинград и все такое... Прочла со стыдом, дочитывала только потому, что не умею бросать начатое. Вранье сплошное, откровенное, бесстыжее, запредельное. Уже много где на форумах ……… Оценка: нечитаемо
Belomor.canal про Акунин: На санях (Современная проза)
22 02 Лучшая, самая лучшая книга Семейной Саги Оценка: отлично!
187 про Царевич: За Отчизну! (История)
21 02 Годная детская книжка, как и Приключения Каспера Берната в Польше и других странах. Оценка: отлично!
Дей про Воспитанник орков
21 02 Какой же ГГ тряпка и слюнтяй. Нет, он храбр и, в общем-то, довольно сообразительный, хоть и несколько тугодум, но он трясётся над жизнью каждой мрази, встречающейся на его пути. Он оставил за спиной несчитанное количество ……… |
Комментарии
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Потому что сразу в фб2 гораздо удобнее. Гораздо.
Отв: FineReader 11: вниманию книгоделов!
Я бы ещё после "Гораздо" поставила три восклицательных знака. ;)
Отв: FineReader 11: вниманию книгоделов!
А мне не понравилось...
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Кроме фб2, сохраняю в док (ред. копия), текст (формат. текст) и пдф. Любые пропажи/потери восполняются из копий.
Отв: FineReader 11: вниманию книгоделов!
Да, я тоже сохраняю в доке, редактируемой копией. И даже изготавливаю из него фб2, чтобы удобнее было сравнивать с полученным. Но работаю с файлом, полученным сохранением сразу в фб2.
Преимущества: нет проблемы с тире в диалогах, со списками (когда исчезают цифры), с потерей форматирования.
Пока набранная статистика сравнения говорит о том, что при исправлении бага со стилем "оглавление" ничего больше не теряется. Я ещё какое-то время понаблюдаю, но потом необходимость в изготовлении "контрольного экземпляра", надеюсь, отпадёт.
Кстати, ещё одна подробность: при сравнении файлов док (вернее, фб2, полученное из дока) и фб2 (полученного сразу из ФР) обнаружилось, что ошибки распознавания различаются.
Например: в доке "осколько" - в фб2 "о сколько", т.е. в доке отсутствует нужный пробел.
Откуда берётся - непонятно. :(
Отв: FineReader 11: вниманию книгоделов!
Напоролся на аналогичную граблю, когда (в ФР9) делал "Назад к Мафусаилу": длиннющая пьеса, часть имён персонажей распозналась с разрядкой, часть - с пробелами. Решил через левое полужопие, зато быстро: сохранил в .doc, из него опен-офисом в его родной XML'ный, открыл .xml руками, нашёл нужный стиль и заменил разрядку на жирность, опять открыл опен-офисом, сохранил в .doc, открыл m$ wordviewer'ом и скопипастил в FBE2.
Отв: FineReader 11: вниманию книгоделов!
Кстати в ФР11 напоролся на такую весчь: если ФР сам(!) не распознал сноску как "сноску", то заставить его это понять даже используя стиль "сноска" мне не удалось. Или текст сноски вставлялся непосредственно в текст, где и как ему вздумается, либо, если я выделил сноску отдельной областью, то может и вообще потеряться.
Может кто-нибудь научит: "Как с этим бороться?!"
Отв: FineReader 11: вниманию книгоделов!
Выскажите все претензии на их сайте http://finereader.abbyy.ru/forum/actualforum.aspx. Я там много чего высказал. Кое-что обещали исправить, кое-что подсказали.
Отв: FineReader 11: вниманию книгоделов!
В самой программе Вы ничего изменить не сумеете. Как Вам уже правильно подсказали, нужно жаловаться на сайте разработчика.
Для борьбы с этим багом есть два способа.
1. Положиться на ФР, а потом проверить каждую сноску, добавляя пропущенные.
2. При просмотре (я надеюсь, Вы просматриваете каждую страницу после окончания автоматического распознавания ;) ) переносить текст сноски к слову, заключая его (текст) в фигурные скобки. Потом, уже в fb2, они расставляются одним кликом при помощи соответствующего скрипта.
Каждый выбирает наиболее приемлемый для себя и для конкретного случая. :)
Отв: FineReader 11: вниманию книгоделов!
Спасибо за ответ!
Но чтобы ТАМ жаловаться нужно иметь как минимум лицензионную(!) версию. ;-) Я же, как думается и многие здесь, пока еще игрался с пиратской.
Подсказанные мне Вами способы "борьбы" мне известны и были используемы мною, только это как-то "не кошерно" что-ли. ;-) А потому предпочитаю "добрую старую" ФР9 с выводом текста в Word, с промежуточным редактированием и последующим ручным переносом в FBE (все равно получается ручная работа, что тут, что там, только в моем случае я сам контролирую работу и знаю, что я делал, а в случае ФР11 никто не знает что ему "взбрело в голову сделать" ;-) ).
Кстати еще один камень в огород ФР11: он почему-то отказывается запускать установленный у меня Word 2003 - "не находит" его! :-(
Отв: FineReader 11: вниманию книгоделов!
По-моему, это необязательно.
Но в любом случае: об этом баге уже сообщили.
Не могу с Вами согласиться. ФР11 работает в разы (!) быстрее и распознаёт текст значительно лучше. Кроме того, он поддерживает ручное форматирование: добавленный курсив/болд при сохранении в fb2 перенимается, чего не происходило в более ранних версиях при сохранении в доке.
Да и вообще у него много приятных фич: одно только объединение стилей чего стоит. ;)
А если добавить сюда решение проблемы "тире в диалогах" и списков, то, на мой взгляд, сравнивать обе версии просто не приходится. :)
Насчёт поддержки Word2003, похоже, это у Вас локальный баг. У меня работает. На одном компе стоит 2003, на другом 2007 - в обоих случаях без проблем.
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Кстати, если покупать с русской страницы, то за Home версию получается не так-то уж и много, что-то в районе $40-45. Imho, для большинства хоббистов-OCR-щиков сумма вполне "подъемная".
Отв: FineReader 11: вниманию книгоделов!
Home не умеет распознавать ни дежавюшки, ни PDF-ки, только отдельные картинки. Может ли она результат распознания сохранить в нечто удобочитаемое или нужен только копипаст? Короче, Home-версия - это заманка для дураков. Кто покупает Home, тому потом дают скидку 20% на Professional. Об этом у них на форуме где-то было написано.
Отв: FineReader 11: вниманию книгоделов!
Не знал; спасибо, что объяснил! Ну, что тут я могу сказать - они сами себе "злобные Буратино", в таком случае. Платить $170 за Pro версию - это, чисто психологически, для индивидуального пользователя слишком много. Значит, как воровали, так и будут воровать. Думаю, что в самом Abbyy они это прекрасно понимают, но держат такую цену, чтобы не демпинговать на корпоративном рынке.
Отв: FineReader 11: вниманию книгоделов!
Привет! Сохранять в fb2 - но это ничего не даёт - ни сносок, ни разделов! Зачем? Разумно в Word или OpenOffice.Writer а оттуда в fb2! Про плюсы FR11 - скорость очень возросла, много удобных мелочей - показ последней отсканированной страницы в процессе сканирования, и т.д.
Отв: FineReader 11: вниманию книгоделов!
Брехня
Отв: FineReader 11: вниманию книгоделов!
Судя по вашему собачьему юзерпику Вы хотели сказать - "Истинно так!" или можно разбивать на секции? Да или нет?
Отв: FineReader 11: вниманию книгоделов!
Судя по зековско-наркоманскому юзерпику, у вас другие интересы. ;-))
Как правило результат в фб2 разбит на секции и проставлены сноски. Не без ошибок. да. Но 90% проставлено верно.
Так, что не нужно "утверждать", а нужно просто попробовать и убедиться в своей неправоте
Отв: FineReader 11: вниманию книгоделов!
Любезностями обменялись! Но м.б. вы забыли или не знали, что "Беломор Канал" это знаковые (протестные!!!) папиросы для части НТР в прошлом веке! Но оставим это. Так в FineReader 11 можно указать как разбивать на секции при импорте в FB2? Интересно - надо попробовать!
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Что значит Если они корректно выделены на бумаге то есть что выделено на бумаге до сканирования? Если не трудно разъясните, это бы ускорило работу! Спасибо
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Слово библиотекаря - закон! Со следующей недели ухожу в Новогодний Запой до 10 января!
Отв: FineReader 11: вниманию книгоделов!
Привет всем! Читаю блог решил попробовать передать из F11 в fb2 напрямую - сноски перекинулись, но разбиение на главы ни в какую! Это есть или нет? Как этого достичь? Мне годится любой способ. Скажем для экспериментов с F11 я doc файл сохранял в PDF а потом его (PDF) "распознавал" в F11
Отв: FineReader 11: вниманию книгоделов!
Вообще-то это в первую очередь зависит от качества распознавания, которое, в свою очередь, зависит от множества параметров, не в последнюю очередь от гарнитуры, которой набрана книга.
Проверьте, каким стилем распознались заглавия. Если этот стиль везде одинаков, но НЕ заголовок, объедините его с одним из заголовков в пользу последнего.
Если стили везде разные и тоже НЕ заголовки, поменяйте в каждом конкретном случае на стиль "заголовок" (любой).
Должно помочь. :)
Однако, на самом деле, это не так существенно даже при том, что ФР не распознал правильно заглавия. В ФБЕ есть замечательный скрипт под названием "Разбиение на секции". Если главы начинаются с одинакового слова, например "Глава" или "Рассказ", то достаточно ввести в первую строку скрипта это слово и нажать на кнопку "Обработать" (или "Обработать и выйти"), то скрипт сам всё сделает.
Полезно перед словом ввести знак ^ - означающий начало строки.
Скрипты - наше всё. Надо только уметь их готовить. ;)
Отв: FineReader 11: вниманию книгоделов!
Уважаемая golma1! Так как все эти возможности ещё в процессе опробования, то создал тестовый файл и с ним пробовал разные варианты
Меня устраивает такой путь -
Спасибо за ответ! Посмотрим что нам ответят в эбби!
Отв: FineReader 11: вниманию книгоделов!
Насчёт стиля "Оглавление" в ААВВYY вообще-то уже было сообщено. И даже ответ получен. ;)
А вот о стилях для правильной разбивке на главы, это интересно. Спасибо. :)
Отв: FineReader 11: вниманию книгоделов!
Для художественной литературы, где количество сносок невелико, или в крайнем случае - умерено, я предпочитаю переносить текст сноски к слову.
В целом сохранение в fb2 мне нравится намного больше, чем сохранение в doc, после которого добавляются ещё и ошибки конвертации. ;)
Но это, опять-таки, вопрос личных предпочтений.
Отв: FineReader 11: вниманию книгоделов!
[quote golma1]Для художественной литературы, где количество сносок невелико, или в крайнем случае - умерено, я предпочитаю переносить текст сноски к слову.
Согласен - в отличии от реальной книги, где текст сноски как правило находится на той же странице перед глазами читателя, в e-book в него надо "нырнуть", что разбивает процесс чтения, плэтому полностью согласен с вами, что всякие пояснения типа перевода ин. слова qqqq (ффф - на лат. яз) переносятся к слову
Но тем самым меняем замысел автора а это не есть хорошо ;-)
Посмотрим что ответят, хотя ставлю 90% против 10% ничего не ответят
Отв: FineReader 11: вниманию книгоделов!
Согласен - в отличии от реальной книги, где текст сноски как правило находится на той же странице перед глазами читателя, в e-book в него надо "нырнуть", что разбивает процесс чтения, плэтому полностью согласен с вами, что всякие пояснения типа перевода ин. слова qqqq (ффф - на лат. яз) переносятся к слову
Но тем самым меняем замысел автора а это не есть хорошо ;-)
Ой, Вы меня неправильно поняли.
Я переношу текст сноски к слову при распознавании. Для того, чтобы уже в fb2 одним движением расставить все сноски, причём правильно. ;)
Поэтому итог - такой же, как и при разрешении ФР самому расставлять сноски.
По вопросу удобства пользования сносками: некоторые читалки отображают сноски внизу "страницы" (читай: экрана). Сам формат fb2 не задаёт форму выведения сноски, он лишь соединяет цифру и текст. Всё остальное зависит от желания (умения) программистов читалок. :)
Отв: FineReader 11: вниманию книгоделов!
[quote golma1]Ой, Вы меня неправильно поняли. Я переношу текст сноски к слову при распознавании. Для того, чтобы уже в fb2 одним движением расставить все сноски, причём правильно. ;)
Поэтому итог - такой же, как и при разрешении ФР самому расставлять сноски. По вопросу удобства пользования сносками: некоторые читалки отображают сноски внизу "страницы" (читай: экрана). Сам формат fb2 не задаёт фор
Понял, что не понял! Про e-book ( а не читающие программы) - при размере 6" внизу сноска? А разве есть такие? Тут некоторое время делал наблюдение кто чем и как читает в давке в общественном транспорте. Поразила меня одна девица щупленькая, небольшого росточка, которая в одной рук держала том Стига Ларссона (там наверное все три девицы были в одном флаконе) Всё спасибо!
Отв: FineReader 11: вниманию книгоделов!
Понял, что не понял! Про e-book ( а не читающие программы) - при размере 6" внизу сноска? А разве есть такие? Все lbook-и показывают примечания внизу страницы и 5 и 6-дюймовые - в последних прошивках там стоит coolreader. Если места на странице для показа всего примечания не хватает - прихватывается следующая страница.
Есть отдельные coolreader-ы для pocketbook-ов любой модели - 3xx, 6xx, 9xx - устанавливаются простым копированием во внутреннюю память и добавлением ссылок в ini-файл.
Это из тех, с чем сам имел дело.
Отв: FineReader 11: вниманию книгоделов!
Есть отдельные coolreader-ы для pocketbook-ов любой модели - 3xx, 6xx, 9xx - устанавливаются простым копированием во внутреннюю память и добавлением ссылок в ini-файл.
Это из тех, с чем сам имел дело.
Добавлю, что последняя версия AlReader2 тоже имеет опцию показа сносок внизу страницы. Работает под WindowsMobile.
Отв: FineReader 11: вниманию книгоделов!
Рассказываю о своём способе решения описанной в начальном постинге проблемы.
В редакторе стилей все "Оглавления" (если их больше одного) объединяю в один стиль (отметить все нужные стили и нажать кнопку вверху "Объединить").
Для полученного таким образом стиля устанавливаю маленький размер шрифта, полужирность, курсив и выбираю непривычный шрифт.
В результате встречающийся в тексте стиль "оглавление" резко отличается от основного текста, что облегчает его обнаружение. Не помню, писала ли, поэтому расскажу ещё раз.
"Инфицированную страницу" копирую в блокнот (не в Word! он сохраняется форматирование), а потом снова копирую - из блокнота в ФР. Если на странице есть форматирование, восстанавливаю.
Кстати, аналогичную процедуру стала проделывать со сносками, объединяя все стили в один и придавая ему атрибуты, резко отличающие от основного текста. Это позволяет легко обнаружить части текста в нижней трети страницы, отделённые от предыдущей части, если они распознаны как сноски, что случается довольно часто.
Иллюстрация:
Отв: FineReader 11: вниманию книгоделов!
уважаемая golma1! пож добавьте к списку глюков (т.к. вы МОЖЕТЕ :) им сказать)... во ВСЕХ версиях ФР (начиная с 6 и кончая 11), при распознавании украинских текстов, при встрече конструкции типа "молодчага. Її" ВСЕГДА определяется как "молодчага. її"... :(
а то уже задолбало вручную править...
Отв: FineReader 11: вниманию книгоделов!
Попробую. :)