Вы здесьПроблемы и приемы OCR: dewarp
Опубликовано ср, 06/05/2009 - 04:06 пользователем Ulenspiegel
Если при сканировании книжка не прижата плотно к предметному стеклу, участки строк, находящиеся вблизи разворота, искривляются. При сильном искривлении (заползание на уровень соседней строки) программы распознавания приходят от таких червячков в недоумение. Не знает ли всемогущий All алгоритмов и (что еще лучше) готовых программ для борьбы с таким безобразием ?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Aleks_Sim RE:Багрепорт - 2 4 дня
Telly RE:Подайте бедному копеечку на книжку с литреса... 5 дней babajga RE:Удивленная сова 1 неделя Larisa_F RE:Серия «Квадрат» издательства «Текст» 1 неделя Aleks_Sim RE:Беженцы с Флибусты 1 неделя edvud RE:Прошу переформатировать, распознать, etc... 1 неделя monochka RE:С 8 Марта! 1 неделя babajga RE:Книга чуДОМищ 2 недели ProstoTac RE:Подборка о Первой Мировой 2 недели babajga RE:Нержавеющая сабля 2 недели sem14 RE:«Уроки русского» 2 недели Isais RE:Древний Рим. Подборка книг 2 недели kopak RE:О группе Дятлова. О той самой, того самого... 2 недели babajga RE:Отчаянная осень 3 недели babajga RE:Сказки Сени Малины 3 недели babajga RE:Сказки 3 недели babajga RE:Мои четвероногие друзья 3 недели Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 3 недели Впечатления о книгах
ikravtso про Лэй Ми
20 03 Порядок книг неправильный. Исходя из содержания, Профайлер - вторая книга, Ящик Скиннера - третья, Клинок молчания -четвёртая (в ней даже дается ссылка на то, что предыдущие события описаны в книге Ящик Скиннера).
Belomor.canal про Свечин: Адский прииск (Исторический детектив)
20 03 Только было я списал статского советника и пожалуйста просто отменный роман! Этакие "Дети капитана Гранта" в пампасах Якутии - замечательное описание природы, подвигов первопроходцев, быта и т..д Плюс науч поп как вообще золото ……… Оценка: отлично!
дядя_Андрей про Господин следователь
20 03 В принципе, неплохо. Первые части прочитались достаточно легко. Начиная с четвёртой началась пробуксовка. А вот с пятой стало раздражать всё усиливающееся слюнокапанье ГГ на прислугу Нюшку/Анну/Аньку/Анну Игнатьевну. На каждой ………
decim про Варшавская: Эрмитаж. Ван Дейк. Набор открыток (Искусство и Дизайн, Живопись, альбомы, иллюстрированные каталоги)
20 03 Годится как иллюстрированный перечень. Это были недорогие наборы - одна открытка стоила 3-5 копеек - и издавались с 1950-х вот в таком качестве. В 1980 хороший альбом из лейпцигской типографии и стоил других денег, и в продаже поди найди. Оценка: неплохо
paradaise про Иван Александрович Белов
19 03 Очень талантливый автор!"Заступа-2" очень мрачный,что не отменяет юмор Белова и отличное темное фэнтези.Как подарок "Заступа-3" вышел.Почитаю и наверняка перечитаю.Пока все на 5 .Мастер слова!
Синявский про Даг Солстад
18 03 17 марта после непродолжительного нахождения в больнице ушел из жизни норвежский прозаик и драматург. Среди его произведений — «Военная трилогия», «Стыд и достоинство», «Т. Зингер», «Семнадцатый роман».
decim про Гэблдон: Чужестранка. Восхождение к любви [Outlander [= Cross Stitch] ru] (Исторические любовные романы, Любовная фантастика, Попаданцы)
18 03 Дамская сказка про любоффь. ЛФР как есть, и не худший образец. Рояли в кустах и кавалерия имеются в количествах, секс для дам - пожалуйста, бэкграунд - уточнить у Скотта В. и Бёрнса Р. Малость слэша тоже есть. Садомазо ……… Оценка: неплохо
nik_ol про Устинова: Детектив на краю лета (Детективы: прочее)
17 03 А что, у Поляковой больше ничего не выхожит? Вместе с её соавтором?..
gruin про Чайка: Купец из будущего ч.1 (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
17 03 Капитальная нудятина. Просто тошнит Оценка: нечитаемо
mysevra про Чайлд: Забытая комната [The Forgotten Room ru] (Научная фантастика)
17 03 Персонажи невероятно тупят, выдавая лежащие на поверхности факты за сверхумные озарения. Сплошное разочарование. Оценка: плохо
mysevra про Шемшук: Сыроедение – путь к бессмертию (Здоровье)
17 03 Такую разудалую пургу под одной обложкой редко встретишь. Тут и старость от слова star, и годовалые дети-мудрецы, и умершие от восторга деревья. И поработители, желающие уничтожить человечество, но доведшие популяцию уже до ……… Оценка: неплохо |
Комментарии
Отв: Проблемы и приемы OCR: dewarp
Насчет алгоритмов не знаю (хотя Файнридер вроде что то делает) но как вариант решения за $500 смотри тут: http://lib.rus.ec/node/131676
Отв: Проблемы и приемы OCR: dewarp
Э нет, кривой скан в данном случае - уже данность :( В смысле - готовый DJVU
Отв: Проблемы и приемы OCR: dewarp
В FineReader 8, которым я пользуюсь, в настройках "1. Сканировать/открыть" есть опция "Устранить искажение строк". Очень даже помогает.
В 9-й версии наверняка тоже есть.
Отв: Проблемы и приемы OCR: dewarp
Есть , "streighten lines" и "desкew" - кто из них кто уже не помню за ненадобностью.
можно на страницу провести операцию а можно применить ко всем , но я бы советовал постранично ибо некоторые страницы наоборот как раз портит.
Отв: Проблемы и приемы OCR: dewarp
Да вы чего, издеваетесь, панове ?! deskew - есть, это исправление перекоса (когда книжку положили непараллельно границам окна),
Отв: Проблемы и приемы OCR: dewarp
deskew - это совсем из другой оперы.
Возьмите ложку. Положите ее на стол под уголм 45градусов к краю. Исправьте положение ложки. А теперь СОГНИТЕ ложку поплам и попрубуйте исправить перекос относительно края тем же способом
Отв: Проблемы и приемы OCR: dewarp
В моем случае ложка выглядит примерно так: Я думал, что это именно warp
Отв: Проблемы и приемы OCR: dewarp
Я не издеваюсь , я же сказал что не помню, значит не deskew а второй - staighten text lines:
Отв: Проблемы и приемы OCR: dewarp
Теоретически в 8 и 9 Файнридерах имеется встроенный механизм коррекции:
На практике, выработанной на 4м ещё файнридере, лучшим удалителем искажений в зоне разворота служит левая рука, прижимающая книгу к сканеру в момент сканирования... :)
...Каких либо отдельных программ, позволяющих выпрямлять строки я никогда не встречал. Теоретически это можно проделать в фотошопе, но... страницу, пусть две. А сотню? Сомневаюсь.
Отв: Проблемы и приемы OCR: dewarp
АААА!!!! Спасибо, Jolly Roger - ака, и вправду есть! Они его спрятали неочевидным образом.
Если кто-нибудь еще на эти грабли наступит, тулза работает и выглядит вот так:
Отв: Проблемы и приемы OCR: dewarp
Дык а я о чем ?
Отв: Проблемы и приемы OCR: dewarp
Виноват, подумал, что она в опциях сканирования сидит.
Отв: Проблемы и приемы OCR: dewarp
Вроде бы именно такие искривления исправляет Book Restorer. Подробности на ru-board.
Отв: Спасибо!
Век живи - век учись... Действительно, есть и отдельная программа под задачу:
http://djvu-soft.narod.ru/scan/curved_text.htm
...как я понимаю, у неё настроек побогаче будет. Видимо, для сложных случаев может оказаться предпочтительней.
Отв: Проблемы и приемы OCR: dewarp
На сорсфорже была утилитка unpaper - она, кажется, умела автоматически делать обработку сканированных страниц, выравнивая картинки, зачищая поля и выравнивая интенсивность фона. Заодно резала на страницы, если сканировался разворот.
Отв: Проблемы и приемы OCR: dewarp
http://unpaper.berlios.de
А строки, AFAIK, не ровняет.
Но вобщем ничего, пользуюсь периодически.
Отв: Проблемы и приемы OCR: dewarp
Если нужно подготовить скан для создания дежавю, то лучше выпрямить строки программой BookRestorer. Там же можно сделать все остальное (чистка, обрезка и т. д.)
Отв: Проблемы и приемы OCR: dewarp
Покажите, плз, мне нормально выпрямленные букресторером строки
Я пробовал это делалать, у меня не получилось. У моих знакомых по ру-боарду тоже.
Отв: Проблемы и приемы OCR: dewarp
Показать в буквальном смысле не могу, т. к. не сохраняю исходники во-первых, и не помню какие именно строки были выпрямленыв во-вторых. Но этой функцией пользовался не раз и не два. Настройки дефолтные. Правда, изгиб касался максимум 3-4 строк внизу страницы. Обычно все же стараюсь прижимать книгу к сканеру :) Совсем уж бракованный скан проще переснять, чем маяться с ним.