Системы оптического распознавания текста в Linux - обзор и сравнительное тестирование | Либрусек

Вы здесь Главная » Блоги » Блог пользователя Sluggard Системы оптического распознавания текста в Linux - обзор и сравнительное тестирование Опубликовано чт, 14/04/2011 - 09:43 пользователем Sluggard В статье проведено сравнительное тестирование имеющихся систем оптического распознавания текста (OCR), доступных в Linux. Для полноты картины рассматривались как локально устанавливаемые программы, так и онлайновые сервисы. Вывод автора: При хорошем качестве распознаваемого материала все участвовавшие в тестировании программы обеспечивают высокое качество распознавания, причем снижение разрешения с 300 до 200 dpi практически не влияет на результат. В целом можно отметить, что широко распространенное суждение о том, что для Linux нет хороших систем оптического распознавания текста, сегодня уже не выдерживает критики. Читать статью Блог пользователя Sluggard Войдите или зарегистрируйтесь, чтобы отправлять комментарии Комментарии Отв: Системы оптического распознавания текста в Linux - ... Постоянная ссылка (Permalink) Опубликовано чт, 14/04/2011 - 14:25 пользователем justserge По ссылке - статья "Использование XML и JSON с Android: Часть 1. Преимущества JSON и XML для Android-приложений". Где правильная ссылка? Отв: Системы оптического распознавания текста в Linux - ... Постоянная ссылка (Permalink) Опубликовано чт, 14/04/2011 - 14:38 пользователем Sluggard Ой, простите мои кривые руки! Поправил. Отв: Системы оптического распознавания текста в Linux - ... Постоянная ссылка (Permalink) Опубликовано чт, 14/04/2011 - 14:57 пользователем justserge Цитата: ABBYY FineReader for Linux Полная версия программы стоит 149 евро. Триальная версия позволяет распознать 100 страниц. ABBYY Fine Reader Online Ранее он позволял после несложной регистрации распознавать бесплатно до 10 страниц в день, теперь же бесплатно можно распознать только три страницы сразу после регистрации, после чего необходимо платить. Минимальный пакет стоит 3$ за 20 страниц. Cuneiform По умолчанию в Ubuntu 10.10 доступна достаточно старая версия 0.7. Однако после добавления соответствующего PPA можно стать обладателем версии 1.0. Для Cuneiform написаны два графических интерфейса - YAGF и Cuneiform-Qt. GOCR Программа пока находится в ранней стадии разработки, поэтому имеет ряд серьезных недостатков (например, распознает только одноколоночный текст). Кроме того, изучение man-страницы показало, что опций, позволяющих задать язык распознавания, программа не имеет, что подтвердилось экспериментом - русский текст gocr пытается распознать как английский Ocrad К сожалению, поддержка русского языка также отсутствует напрочь. Поэтому из нашего сравнения программу исключаем. Tesseract Для tesseract имеется графический интерфейс tesseract-gui, который тоже надо собирать из исходного кода. У меня он запустился, но распознавать текст почему-то не захотел. Еще есть система OCRopus, которая может использовать движок tesseract. Собственно поэтому я ее отдельно рассматривать не стал. SILVERCODERS OCR Server Триальной версии для свободного скачивания нет, поэтому опробовать мне эту систему не удалось. Free OCR Размер загружаемого изображения ограничен 2 Мб. Поддерживаются форматы JPG, GIF, TIFF BMP и PDF (только первая страница, в скором времени обещают поддержку первых 10 страниц). Также, существует лимит на 10 изображений в час. OnlineOCR Минимальный пакет, который можно купить, составляет 10 страниц за 5 рублей.	Вход на сайт Имя пользователя * Пароль * Запомнить меня Регистрация Забыли пароль? Навигация Книги Издательские серии Премии Рекомендации Библиотечное ЧаВо Вычитка Про вычитку Технические темы Последние материалы Поиск по блогам и форумам Поиск книг Фильтр-список Популярные книги User menu Чёрно-белый список Книжная полка Последние комментарии logusss RE:Координация сканирования и вычитки 1 час Моржехрен RE:Помогите найти!.. #2 1 день babajga RE:Кто сможет раздобыть и оцифровать нужные мне книги? 2 дня Isais RE:Мои открытия 3 дня aldan RE:Подайте бедному копеечку на книжку с литреса... 3 дня kopak RE:О группе Дятлова. О той самой, того самого... 5 дней A5. RE:Не присылает пароль на почту 1 неделя babajga RE:Плюмаж 3 недели babajga RE:Блошкинс и Фрю. Опасное путешествие 3 недели alexk RE:Багрепорт - 2 4 недели babajga RE:Удивленная сова 1 месяц Larisa_F RE:Серия «Квадрат» издательства «Текст» 1 месяц Aleks_Sim RE:Беженцы с Флибусты 1 месяц edvud RE:Прошу переформатировать, распознать, etc... 1 месяц monochka RE:С 8 Марта! 1 месяц babajga RE:Книга чуДОМищ 1 месяц ProstoTac RE:Подборка о Первой Мировой 1 месяц babajga RE:Нержавеющая сабля 1 месяц Впечатления о книгах A5. про Норфолк: В обличье вепря [In the Shape of a Boar ru] (Современная проза) 22 04 Убеждаюсь: обалденный автор. Как и предполагалось, дикое количество объёмистых комментариев и пояснений в сносках отнюдь не облегчает процесс чтения сего опуса на ебуке. Но, как опять же и ожидалось, — удовольствие получено ……… Оценка: отлично! A5. про Топор: Зима под столом [L'Hiver sous la table ru] (Комедия) 22 04 A5 в 12:30 ( 01:00) 30-01-2018, Оценка: отлично! Драма абсурда. Она бы и была просто весёлой, милой драмой абсурда с видимостью плавного перехода в комедию, если бы автор не приделал к ней вот такую концовку. Присовокупил ……… A5. про Якобсен: Чистая вода [Det nye vannet ru] (Современная проза) 22 04 A5 в 10:11 ( 02:00) / 16-07-2017, Оценка: отлично! Оченно понравилось. Атмосферно - скандинавия, дождь, снег, зябко, мрачно, безысходно, дух смятенный, характеры, исчезновение одного персонажа... Любителям холодной скандинавщинки ……… Оценка: хорошо Barbud про Шалашов: Господин следователь. Книга 7 [СИ] (Альтернативная история, Исторический детектив, Попаданцы, Самиздат, сетевая литература) 21 04 Продолжается ровное и неторопливое повествование без особых драматизьмов, потрясений и неожиданных поворотов сюжета. Можно читать на сон грядущий, слегка убаюкивает. Отметил один анахронизм - ГГ лакомится пошехонским сыром, ……… Lan2292 про Сластин: Первый пользователь. Книга 1 (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература) 21 04 если вам нравится пересказ бродилки, может и зайдет, скучно. mysevra про Свечин: Завещание Аввакума [litres] (Исторический детектив) 21 04 Интересно написано, декорации понравились даже больше собственно "детектива". Всё так степенно и благополучно, и руководство ценит, осыпает наградами и обучает - милота. Оценка: хорошо mysevra про Нури: Волчий остров [СИ litres] (Ужасы, Самиздат, сетевая литература) 21 04 Изложено хорошо, истории занятные, но нет никаких завязка-развитие-кульминация-развязка, просто эпизоды. Оценка: неплохо mysevra про Кейли: Жатва [litres] (Триллер, Детективы: прочее) 21 04 Невнятно описанный театр абсурда. Сплошной сумбур, и всё слишком узнаваемо, чтобы быть новым и оригинальным. Даже редактору поленились показать: автору все равно что "отринула", что "отпрянула"; какие-то скрепы в цепи и пр. Оценка: плохо [email protected] про Степанова: Корень зла среди трав [litres] (Классический детектив, Детективы: прочее) 20 04 Серия неинтересная, какая то надуманная и далека от реальности Оценка: хорошо nik_ol про Донцова: Кладбище чужих секретов (Иронический детектив, Детективы: прочее) 17 04 Спасибо огромное, что выложили! (❁´◡`❁) Оценка: хорошо Sello про Раззаков: Другой Владимир Высоцкий (Биографии и Мемуары) 17 04 Литературный говномеситель. Мертвые сраму не имут. Тем более, что и ответить говномесителю покойный не может. Оценка: нечитаемо Iron Man про Писарев: «Евгений Онегин» (Публицистика) 17 04 Почему эту статью не изучают в школе? Почему школьники до сих пор пишут бесконечные сочинения про эту якобы "энциклопедию русской жизни"? Оценка: отлично! больше впечатлений