Вы здесьТекстовый pdf из сканов
Опубликовано чт, 09/12/2010 - 08:07 пользователем golma1
Forums: Текстовый pdf, сделанный из сканов, - намного удобнее для хранения и при вычитке, чем любой другой вариант. Я только не очень поняла, какие вопросы при этом возникают. ;)
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Aliki RE:Подайте бедному копеечку на книжку с литреса... 16 часов
kopak RE:О группе Дятлова. О той самой, того самого... 20 часов A5. RE:Не присылает пароль на почту 2 дня babajga RE:Плюмаж 1 неделя Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 2 недели babajga RE:Блошкинс и Фрю. Опасное путешествие 2 недели alexk RE:Багрепорт - 2 2 недели babajga RE:Удивленная сова 1 месяц Larisa_F RE:Серия «Квадрат» издательства «Текст» 1 месяц Aleks_Sim RE:Беженцы с Флибусты 1 месяц edvud RE:Прошу переформатировать, распознать, etc... 1 месяц monochka RE:С 8 Марта! 1 месяц babajga RE:Книга чуДОМищ 1 месяц ProstoTac RE:Подборка о Первой Мировой 1 месяц babajga RE:Нержавеющая сабля 1 месяц sem14 RE:«Уроки русского» 1 месяц Isais RE:Древний Рим. Подборка книг 1 месяц babajga RE:Отчаянная осень 1 месяц Впечатления о книгах
mysevra про Аксенов: Таинственная страсть. Роман о шестидесятниках (Современная проза)
14 04 Эти люди умели жить так, словно находились не в Союзе. Оценка: хорошо
mysevra про Сапковский: Ведьмак [«Сага о Геральте» – в одном томе, 2020 год] [сборник litres] (Героическая фантастика, Фэнтези)
14 04 Домучила, не в обиду будь сказано фанатам. Я бы остановилась на двух первых шикарных книгах, чтобы не портить впечатления, если бы знала, о чём будут следующие истории. Оценка: неплохо
mysevra про Мищук: Шептуха [litres] (Фэнтези, Любовная фантастика)
14 04 Плоское какое-то, девочково-подростково-кустарное. Оценка: плохо
Олег Макаров. про Главная роль
14 04 Сначала было умеренно интересно. Ну, так, если больше читать нечего, то читать можно. Стиль не ужасный, развитие сюжета присутствует = жвачка... Но когда в шестой книге ГГ создал КГБ и госплан, и стал мечтать о том что ………
Синявский про Марио Варгас Льоса
14 04 На 90-м году жизни скончался Известный лауреат Нобелевской премии по литературе Марио Варгас Льоса.
Саша из Киева про Полякова: Три с половиной оборота [litres] (Детективы: прочее)
13 04 nik_ol Может быть, есть ещё произведения Татьяны Поляковой, ранее не публиковавшиеся.
Саша из Киева про Тихомиров: Сказ об Иване Болотникове (Историческая проза)
13 04 Файл djvu этой книги почему-то не скачивается.
nik_ol про Донцова: Гризли в белых носочках [litres] (Иронический детектив, Детективы: прочее)
12 04 Неужели книги Донцовой стали выхожть раз в полгода? Сомневаюсь, я посмотрела, там много их снова у неё... Почему новое не выкладываете, уважаемые, а? Заждалась. ((( Оценка: неплохо
nik_ol про Полякова: Три с половиной оборота [litres] (Детективы: прочее)
12 04 А новых книг не будет больше, что ли?.. Оценка: отлично!
udrees про Мантикор: Сверхмиазмы (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература)
12 04 Хорошее продолжение серии. Она будет явно долгой, раз персонажи застряли на двадцатых уровнях, а упоминаются уровни сороковые и враги там тоже куда ужасающее. Сам персонаж так же друид и со своей лесной магией может удивить ……… Оценка: отлично!
udrees про Дорничев: Королям вход воспрещён. Том 6 [СИ] (Юмористическая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
12 04 Примитивно написано, на уровне детских сказок для взрослых. Стилистика такая же – «пошел, взял, сделал…потому что…а значит». В книге много внимания уделяется внешности женского пола, например вот так: «Ворота города распахнулись ……… Оценка: плохо
udrees про Дорничев: Стражам вход воспрещён. Том 5 [СИ] (Фэнтези, Попаданцы, ЛитРПГ, Самиздат, сетевая литература)
12 04 Написано примитивно, как детская сказка или пересказ компьютерной стратегической игры. Персонаж и его окружение развивают свою деревню, получают опыт, строят новые здания, прокачивают новичков, завоевывают и получают новых ……… Оценка: плохо |
Отв: Текстовый pdf из сканов
Не надо цитировать мультики, википедию, и растекаться мыслями. Мы и без википедии знаем, что TIFF - формат без потерь, а JPEG - с потерями. Еще с тех времен, когда вики не было. Речь не о теории, а о практике конкретной работы.
но по факту распознается не хуже
Отв: Текстовый pdf из сканов
Если знаешь, зачем тогда людей в заблуждение вводишь "голословными измышлениями"?
По какому факту?
У нас с Вами факты разные:
я Вам про Фому, Вы мне про Ерёмуя Вам факты привел, Вы сказали, что факты неправильные. Чем они неправильные? Они что, дают неправильный мёд? Или просто обзываете то, что неугодно Вам "неправильными" фактами.Я тоже по факту говорю: распознание с TIFF лучше, чем с JPEG,а Вы отвечаете: "Это всё теория, а на практике всё наоборот!"
Если бы я ничего не распознавал, я бы с Вами может и согласился, но мне тоже приходилось распознавать, и поэтому я знаю, что и практика говорит то же самое, что и теория.
Отв: Текстовый pdf из сканов
А вот не надо. Не надо замусоривать ветку по конкретному вопросу своими измышлениями.
Откройте новую и расскажите там всем о том, что JPEG 300dpi в оттенках серого ФР "не любит". В-)
Отв: Текстовый pdf из сканов
Да я бы, как грится, с радостью.
Но тогда в этой ветке останутся измышления niksi, на которые, как покажется, никто не дал отпор!
Так что приходится тут, что ж поделаешь...
Отв: Текстовый pdf из сканов
Читать умеешь? НЕ НАДО БЫЛО НАЧИНАТЬ. ТЕБЕ.
Еще раз. Джпеги 300 и тифы 300 распознаются примерно с одинаковым кол-вом ошибок. Одно не лучше другого. Хочешь оспорить - приводи примеры. Одних и тех же сканов, распознанных с тифоф и джпегов, с указанием кол-ва ошибок в одном и другом случае. В новой теме. Иначе говорить не о чем. Я с удовольствием признаю, что не прав, если это будет ДОКАЗАНО.
Отв: Текстовый pdf из сканов
Да, пожалуйста.
И я там обязательно напишу, что ВСЕ сканы, полученные мною от niksi и Ronja_Rovardotter, распознаются с минимальным количеством ошибок. В каком формате и с каким разрешением они сделаны, расскажут сами сканировщики. В-)
Отв: Текстовый pdf из сканов
Реплика убойная!
Я ж не знал, что на мою вполне невинную реплику будет столь громкий ор с
метанием какашекобзывааниями.Отв: Текстовый pdf из сканов
Давно я так не веселился. :-)
Отв: Текстовый pdf из сканов
(хихикает) Вот мне всегда кажется, что если я понимаю, то уже тогда точно и все понимают, а вот поди ж ты... Не бывает JPEG без потерь. Вот просто не бывает и все. Бывает сжатие с максимальным качеством. Ага, для JPEG-ов максимальным. )))
Отв: Текстовый pdf из сканов
Отв: Текстовый pdf из сканов
Видимо, необходимо все же отметить для тех, у кого еще не очень много опыта по оцифровке книг, что опытные и великолепные сканировщики, такие как niksi и Ronja_Rovardotter, и опытные и отличные OCR-щики, такие как Голма, обмениваются сканами именно в jpg, что значительно проще и быстрее. Такие сканы замечательно распознаются, и работать с их сканами - одно удовольствие.
Необходимо так же предупредить новичков об осторожности при принятии на веру утверждений и советов Zadd-а, т.к. в них энтузиазм и поспешность в суждениях, как правило, преобладает над знанием и умением. Полезно делать на это поправку, не отвергая, впрочем, и некоторой части его советов.
Отв: Текстовый pdf из сканов
Хм. Опробовал оба способа на 256-сером 300-dpi'йном скане, уже распознанном и (в меру возможностей ФР) вылизанном. У ФР получаются либо редкостно говённые картинки (даже акробат-ридер их через раз в упор не понимает), либо полноценные серые картинки, но сотни мег размера, зато с уже готовым текстом. У акробата - соответственно, ч/б картинки - ляля, размер на двух с чем-то сотнях страниц - меньше десятка метров, но текст никакой.
Ну и третий способ, который до сих пор юзаю, - выгрузить из файн-ридера однобитные ч/б картинки, их опять загрузить, распознать и сделать .pdf, - сочетает слабовыраженные недостатки предыдущих способов (картинка не особо хороша и текст так себе, размер в раза полтора побольше, чем после акробата).
А нельзя ли (ценой не чрезмерно больших трудозатрат) скрестить оба способа и получить файн-ридерный текст с акробатной картинкой?
Отв: Текстовый pdf из сканов
Сделать после распознавания в FR-е pdf по способу TaKir-а, но не для web, а с хорошим качеством, а потом ужать в Акробате готовый pdf?
Отв: Текстовый pdf из сканов
Отв: Текстовый pdf из сканов
Что-то Acrobat не хочет tiff-файлов...
Acrobat 9.0.0 а файлы цветные.
FineReader'ом из 75 страниц никак меньше 26 мегов pdf не получается.:(
Отв: Текстовый pdf из сканов
Таки получилось. Правда из другой книжки в сером цвете. 380 страниц - 15 Мегов. Очень хорошо.
Спасибо Голма!
Страницы