V170848 Два капитана
Опубликовано ср, 20/10/2010 - 11:37 пользователем Рыжий Тигра
Forums: Два капитана Изобилует ошибками сканирования/OCR - по 3-5 ошибок на страницу. На самом деле это не отдельный "с нуля" скан книги (равно как и его первоисточник - восьмой том "Библиотеки приключений" в формате .doc в библиотеке Ершова), а скопипизженный из более ранних источников текст, разбавленный иллюстрациями. По крайней мере, тексты этот и http://lib.rus.ec/b/68345 идентичны - отличаются только наличием-отсутствием точек в названиях глав. :-( Чтобы убедиться - достаточно поискать фразы из первого абзаца первой главы первого тома: "Двор сеял у самой реки, и по веснам", "а потом вода принесла и осторожно положила на берег я самого почтальона". Правильный, без "осканок", текст есть у Гугль-бука (http://books.google.com/books?id=GPsoPTBc7fsC&pg=PA7&dq=%22%D0%B0+%D0%BF%D0%BE%D1%82%D0%BE%D0%BC+%D0%B2%D0%BE%D0%B4%D0%B0+%D0%BF%D1%80%D0%B8%D0%BD%D0%B5%D1%81%D0%BB%D0%B0+%D0%B8+%D0%BE%D1%81%D1%82%D0%BE%D1%80%D0%BE%D0%B6%D0%BD%D0%BE+%D0%BF%D0%BE%D0%BB%D0%BE%D0%B6%D0%B8%D0%BB%D0%B0+%D0%BD%D0%B0+%D0%B1%D0%B5%D1%80%D0%B5%D0%B3+%D0%B8+%D1%81%D0%B0%D0%BC%D0%BE%D0%B3%D0%BE+%D0%BF%D0%BE%D1%87%D1%82%D0%B0%D0%BB%D1%8C%D0%BE%D0%BD%D0%B0%22&hl=ru&ei=AhO_TLeAOYKQjAf_oYWbAg&sa=X&oi=book_result&ct=result&resnum=1&ved=0CCgQ6AEwAA#v=onepage&q=%22%D0%B0%20%D0%BF%D0%BE%D1%82%D0%BE%D0%BC%20%D0%B2%D0%BE%D0%B4%D0%B0%20%D0%BF%D1%80%D0%B8%D0%BD%D0%B5%D1%81%D0%BB%D0%B0%20%D0%B8%20%D0%BE%D1%81%D1%82%D0%BE%D1%80%D0%BE%D0%B6%D0%BD%D0%BE%20%D0%BF%D0%BE%D0%BB%D0%BE%D0%B6%D0%B8%D0%BB%D0%B0%20%D0%BD%D0%B0%20%D0%B1%D0%B5%D1%80%D0%B5%D0%B3%20%D0%B8%20%D1%81%D0%B0%D0%BC%D0%BE%D0%B3%D0%BE%20%D0%BF%D0%BE%D1%87%D1%82%D0%B0%D0%BB%D1%8C%D0%BE%D0%BD%D0%B0%22&f=false) (как извлечь текст - не знаю; изображения страниц получить можно, но это 150 dpi от силы) и http://my-shop.ru/shop/books/441482.html (на странице ссылка "Заглянуть внутрь") (фрагмент - первые 20 страниц и оглавление). Если кто знает, где можно получить полный текст, - отзовитесь!
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Саша из Киева RE:Файл достаточно хорош. Нет смысла в его улучшении. Ага,... 1 день
Belomor.canal RE:Подайте бедному копеечку на книжку с литреса... 2 дня mazay RE:Sleepy Xoma - Bagⲣѱnoⲣojdennaѱ 3 дня zlyaka RE:С Новым годом! 4 дня Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 5 дней SparkySpirit RE:Прошу переформатировать, распознать, etc... 1 неделя SparkySpirit RE:Жорж Санд - переводы 19 века 1 неделя Саша из Киева RE:Наш дом - СССР 1 неделя babajga RE:Чернушка. Повести 1 неделя Саша из Киева RE:Сказки далёких островов 1 неделя babajga RE:Лопоухий бес 2 недели kopak RE:Таинственная личность админа Флибусты 2 недели babajga RE:Ежик покидает дом 2 недели babajga RE:Сказки бабушки Черепахи 2 недели babajga RE:Свист диких крыльев 2 недели Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 2 недели Саша из Киева RE:Турецкие мусорщики в Анкаре открыли библиотеку, полную... 3 недели Isais RE:Не тот автор 1 месяц Впечатления о книгах
polyn про Мартова: Одна смертельная тайна [litres] (Детективы: прочее)
05 01 Необычайно атмосферная книга, что даже я,обычно мало обращающая внимание на антураж, прониклась. Автор проделал гигантскую работу, изучая крестьянский быт середины 19 – начала 20 века российской глубинки. Оценка: отлично!
Дядя Морган про А. В. Панов
05 01 полёт Юрия Гагарина он тоже отрицал" И правильно отрицал, ведь Ю.Гагарин "Бога не видел", а значит небесной тверди не достиг, крутился где-то поблизости, в стратосфере.
Саша из Киева про Куанг: Отчий край [Quê nội ru] (Детская проза)
04 01 У книги Во Куанга "Отчий край" ("Quê nội") есть продолжение - книга "Tảng Sáng" ("Рассвет"). Но, к сожалению, на русский язык она не переведена.
slafan про Вадим Агарев
04 01 Написано грамотно. Но постепенно сюжет замедляется, непрерывная повторяемость действий ГГ уже надоедает, набор «шуток» один и тот же, все женщины от них ежедневно «выпадают из действительности», 90% текста - описание того, ………
Анни-Мари про Анна Леденцовская
04 01 Действительно, Леденцовская - так сладко, что слипается, и рояли рядами, причем не в кустах, а вместо них.))) Но читается неплохо.
Олег Макаров. про А. В. Панов
04 01 Кейсинг - непосредственный участник событий, нуи профессионал разумеется, не диванный эксперд" Только одно скажу: полёт Юрия Гагарина он тоже отрицал.
Oleg68 про Кобен: Вне игры [Fade Away ru] (Детективы: прочее)
03 01 Книга понравилась. Очередная интересная история про Майрона Болитара. Оценка: отлично!
187 про А. В. Панов
03 01 Как подметил sd_kozel, Кейсинг - непосредственный участник событий, нуи профессионал разумеется, не диванный эксперд. Кстати у автора вышла книга "Программа «Артемида»: Новый лунный обман США. Афёра 21-го века." - о очередной ………
kerch64 про Шамбаров: Как Царь Алексей Михайлович и Богдан Хмельницкий Украину освободили (Исторические приключения, История)
03 01 Книга" не историческая а продукт современной российской пропаганды. Исторические исследования не оперируют терминологией типа - "проглотить", "одолевать", "громил" и т.п. Все это создает нужный автору эмоциональный фон. ……… Оценка: плохо
Barbud про Тарханов: Объективная реальность (Исторические приключения, Самиздат, сетевая литература)
02 01 Начав читать главу 11, с удивлением узнал, что жену Сталина звали Светланой. Это точно не наш мир!)) Оценка: плохо
Олег Макаров. про Столичный доктор
02 01 Хорошая серия. Мне понравилась. Я, правда, не спец по выискиванию ошибок, я просто удовольствие от чтения либо получаю, либо не получаю |
Отв: V170848 Два капитана
Мне принесли книгу 8й том библиотеки приключений. Возьмусь вычитать и сверить, тем более, что это совпадает с моим желанием перечитать произведение. Сканировать вряд ли буду, но будем посмотреть... ;-)
Отв: V170848 Два капитана
Так что прошу прощения, что пытаюсь кого-то припахать, :-) но лучше отсканируй и поделись сырым сканом. 300 dpi, 8-бит серый, можно завернуть в JPEG 80-90%. Иллюстрации тоже имеет смысл переделать - их лучше сканить в 600 dpi и упаковывать беспотерьным сжатием (PNG); если поверх ч/б иллюстрации почёркано какими-ньдь карандашами или фломастерами - можно восстановить, но тогда её скан должен быть в цвете.
Я сейчас добиваю "Восставшую Луну" Хайнлайна, до конца недели сделаю и смогу заняться "Двумя капитанами": для начала отOCR'ю и сравню (кстати, давно пользуюсь вот таким способом - http://www.flibusta.net/node/83676#comment-192053), а если особого эффекта не даст - тогда уже буду делать по старинке, с вычиткой и правкой...
Отв: V170848 Два капитана
SergeyR, сорри, но личка, похоже, не ходит - отзовусь тут:
> причем предпочтительно именно в том виде и с тем текстом, как я его помню! ;-)
Дык аналогично! :-) Правда, я его читал в другом издании - серо-голубая картонная обложка с рисунком - Саня и Николай Антонович, - но рисунки были те же.
> думал, что глазами вычитать будет проще, а, теперь даже и не знаю...
Я на такое тоже нарвался - как раз когда купил сканер и сделал первые книги: http://lib.rus.ec/b/184697 и http://lib.rus.ec/b/184698 - они на процентов 80 совпадают, глазами я выловил по паре сотен опечаток, а на сличении двух файлов - где-то с полтысячи. С тех пор и держу на вооружении методику http://www.flibusta.net/node/83676#comment-192053 - помогает даже при вычитках с одного и того же текста, а тем более если это с разных сканов.
> думаю, что вряд ли нужно сканировать иллюстрации в 600 dpi, потом все равно ведь придется загрублять до 72.
Загрублять - да (хотя до 72 - это уже слишком). Но при прочих равных с 600-dpi'йной однобитной картинки можно с аккуратным сглаживанием уменьшить до 120-150-dpi'йной, с 300 dpi предел - 75, а с исходного 150 dpi даже 50-dpi'йная будет выглядеть довольно похабно. Это раз. Два - при 600 dpi при чистке исходного серого скана хорошо видна природа дефектов картинки - то ли это мелкая деталь изображения, то ли сопля от размазанной краски, то ли щепочка в бумаге; при 300 dpi этого не видно - приходится напрягать фантазию; да и дорисовывать погибшие мелкие детали при большом разрешении удобнее.
Вот в качестве примера - последний рисунок к книге "Сироты квартала Бельвилль" (все рисунки можешь глянуть здесь):
сырьё - 600 dpi, 256-серый:
готовый - 600 dpi, однобитный ч/б (день ушёл на чистку, но зато ж смотрится! :-) ):
готовый для книги - 133 dpi, 7 уровней серого:
(все три кликабельны и увеличиваются)
> но все равно частенько на месте раздела страниц бывают "тени" [...] Правда это существенно только для рисунков.
Для готовых рисунков - однобитных - это как раз пофиг, а при реставрации плавным градиентом плотности фона можно пренебречь, а перед формированием однобитного я такие вещи обычно затушёвываю/забеливаю вручную. Куда хуже - перекос линий возле корешка.
Кроме того, если сканируешь файн-ридером, то для текста надо включать режимы "делить страницы" и "исправлять перекос" - тогда ФР ищет что0то похожее на почти горизонтальные строки текста и "выпрямляет" их; представляешь, во что он может превратить рисунок? :-) А рисунки ФРом сканировать таки удобно - но в отдельный проход и с выключенными коррекциями и делением на страницы.
Кстати, картинки можно делать и без теней, и даже почти без геометрических искажений, если ложить книгу на сканер корешком вдоль хода каретки так, чтобы корешок был как можно ближе к середине каретки:
(серый - корпус сканера, тёмно-серый - стекло, синий - книга, красный - границы рисунка)
> Мне [...] оказалась приписанной как "автору" книга "Русская кухня: Традиции и обычаи" http://lib.rus.ec/b/191031
Кто-то уже успел исправить раньше, чем я до неё добрался.
Отв: V170848 Два капитана
Единственное, что меня хоть немного убеждает в необходимости 600-dpi'шного сканирования, так это возможная правка, конечно, природа дефектов будет видна лучше. А вот "72 - это уже слишком", почему "слишком"? никто же ведь не собирается печатать с fb2 (хотя такие вопросы-пожелания я слышал, но это уже, по-моему извращение...). А разрешение читалки, на которые fb2 и рассчитан, иногда или от 72 далек, или точки такого размера, что разрешение рисунка все равно не спасет. Вот сейчас "размер" страницы в скане получается что-то порядка 1800х1200 точек. Некоторые из рисунков книги такого же размера. Хорошо есть и мЕньшие. Да и в fb2 ведь рекомендуется делать иллюстрации, что-то порядка, не более 300х400, поправьте, если ошибся. Вот и получается, куда же еще бОльшее разрешение, только в расчете на гипотетическую правку.
Иль я в чем-то ошибаюсь?.. 8-)
Отв: V170848 Два капитана
Лично я привык делать 482×728 - такая картинка как раз умещается в страничку CoolReader 3.0.28 в полноэкранном двухстраничном режиме на "рабочем столе" 1024×768, а на экране "буки" остаётся с полсантиметра полей. Но уже перехожу на 580×740, благо последние раскопки :-) в алгоритме сжатия PNG позволяют упихать штриховую картинку такого размера в 50-100 килобайт. (Однобитная 600-dpi'йная полностраничная (2600×3800) штриховая иллюстрация, кстати, после чистки ужимается до примерно такого же размера.)
Отв: V170848 Два капитана
Ну в общем, как говорится: "Не прошло и года..." ;о) Книга наконец сделана, вычитана и выложена -
http://lib.rus.ec/b/241172
Спасибо Рыжему Тигре, что он сподвиг меня на сканирование, иначе вычитывание отняло бы куда больше времени и сил!
В принципе должен заметить, что каких-то глобальных потерь текста ранее имевшийся в библиотеке вариант не имел, разве что досадные ошибки типа: "дом сеял", да и то не слишком многочисленные.
Но все равно не жалею, что сделал работу заново. Зато теперь я в своей книге уверен, как это не глупо и не самоуверенно звучит... ;о)
Но все равно, если будут замечания просьба написать, сюда или в личку.
Более того, как уже написал в комментарии получил большое удовольствие от чтения, чего и вам всем желаю!
Отв: V170848 Два капитана
Отв: V170848 Два капитана
Спасибо огромное! И сподвигнувшему, а особо сделавшему!
Ещё может быть старую версию удалить стОит?