V170848 Два капитана
Опубликовано ср, 20/10/2010 - 11:37 пользователем Рыжий Тигра
Forums: Два капитана Изобилует ошибками сканирования/OCR - по 3-5 ошибок на страницу. На самом деле это не отдельный "с нуля" скан книги (равно как и его первоисточник - восьмой том "Библиотеки приключений" в формате .doc в библиотеке Ершова), а скопипизженный из более ранних источников текст, разбавленный иллюстрациями. По крайней мере, тексты этот и http://lib.rus.ec/b/68345 идентичны - отличаются только наличием-отсутствием точек в названиях глав. :-( Чтобы убедиться - достаточно поискать фразы из первого абзаца первой главы первого тома: "Двор сеял у самой реки, и по веснам", "а потом вода принесла и осторожно положила на берег я самого почтальона". Правильный, без "осканок", текст есть у Гугль-бука (http://books.google.com/books?id=GPsoPTBc7fsC&pg=PA7&dq=%22%D0%B0+%D0%BF%D0%BE%D1%82%D0%BE%D0%BC+%D0%B2%D0%BE%D0%B4%D0%B0+%D0%BF%D1%80%D0%B8%D0%BD%D0%B5%D1%81%D0%BB%D0%B0+%D0%B8+%D0%BE%D1%81%D1%82%D0%BE%D1%80%D0%BE%D0%B6%D0%BD%D0%BE+%D0%BF%D0%BE%D0%BB%D0%BE%D0%B6%D0%B8%D0%BB%D0%B0+%D0%BD%D0%B0+%D0%B1%D0%B5%D1%80%D0%B5%D0%B3+%D0%B8+%D1%81%D0%B0%D0%BC%D0%BE%D0%B3%D0%BE+%D0%BF%D0%BE%D1%87%D1%82%D0%B0%D0%BB%D1%8C%D0%BE%D0%BD%D0%B0%22&hl=ru&ei=AhO_TLeAOYKQjAf_oYWbAg&sa=X&oi=book_result&ct=result&resnum=1&ved=0CCgQ6AEwAA#v=onepage&q=%22%D0%B0%20%D0%BF%D0%BE%D1%82%D0%BE%D0%BC%20%D0%B2%D0%BE%D0%B4%D0%B0%20%D0%BF%D1%80%D0%B8%D0%BD%D0%B5%D1%81%D0%BB%D0%B0%20%D0%B8%20%D0%BE%D1%81%D1%82%D0%BE%D1%80%D0%BE%D0%B6%D0%BD%D0%BE%20%D0%BF%D0%BE%D0%BB%D0%BE%D0%B6%D0%B8%D0%BB%D0%B0%20%D0%BD%D0%B0%20%D0%B1%D0%B5%D1%80%D0%B5%D0%B3%20%D0%B8%20%D1%81%D0%B0%D0%BC%D0%BE%D0%B3%D0%BE%20%D0%BF%D0%BE%D1%87%D1%82%D0%B0%D0%BB%D1%8C%D0%BE%D0%BD%D0%B0%22&f=false) (как извлечь текст - не знаю; изображения страниц получить можно, но это 150 dpi от силы) и http://my-shop.ru/shop/books/441482.html (на странице ссылка "Заглянуть внутрь") (фрагмент - первые 20 страниц и оглавление). Если кто знает, где можно получить полный текст, - отзовитесь!
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
logusss RE:Координация сканирования и вычитки 4 часа
Моржехрен RE:Помогите найти!.. #2 1 день babajga RE:Кто сможет раздобыть и оцифровать нужные мне книги? 2 дня Isais RE:Мои открытия 3 дня aldan RE:Подайте бедному копеечку на книжку с литреса... 3 дня kopak RE:О группе Дятлова. О той самой, того самого... 5 дней A5. RE:Не присылает пароль на почту 1 неделя babajga RE:Плюмаж 3 недели babajga RE:Блошкинс и Фрю. Опасное путешествие 3 недели alexk RE:Багрепорт - 2 4 недели babajga RE:Удивленная сова 1 месяц Larisa_F RE:Серия «Квадрат» издательства «Текст» 1 месяц Aleks_Sim RE:Беженцы с Флибусты 1 месяц edvud RE:Прошу переформатировать, распознать, etc... 1 месяц monochka RE:С 8 Марта! 1 месяц babajga RE:Книга чуДОМищ 1 месяц ProstoTac RE:Подборка о Первой Мировой 1 месяц babajga RE:Нержавеющая сабля 1 месяц Впечатления о книгах
A5. про Норфолк: В обличье вепря [In the Shape of a Boar ru] (Современная проза)
22 04 Убеждаюсь: обалденный автор. Как и предполагалось, дикое количество объёмистых комментариев и пояснений в сносках отнюдь не облегчает процесс чтения сего опуса на ебуке. Но, как опять же и ожидалось, — удовольствие получено ……… Оценка: отлично!
A5. про Топор: Зима под столом [L'Hiver sous la table ru] (Комедия)
22 04 A5 в 12:30 ( 01:00) 30-01-2018, Оценка: отлично! Драма абсурда. Она бы и была просто весёлой, милой драмой абсурда с видимостью плавного перехода в комедию, если бы автор не приделал к ней вот такую концовку. Присовокупил ………
A5. про Якобсен: Чистая вода [Det nye vannet ru] (Современная проза)
22 04 A5 в 10:11 ( 02:00) / 16-07-2017, Оценка: отлично! Оченно понравилось. Атмосферно - скандинавия, дождь, снег, зябко, мрачно, безысходно, дух смятенный, характеры, исчезновение одного персонажа... Любителям холодной скандинавщинки ……… Оценка: хорошо
Barbud про Шалашов: Господин следователь. Книга 7 [СИ] (Альтернативная история, Исторический детектив, Попаданцы, Самиздат, сетевая литература)
21 04 Продолжается ровное и неторопливое повествование без особых драматизьмов, потрясений и неожиданных поворотов сюжета. Можно читать на сон грядущий, слегка убаюкивает. Отметил один анахронизм - ГГ лакомится пошехонским сыром, ………
Lan2292 про Сластин: Первый пользователь. Книга 1 (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература)
21 04 если вам нравится пересказ бродилки, может и зайдет, скучно.
mysevra про Свечин: Завещание Аввакума [litres] (Исторический детектив)
21 04 Интересно написано, декорации понравились даже больше собственно "детектива". Всё так степенно и благополучно, и руководство ценит, осыпает наградами и обучает - милота. Оценка: хорошо
mysevra про Нури: Волчий остров [СИ litres] (Ужасы, Самиздат, сетевая литература)
21 04 Изложено хорошо, истории занятные, но нет никаких завязка-развитие-кульминация-развязка, просто эпизоды. Оценка: неплохо
mysevra про Кейли: Жатва [litres] (Триллер, Детективы: прочее)
21 04 Невнятно описанный театр абсурда. Сплошной сумбур, и всё слишком узнаваемо, чтобы быть новым и оригинальным. Даже редактору поленились показать: автору все равно что "отринула", что "отпрянула"; какие-то скрепы в цепи и пр. Оценка: плохо
[email protected] про Степанова: Корень зла среди трав [litres] (Классический детектив, Детективы: прочее)
20 04 Серия неинтересная, какая то надуманная и далека от реальности Оценка: хорошо
nik_ol про Донцова: Кладбище чужих секретов (Иронический детектив, Детективы: прочее)
17 04 Спасибо огромное, что выложили! (❁´◡`❁) Оценка: хорошо
Sello про Раззаков: Другой Владимир Высоцкий (Биографии и Мемуары)
17 04 Литературный говномеситель. Мертвые сраму не имут. Тем более, что и ответить говномесителю покойный не может. Оценка: нечитаемо
Iron Man про Писарев: «Евгений Онегин» (Публицистика)
17 04 Почему эту статью не изучают в школе? Почему школьники до сих пор пишут бесконечные сочинения про эту якобы "энциклопедию русской жизни"? Оценка: отлично! |
Отв: V170848 Два капитана
Мне принесли книгу 8й том библиотеки приключений. Возьмусь вычитать и сверить, тем более, что это совпадает с моим желанием перечитать произведение. Сканировать вряд ли буду, но будем посмотреть... ;-)
Отв: V170848 Два капитана
Так что прошу прощения, что пытаюсь кого-то припахать, :-) но лучше отсканируй и поделись сырым сканом. 300 dpi, 8-бит серый, можно завернуть в JPEG 80-90%. Иллюстрации тоже имеет смысл переделать - их лучше сканить в 600 dpi и упаковывать беспотерьным сжатием (PNG); если поверх ч/б иллюстрации почёркано какими-ньдь карандашами или фломастерами - можно восстановить, но тогда её скан должен быть в цвете.
Я сейчас добиваю "Восставшую Луну" Хайнлайна, до конца недели сделаю и смогу заняться "Двумя капитанами": для начала отOCR'ю и сравню (кстати, давно пользуюсь вот таким способом - http://www.flibusta.net/node/83676#comment-192053), а если особого эффекта не даст - тогда уже буду делать по старинке, с вычиткой и правкой...
Отв: V170848 Два капитана
SergeyR, сорри, но личка, похоже, не ходит - отзовусь тут:
> причем предпочтительно именно в том виде и с тем текстом, как я его помню! ;-)
Дык аналогично! :-) Правда, я его читал в другом издании - серо-голубая картонная обложка с рисунком - Саня и Николай Антонович, - но рисунки были те же.
> думал, что глазами вычитать будет проще, а, теперь даже и не знаю...
Я на такое тоже нарвался - как раз когда купил сканер и сделал первые книги: http://lib.rus.ec/b/184697 и http://lib.rus.ec/b/184698 - они на процентов 80 совпадают, глазами я выловил по паре сотен опечаток, а на сличении двух файлов - где-то с полтысячи. С тех пор и держу на вооружении методику http://www.flibusta.net/node/83676#comment-192053 - помогает даже при вычитках с одного и того же текста, а тем более если это с разных сканов.
> думаю, что вряд ли нужно сканировать иллюстрации в 600 dpi, потом все равно ведь придется загрублять до 72.



Загрублять - да (хотя до 72 - это уже слишком). Но при прочих равных с 600-dpi'йной однобитной картинки можно с аккуратным сглаживанием уменьшить до 120-150-dpi'йной, с 300 dpi предел - 75, а с исходного 150 dpi даже 50-dpi'йная будет выглядеть довольно похабно. Это раз. Два - при 600 dpi при чистке исходного серого скана хорошо видна природа дефектов картинки - то ли это мелкая деталь изображения, то ли сопля от размазанной краски, то ли щепочка в бумаге; при 300 dpi этого не видно - приходится напрягать фантазию; да и дорисовывать погибшие мелкие детали при большом разрешении удобнее.
Вот в качестве примера - последний рисунок к книге "Сироты квартала Бельвилль" (все рисунки можешь глянуть здесь):
сырьё - 600 dpi, 256-серый:
готовый - 600 dpi, однобитный ч/б (день ушёл на чистку, но зато ж смотрится! :-) ):
готовый для книги - 133 dpi, 7 уровней серого:
(все три кликабельны и увеличиваются)
> но все равно частенько на месте раздела страниц бывают "тени" [...] Правда это существенно только для рисунков.

Для готовых рисунков - однобитных - это как раз пофиг, а при реставрации плавным градиентом плотности фона можно пренебречь, а перед формированием однобитного я такие вещи обычно затушёвываю/забеливаю вручную. Куда хуже - перекос линий возле корешка.
Кроме того, если сканируешь файн-ридером, то для текста надо включать режимы "делить страницы" и "исправлять перекос" - тогда ФР ищет что0то похожее на почти горизонтальные строки текста и "выпрямляет" их; представляешь, во что он может превратить рисунок? :-) А рисунки ФРом сканировать таки удобно - но в отдельный проход и с выключенными коррекциями и делением на страницы.
Кстати, картинки можно делать и без теней, и даже почти без геометрических искажений, если ложить книгу на сканер корешком вдоль хода каретки так, чтобы корешок был как можно ближе к середине каретки:
(серый - корпус сканера, тёмно-серый - стекло, синий - книга, красный - границы рисунка)
> Мне [...] оказалась приписанной как "автору" книга "Русская кухня: Традиции и обычаи" http://lib.rus.ec/b/191031
Кто-то уже успел исправить раньше, чем я до неё добрался.
Отв: V170848 Два капитана
Единственное, что меня хоть немного убеждает в необходимости 600-dpi'шного сканирования, так это возможная правка, конечно, природа дефектов будет видна лучше. А вот "72 - это уже слишком", почему "слишком"? никто же ведь не собирается печатать с fb2 (хотя такие вопросы-пожелания я слышал, но это уже, по-моему извращение...). А разрешение читалки, на которые fb2 и рассчитан, иногда или от 72 далек, или точки такого размера, что разрешение рисунка все равно не спасет. Вот сейчас "размер" страницы в скане получается что-то порядка 1800х1200 точек. Некоторые из рисунков книги такого же размера. Хорошо есть и мЕньшие. Да и в fb2 ведь рекомендуется делать иллюстрации, что-то порядка, не более 300х400, поправьте, если ошибся. Вот и получается, куда же еще бОльшее разрешение, только в расчете на гипотетическую правку.
Иль я в чем-то ошибаюсь?.. 8-)
Отв: V170848 Два капитана
Лично я привык делать 482×728 - такая картинка как раз умещается в страничку CoolReader 3.0.28 в полноэкранном двухстраничном режиме на "рабочем столе" 1024×768, а на экране "буки" остаётся с полсантиметра полей. Но уже перехожу на 580×740, благо последние раскопки :-) в алгоритме сжатия PNG позволяют упихать штриховую картинку такого размера в 50-100 килобайт. (Однобитная 600-dpi'йная полностраничная (2600×3800) штриховая иллюстрация, кстати, после чистки ужимается до примерно такого же размера.)
Отв: V170848 Два капитана
Ну в общем, как говорится: "Не прошло и года..." ;о) Книга наконец сделана, вычитана и выложена -
http://lib.rus.ec/b/241172
Спасибо Рыжему Тигре, что он сподвиг меня на сканирование, иначе вычитывание отняло бы куда больше времени и сил!
В принципе должен заметить, что каких-то глобальных потерь текста ранее имевшийся в библиотеке вариант не имел, разве что досадные ошибки типа: "дом сеял", да и то не слишком многочисленные.
Но все равно не жалею, что сделал работу заново. Зато теперь я в своей книге уверен, как это не глупо и не самоуверенно звучит... ;о)
Но все равно, если будут замечания просьба написать, сюда или в личку.
Более того, как уже написал в комментарии получил большое удовольствие от чтения, чего и вам всем желаю!
Отв: V170848 Два капитана
Отв: V170848 Два капитана
Спасибо огромное! И сподвигнувшему, а особо сделавшему!
Ещё может быть старую версию удалить стОит?