Вы здесьХотим много книг, или сканировщики всех стран объединяйтесь!
Опубликовано пт, 04/12/2009 - 06:25 пользователем Lord KiRon
Последнее время озадачился вопросом попадания новых (да и старых) книг в сеть. Что мы имеем на данный момент? - Литресятину и разброд во всем остальном. Плюс еще последние события (вполне логично, однако все так же негативно) дробят наше сообщество сканировщиков и вычитывателей. В результате некоторые книги появляются и покупаются на разных сайтах по два-три раза некоторых совсем нет, люди делают лишнюю работу, за одно создавая потом лишние проблемы "библиотекарям". При всем уважении к Либрусеку, Флибусте, Песочнице , Huge-Library и многим другим я считаю что книги на первичную вычитку нужно брать в одном месте, и на данный момент таким наиболее подходящим местом явл;яется (в силу разных исторических причин) Библиотека Старого Чародея. Собственно речь о том что у них очень много книг, на "обработку" , даже больше чем людей и если вы можете помочь то загляните пожалуйста на главную http://oldmaglib.com/ справа или на форум http://bomanuar.com/forum/index.php?topic=231.0 и присмотрите себе книжку "в работу". За одно, если вы собираетесь купить какую то книжку, вначале проверьте на форуме http://bomanuar.com/forum/index.php?topic=231.0 - может она уже куплена , если вы купили какую то книгу то опять же пожалуйста отметьтесь там же чтобы не производить лишнюю ненужную работу. Да, и кстати , на Чародее применено очень удобное разделение труда - если вы например вычитываете но не имеете сканера и/или книг сканировать - то вы можете получить скан и вычитывать , если у вас есть сканер и книги а вы не имеете понятия как делать FB2 то вы можете отправить скан админу Старого Чародея и его сконвертирует и вычитает кто то другой. Короче, за работу товарищи ! :) Да, еще одна просьба, если вы не уверены что сможете сделать книгу в течении разумного периода времени (ну что то вроде месяца) то пожалуйста не беритесь за работу - этих книг ждут люди. Updated:
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
TaKir RE:Валерия Сергеевна Черепенчук А. Н. Николаева - Мифы... 17 часов
Isais RE:Древняя Греция. Читаем... 1 день Леди Стервa RE:Подайте бедному копеечку на книжку с литреса... 1 день laurentina1 RE:Ирина Александровна Велембовская - Немцы 3 дня Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 6 дней Саша из Киева RE:Избранное 1 неделя Alligatoreader RE:Багрепорт - 2 1 неделя fedor.de RE:Отображение страницы Librusek 1 неделя Isais RE:Чиполь Сергеевич Наглецов - Огненный дракон [СИ] 2 недели kopak RE:Таинственная личность админа Флибусты 2 недели blahblahblah2024 RE:Беженцы с Флибусты 2 недели sem14 RE:Что читать о блокаде Ленинграда. Подборка книг 2 недели sem14 RE:Михаил Юрьевич Берг - Андеграунд. Итоги. Ревизия_5 4 недели Oleg V.Cat RE:B343695 Александр. Книга 1 1 месяц Isais RE:Калибрятина/Самиздатина 1 месяц md2k15 RE:Относительно Вархаммер 40 000 1 месяц tvnic RE:"Коллектив авторов" 1 месяц SergL197 RE:Регистрация 1 месяц Впечатления о книгах
скунс про Дроздов: Зубных дел мастер (Попаданцы, Самиздат, сетевая литература)
03 12 Нормально читается,продолжение прочту Оценка: хорошо
kolombok про Попаданец в Таларею
02 12 Детский сад с трахом. В самом начале герою были выданы такие рояли, я думал ну может нормализуется. Я был не прав.
Isais про Крылова: Сказки Деда Мороза (Сказка, Самиздат, сетевая литература)
01 12 На Либрусеке нет тэга "Творчество умственно отсталых графоманов"? Только "Творчество душевнобольных"? Ради такого вот стоило бы завести... Оценка: нечитаемо
Iron Man про Ахмадулина: Свеча (Поэзия: прочее)
01 12 Из интервью с Беллой Ахмадулиной: «— Вы знаете, что останется от моих стихов? Останутся только... письма читателей. Своего литературного значения я никогда не преувеличивала. Я знаю, что была человеком своего времени и ………
S@iRus про Иноходец (Рымжанов)
01 12 У меня сложилось такое же впечатление, как и у Олега, о данной серии.
андрей169 про Шалашов: Господин следователь 1 [СИ] (Альтернативная история, Исторический детектив, Попаданцы, Самиздат, сетевая литература)
29 11 Забавная книга. Мне лично зашло хорошо. С продолжением обязательно ознакомлюсь. Оценка: хорошо
udrees про Баковец: Не тот господин 3 (Порно, ЛитРПГ, Самиздат, сетевая литература)
29 11 Книга строго для отдыха мозгов, тем кому нравится читать про влажные подростковые фантазии про гарем, воплощенные в реальность, и сексуальные подвиги, перемешанные с фэнтези. Герой настолько крут, что особо не заморачивается ……… Оценка: неплохо
udrees про Михайлов: Без пощады. Книга 3 [СИ] (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература)
29 11 Последняя книга из серии, но не последняя книга про месть киборга Вертинского. Написано в том же стиле, что и предыдущие книги. Описание во многом уделено экшену, поэтому всегда держит в тонусе, сражения, драки, убийства и ……… Оценка: отлично!
lukmak про Сочинения Иосифа Бродского в 7 томах
29 11 Бродский - гений. А кто его не понимает - что ж... Он непрост. Но, ребята, если вы его не понимаете - может, это ваша проблема?.. И пиндосы тут ни при чём.
nik_ol про Донцова: Амур с гранатой (Иронический детектив, Детективы: прочее)
27 11 Конечно, я рада, что книги Донцовой выходят и выходят, но неужели, если она сама их пишет, то не помнит, что «старичок» был не Коробков, а Гри, её первый муж, до Ивана в этой серии?! Или всё-таки литературные негры клепают?! Оценка: неплохо
neletay про Котов: Ценитель [СИ] (Городское фэнтези, Самиздат, сетевая литература, Приключения)
27 11 Прочитала только несколько первых глав - и уже очень, очень нравится. Нравится все - сюжет, стиль, язык, ГГ, а также автор, который за всем этим видится. С удовольствием читаю дальше, надеюсь не разочароваться.
Lan2292 про Ермаков: Май, весна и апокалипсис. Книга 1 (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература)
27 11 Так себе чтиво, но не скучно. Оценка: неплохо |
Комментарии
Отв: Хотим много книг, или сканировщики всех стран ...
"И незачем так орать"(с) - давно с ними работаю, но не очень плотно, ибо тематика не всегда интересна.
Отв: Хотим много книг, или сканировщики всех стран ...
Конечно можно вам выдать за это медаль :) но список "неназначеных" книг там довольно большой а это значит людей все же не хватает.
Отв: Хотим много книг, или сканировщики всех стран ...
Эрония умилила. Представляю, вашу эронию, если скажу, что вычитывал в свое время для Альдебарана со сканов Юстаса.
Понятно, что один человек не сделает все отсутствующие в сети книги. Но каждый может сделать ровно столько сколько сможет, не более.
Отв: Хотим много книг, или сканировщики всех стран ...
Две медали и орден ? ;)
Не будте букой :) и не надо мерится пиписьками. Просто тема была все же немножко не о заслугах сканировщиков а о координации на будущее.
Отв: Хотим много книг, или сканировщики всех стран ...
Пирожок с полки и "много книг"(с)
Мне наплевать на бронзы многопудье,
мне наплевать на мраморную слизь.
Сочтемся славою — ведь мы свои же люди,
— пускай нам общим памятником будет
построенный в боях социализм.
Отв: Хотим много книг, или сканировщики всех стран ...
Ну вот с этим я, пожалуй, не соглашусь.
Разные книжки бывают. И с кучей картинок, и с кучей ссылок, и с кучей цитат и вставных стихов. И не всех книжков ждут как горячих пирожков . Я вот у себя с книжной полки кое-каких японо-китайцев снял и рядом со сканером положил. Но с учетом семьи, детей и всякого другого-прочего, у меня одна книжка на 300 страниц от сканера до состояния fb2 кушается не менее чем за месяца 2-3-4.
Пример:
Году в 2003 в сети появились два первых тома Гэндзи, и они сопровождались комментариями, что третий том уже делается и вот скоро. Но тома 3-5 так и лежат по сю пору в поганого качества djvu. Поэтому я в начале этого года начал с пятого тома (чтобы меня не опередили с третьим). Пятый сделал, четвертый сделал, сейчас добиваю третий. А книжки (такие) тяп-ляп делать не хочется, - вычитываю по два раза и торопиться ну ни за что не буду, как бы их кто ни ждал. С 2003 года ждали (или не ждали, что тоже вероятно), и еще пару-тройку месяцев подождут. Зато будет качественный продукт. А опередит кто с третим томом - ну значит нога судьбы ...
Борис
Отв: Хотим много книг, или сканировщики всех стран ...
Я не спорю, именно по этому я сказал "разумного периода времени" а месяц это так, "навскидку" середнячек для стандартной книги.
Отв: Хотим много книг, или сканировщики всех стран ...
Отв: Хотим много книг, или сканировщики всех стран ...
То же самое. Два первых тома chm, но они уже давно есть в fb2 здесь и много где еще. 3 и 4 очень плохого качества осветленные djvu из сканов - ближе к корешку многие страницы нечитаемы (я не стал связываться и пересканировал), а 5-й том - djvu с фотографий - серая неконтрастность - однозначно перескан. Правда 5-й том там есть и распознанный - в виде кусков *.doc, но т.к. этот 5-й - примечание, то там важны иллюстрации и схемы, а они - увы, те же серые фотки. Хотя, по правде говоря, 5-й том в таком виде раньше мне в инете не встречался. Я прежде чем этим делом заняться, сеть, конечно, прочесывал.
Отв: Хотим много книг, или сканировщики всех стран ...
Когда-то, ещё в школьные годы, читал отрывки "Сказания..." в каком-то хрестоматийном сборнике древневосточной литературы. Давно уже ношусь с идеей взять и "прочувствовать всю его прелесть" (L) целиком. Но каждый раз отпугивают размер, многотомность и, главное, отсутствие третьего тома.
Жду с нетерпением! Могу оказать помощь с реставрацией иллюстраций.
Отв: Хотим много книг, или сканировщики всех стран ...
Это был, скорее всего, отрывок в переводе Конрада в одном из томов БВЛ.
За предложение помощи спасибо. Но иллюстрации, в основном, были в 5-м томе, который уже сделан. Сейчас я с помощью TaKir'а освоил работу с графикой, с помощью wotti (он кстати конвертил 5-й том) - конвертирование в fb2. Да и реставрация здесь не нужна. Иллюстрации - только заставки в начале и конце глав, обложки и форзац. У меня эти книги есть в бумаге и я их заново отсканировал в нужном мне качестве.
С книжкой надеюсь успеть до Нового Года, а если нет, то в каникулы уж точно доделаю, особенно если снега не будет.
Борис
Отв: Хотим много книг, или сканировщики всех стран ...
BorisJ,
Ты очень неправ, что оставляешь на потом сканирование книг только из-за того, что нет времени на вычитку.
Отсканируй и выложи в сеть, а распознавать и вычитывать будешь потом, так сказать версия номер 2 - в rtf/fb2/doc/txt
А версия номер 1 - djvu/pdf
И сам будешь доволен (не будет сдерживать тебя от выкладывания книг нехватка времени), и больше пользы будет всем.
Поверь, за один раз идеально все не сделаешь (с распознаванием и вычиткой), а так могут люди подключиться и помочь. А даже если и никто не распознает - все равно книга станет доступной, ведь даже 50 мб сегодня терпимо для книги, которую хочется прочитать, а в djvu при хорошем качестве - это будет всего 2 - 10 мб, в зависимости от размера книги и наличия иллюстраций. То есть вполне сравнимо с текстовой версией, а времени занимает - всего часа 2 - 5 на книгу (со сканированием, конвертацией и выкладыванием в сеть)! Представь, сколько книг может сделать один энтузиаст, и сколько людей будут благодарны!
Для djvu дам пару советов:
- перед конвертацией очень желательно увеличить размер страниц до минимум 400 dpi (это можно сделать в пакетном режиме в редакторе, просмотрщике или спец утилитой) - это не даст появится ошибкам и/н и т.п. (даже если книга была отсканирована в 300 dpi, не страшно - нужно просто увеличить изображения).
- страницы с многоцветными или серыми иллюстрациями лучше делать в djvu Photo режиме, или указывать при конвертации разрешение "150 dpi" для меньших искажений (djvu книгу можно собирать из отдельных страниц или кусков).
Надеюсь, что мысль в начале сделает тебя счастливее как сканировщика (не будешь мучиться комплексом незавершенной работы и отсканируешь-выложишь все книги, которые у тебя в планах очень быстро, а параллельно, потихоньку будешь распознавать и делать fb2).
Отв: Хотим много книг, или сканировщики всех стран ...
По ряду причинных обстоятельств я зачастую даже книгу сканю и распознаю по кускам - доступ к сканеру бывает ограничен. А потом есть у меня такое извращенное желание сделать самому книгу от начала до конца. Чтобы она радовала не только людей, но и меня. "Хочешь сделать хорошо - сделай сам." А то я тут уже имел пример, - сделал книжку (китайскую) с обложкой 200х300, там миниатюрка была такая неплохая. Так тут же нашелся некто, пережал обложку до размера почтовой марки и перевыложил более ничего не меняя. Сэкономил весу 70 кило, а книжку, с моей точки зрения, подпортил. Я берусь за книги, которые мне, мягко говоря, не безразличны. Вылизываю их очень тщательно. И делать я их хочу сам, так, как мне нравится и гарантируя качество конечного продукта. Это не свежая Донцова или 37-я длинная рука, я очень старенькие книжки делаю. Чуток можно и подождать.
Вот такой я злобный и занудный черт.
WBR, Борис
Отв: Хотим много книг, или сканировщики всех стран ...
Тогда тем более имеет смысл постараться не дробить работу, а отсканировать как можно больше за раз.
А это в результате значит, что сканы книг будут лежать на диске готовенькие и ждать очереди -> значит их можно конвертировать в djvu и поделиться, пока очередь до распознавания этих сканов дойдет.
Этого никак не избежать. Модифицируют и ужимают и doc/rtf, и djvu, и pdf. Можно писать обращение на обложке с просьбой не модифицировать, но запретить это никак не получится... Так что нужно принять это как данное, хочется или нет... :-(
Конечно можно. Но лучше, чем сверстанная бумажная книжка все равно скорее всего не выйдет. Правда для КПК лучше TXT, конечно, но, imho, нужно и графическую копию книги заливать - это же "оригинал", так сказать, для истории и сверки ( в хорошем качестве, само-собой).
И тут меня больше всего мучает то, что распознавание - длительный процесс, занимающий много времени и жизненных сил. Главное - он тормозит очередь сканирования. Из-за этого очень много книг никогда не дождется, чтобы их отсканировали... Поэтому я пришел к выводу, что процесс распознавания не должен мешать процессу выкладывания книг, пусть в начале в виде графических сканов. Многие люди не умеют/не имеют возможности сканировать - они могут взяться за распознавание наиболее необходимых книг. А самые важные можно и самим распозновать потихоньку.
Да ладно, ;-) злобные да занудные и не подумают с другими чем-то делиться, а это противоречит тому, чем ты занимаешься.
Отв: Хотим много книг, или сканировщики всех стран ...
Пока делаю так: сканю "про запас" файн-ридером (несколько часов на книгу), на скорую руку OCR'ю "на автомате" (полчаса-час) и в таком виде проект архивирую и на компакт-диск. Потом, когда появляется время, место или настроение, разворачиваю и продолжаю обработку. Недостаток: почти нереально отдать скан кому-то через инет из-за объёма.
А какие ещё есть способы?
Отв: Хотим много книг, или сканировщики всех стран ...
Перегнать в JPG 60%, запаковать и на файлообменник. В проэктах FR сканы хранятся в несжатых TIF, поэтому размер пакетов зашкаливает для серых за гиг. А так 1-2 метра на разворот хоть в сером, хоть в цветном. Правда при обработке SkanTalosov проблема вылезает - при конвертации в 600 dpi размер файла страницы под и за 50 метров.
Некоторые книги прилично выглядят при сканировании в ч\б 600 dpi.
Отв: Хотим много книг, или сканировщики всех стран ...
Загоняй в pdf.
30-50-80 метровые файлы гораздо проще передать, чем 500-1000 мб )
В ФР выделяешь все страницы, говоришь сохранить изображения, указываешь куда. Всего делов.
Сканить все в грей опять же не обязательно.
Книги без иллюстраций вообще бессмысленно в грэй сканить обычно.
А где иллюстраций не много - только нужные страницы в грей и сканить, ФР умеет выборочно в любой момент менять установки скана для разных страниц.
Отв: Хотим много книг, или сканировщики всех стран ...
Хотя... есть ещё один аспект: автодоворот страницы, чтгобы строки были горизонтальными - его ж тоже на иллюстрациях придётся выключать?
PS. Сканер HP-2410, родной софт и сканирование неродным софтом через интерфейс сканера чудовищно неудобны. Не подскажешь софтинку для удобного "однокнопочного" или "бескнопочного" сканирования картинок в последовательный набор файлов - типа "раз настроил и все рисунки сосканил"?
Отв: Хотим много книг, или сканировщики всех стран ...
Бывает, кто бы спорил.
Но по собственному опыту - очень не часто.
В сомнительных случаях надо проверять качество на паре-тройке разворотов )
Чем же тебе ФР не угодил?
Скань пакетно рисунки в отдельный пакет, с любыми нужными настройками ) Только успевай листать ))
Как из ФР вынуть картинки ты теперь знаешь )
Отв: Хотим много книг, или сканировщики всех стран ...
Теперь буду умнее - FR'у буду скармливать только grey: скорость скана та же, а глюков меньше.
Кстати, делись опытом: насколько хуже FR работает, если автокомпенсацию отключить вовсе?
Отв: Хотим много книг, или сканировщики всех стран ...
Подкладывай черные листочки сзади сканируемых страниц ) Особенно при скане картинок и плохой бумаге.
Я тонкий черный пластик от офисных папочек использую.
(типа такого: http://www.mamtd.ru/files/antikrizis/r150big.jpg)
И яркость скана поменяй, если бледные страницы - тогда все ок будет. ))
Скань картинки отдельно ) После скана всей книги.
В этот же или в отдельный пакет. С нужными настройками. Быстрее будет.
Зависит от кривизны, но не очень сильно хуже.
Отв: Хотим много книг, или сканировщики всех стран ...
ПОМОЛИТЬСЯ НЕ ЗАБУДТЕ.
Отв: Хотим много книг, или сканировщики всех стран ...
TaKir, сенькс за все подсказки!
Отв: Хотим много книг, или сканировщики всех стран ...
Ты не понял. Я говорю о том, что пока сканы ждут распознавания, стоит выложить отсканированную книгу в Интернет (в каком виде - дело десятое, главное, чтобы она стала доступна другим пусть даже в виде картинок; а так - хоть в JPEG, хоть в Djvu, хоть в PDF, хоть в Jpeg2, не в этом суть). Разумеется, тебе более будут благодарны за более компактный вариант (а DjVu самый компактный, если не использвать его Photo режим, иначе Djvu Photo сравним с Jpeg2 и новым PDF по размеру - т.к. в них используются схожие технологии).
Не советую ужимать Jpeg до 60%, т.к. уменьшение несущественное, но возникают такие сильные артефакты, что может быть даже просто уменьшение разрешения будет эффективнее. Оптимальная цифра для Jpeg - 95%. Но я лично сканы сохраняю в TIFF, сжатый по LZW, а Файнридером не сканирую, а если перевожу в Jpeg, то стараюсь 100% или 98%, но никогда не ниже 90%. Все-таки это raw-образцы, их не стоит портить.
Сканировать в черно-белом, как тут предлагают, очень нежелательно, а при 300dpi - ни в коем случае нельзя! Такая книга потом только для распознавания, но не годится для хранения сканов или выкладывания в djvu/pdf. Скорость сканирования на 300 dpi не зависит от цветности, но серый скан можно увеличить, а моно-скан - это как сканирование при сером 100dpi с последующим увеличением до 300 и конвертацией в черно-белый. Книги, отсканированные в монохроме и выложенные потом в djvu - это мусор, их читать невозможно.
Отв: Хотим много книг, или сканировщики всех стран ...
Отв: Хотим много книг, или сканировщики всех стран ...
А вот выкладывают... Даже 150 dpi...
Что касается зачем выкладывать сканы (конечно, в приличном dpi) - один человек не способен распознать столько книг, сколько может насканировать. Поэтому часть книг останется недоступна другим - меняются обстоятельста, настроение и т.п., и сканы остаются похороненными в архивах. В то же время эти сканы давно могли бы уже быть распознаны и вычитаны с помощью добровольных помошников-читателей. А даже если и не распознаны, то и в таком виде уже давно бы приносили пользу заинтересованным в них людям...
Отв: Хотим много книг, или сканировщики всех стран ...
Побольше бы таких чертей. Когда берешь почитать книгу, а там куча ошибок из-за того, что оцифровщик не сделал вычитку - просто зло берет. Книга откладывается в сторону. В общем, Борису респект.
Отв: Хотим много книг, или сканировщики всех стран ...
Уважаемый Lord KiRon. Книжку отсканили, Вахмурка довёл до фб2. Что ж у нас-то её нет. Это я про Ластбадера, серия: Жемчужина, Вуаль тысячи слёз.
Отв: Хотим много книг, или сканировщики всех стран ...
Где "у нас"?
Тут? Ну так залейте сами http://oldmaglib.com/feedback/feedback.php?id=2694 , дело секундное, вообще обычно кто то, кажется Igorek67 но не уверен, все время перетаскивает книги сюда, может зевнули.
Кстати спасибо вам за работу.
Вообще удивляюсь я народом, я пытаюсь организовать работу над книгами, для всех собственно, а тут же возникают какие то подозрения, претензии и т.д. ...
Вообще почему именно "Старый Чародей" - да не почему, просто у них оно наиболее удобно на данный момент организовано а начинать новое на пустом месте - только дробить силы.
Отв: Хотим много книг, или сканировщики всех стран ...
Тут на Либрусеке. Заливаю. Только изменил название серии - на Олдмаге - англ. вариант, здесь - Жемчужина. Первая книга в этом названии серии лежит. Если не понравится - поменяю для всей этой серии.
Отв: Хотим много книг, или сканировщики всех стран ...
Вопрос в том что есть библиотеки, они разные, плохие, хорошие, удобные, не очень, платные, бесплатные, с подпорченной репутацией ;) и т.д. Однако они именно библиотеки а нам нужно что то вроде "переплетной мастерской" или (не услышь меня Литрес) "издательства" чтобы книги могли попадать в эти самые библиотеки, и это совсем не одно и то же.
Отв: Хотим много книг, или сканировщики всех стран ...
Нет, не я перетаскиваю.
Отв: Хотим много книг, или сканировщики всех стран ...
Про Ластбадера.
Я конечно прошу прощения, но книга добавлена ещё : 25.10.2009.
Upd. Сорри, не понял что Либрусек. :-)
И вообще, библиотека с некоторых пор не зациклена на жанрах. Да, основным является фантастика. С моментам скана мной всего Квина и всего Карра стало много классических детективов, мистика и пррключения благодаря никси тоже вырываются на первые позиции. Были бы вычитывальщики, можно было бы говорить о более широком спектре. Но пока их не хватает.
Про сроки - для фантастики никаких ажурных оформлений обычно не надо и затягивание вычитки на месяц я считаю немного некорректным. Да, книга может не понравиться. Но вычитывальщик должен в первую очередь вычитыавать, а не читать. И понимать это при "поднимании руки" всё же необходимо.
Отв: Хотим много книг, или сканировщики всех стран ...
Отв: Хотим много книг, или сканировщики всех стран ...
Есть те, кто если книжка не нравится читают/вычитывают её месяцами. Она ж не нравится. Психологически я это вполне понимаю. Но... Неправильно это. Проще вернуть тогда. Другие возьмут.
Отв: Хотим много книг, или сканировщики всех стран ...
И всё-то вокруг фантастики... А то, что есть другая литература, об этом почему-то забывается.
Отв: Хотим много книг, или сканировщики всех стран ...
Там вообще то 4 направления: фантастика, фэнтази, детективы и приключения; иногда еще исторические и детские. Согласен не самый полный набор но все же на чистая ф/ф.
Отв: Хотим много книг, или сканировщики всех стран ...
Вообще тут какой еще момент, возможно я упустил его в начальном посте - я не призываю переходить на "Старого Чародея" читателей для них есть Либрусек, Флибуста и прочие, "Старый Чародей" это в первую очередь библиотека созданная теми кто конвертирует книги. Соответственно удобна она в первую очередь не читателям (им то лучше здесь) а тем кто "работает" над книгами. Это ведь не просто место где берутся книги ето место где встречаются люди с определенными знаниями и определенным кругом интересов завязанным на оцифровке книг. Там вам могут помочь, там вы можете разделить с кем то работу, пообщатся, не как читател а именно как оцифровщик.
Понятно этим можно заняться и тут, но ваш вопрос или запрос скорее всего пропадет среди тысяч других обсуждений на миллион разных тем, а там люди занимаются именно оцифровкой.
Не думаю что это была изначальная цель Чародея но так уж сложилось и грез это не использовать.
Кстати это же относится и к вопросу о жанрах - не важно какие именно жанры собирает Чародей, это для читателей, для оцифровщиков это же место встречи и обмена и по этому можно договорится о любом жанре а выложить потом куда угодно.
Отв: Хотим много книг, или сканировщики всех стран ...
publ.lib.ru - Библиотека Ершова - много книг в очень хороших doc, html, djvu
Часто одна книга в нескольких форматах выбирай на вкус.
Например:
(http://publ.lib.ru/ARCHIVES/D/DUROV_Vladimir_Leonidovich/_Durov_V._L..html)
Частенько оттуда книги конвертировал.
Разделы разные - от детской до научки. Не олдмаглибом, единым, как говорится.
Сам могу желающим подкинуть и на распознавание, и на вычитку.
Штук 100 книг в ближайшей очереди на скан.
Отв: Хотим много книг, или сканировщики всех стран ...
Если можете, скиньте список в личку, когда время найдется.
Отв: Хотим много книг, или сканировщики всех стран ...
господа, вы бы выложили краткое руководство для юных сканировщиков:) к примеру у меня есть сканер, есть энное количество книг, которых нет в сети, но
1) отвратительная программа распознавания текста (хотя может это у меня руки кривые),
2) я не понимаю разницы межу doc и rtf
3) не умею делать fb2 (впрочем, где-то просили не делать, если не умеете)
4) не умею делать pdf
да, это мои личные проблемы, но если сделать небольшую памятку с пошаговой инструкцией сканов было бы больше - моих по крайней мере. потому что сейчас 80% книги приходится перепечатывать вручную.
Отв: Хотим много книг, или сканировщики всех стран ...
Тады вам в сканировщики :)
Попросту говоря сканируете в 300DPI (или больше но обычно не нужно) greyscale и результат посылаете через какой ни будь файлообменник админу "Старого Чародея" (в смысле линк) - он выложит название на сайте и кто то желающий сделает из этого DOC а затем он же (или другой) FB2. Так оно и работает.
Ну а захотите научится оцифровывать объясним потихоньку ;)
Отв: Хотим много книг, или сканировщики всех стран ...
Посмотрите инструкцию, которую aldio написал:
http://bomanuar.com/forum/index.php?topic=233.0
Может найдете часть ответов.
Отв: Хотим много книг, или сканировщики всех стран ...
А у вас сканер в пдф не сохраняет?
Отв: Хотим много книг, или сканировщики всех стран ...
А у вас сканер в пдф не сохраняет?
Отв: Хотим много книг, или сканировщики всех стран ...
А в pdf - это, пожалуй, лишнее. Во-первых, не сканер пишет в PDF, а его софт; во-вторых, не факт, что при сохранении в PDF не снижается разрешающая способность, количество градаций серого и т.д. (а поставляемое со сканерами ПО, как правило, не имеет настроек, влияющих на эти параметры). Т.о., в общем случае, "автоматический" PDF менее пригоден для OCR, чем сырые необработанные сканы.
Отв: Хотим много книг, или сканировщики всех стран ...
нет, сохраняет в tif, оттуда можно копипэйстом перекинуть в ворд. только потом большую часть текста придется перепечатывать вручную - нечитаемый набор букв. где-то 1\3 - 1\4 текста получается нормальной - нужна лишь лёгкая правка.
Отв: Хотим много книг, или сканировщики всех стран ...
То ли я чего то не понял то ли полный бред :) Если не бред то пришлите мне пожалуйста свой копипэйст вынимающий буквы из TIFF-a - я даже готов заплатить :)
Отв: Хотим много книг, или сканировщики всех стран ...
Осчусчение дежавю, однако )
Мне один мутный гражданин год или больше назад тут в каком-то топике про скан долго втирал что-то подобное - типа программе пофиг, что там на отсканенной картинке, она сама во всем разберется. (Топик был про распознавание какого-то жуткого качества дежавю - "Тайна болотных демонов" вроде бы).
Я тоже готов был заплатить за мастер-класс ))
Отв: Хотим много книг, или сканировщики всех стран ...
Элементарно, Ватсон.
Ворд замечательно принимает картинки через копи-паст.
Страницы