Вы здесьХотим много книг, или сканировщики всех стран объединяйтесь!
Опубликовано пт, 04/12/2009 - 06:25 пользователем Lord KiRon
Последнее время озадачился вопросом попадания новых (да и старых) книг в сеть. Что мы имеем на данный момент? - Литресятину и разброд во всем остальном. Плюс еще последние события (вполне логично, однако все так же негативно) дробят наше сообщество сканировщиков и вычитывателей. В результате некоторые книги появляются и покупаются на разных сайтах по два-три раза некоторых совсем нет, люди делают лишнюю работу, за одно создавая потом лишние проблемы "библиотекарям". При всем уважении к Либрусеку, Флибусте, Песочнице , Huge-Library и многим другим я считаю что книги на первичную вычитку нужно брать в одном месте, и на данный момент таким наиболее подходящим местом явл;яется (в силу разных исторических причин) Библиотека Старого Чародея. Собственно речь о том что у них очень много книг, на "обработку" , даже больше чем людей и если вы можете помочь то загляните пожалуйста на главную http://oldmaglib.com/ справа или на форум http://bomanuar.com/forum/index.php?topic=231.0 и присмотрите себе книжку "в работу". За одно, если вы собираетесь купить какую то книжку, вначале проверьте на форуме http://bomanuar.com/forum/index.php?topic=231.0 - может она уже куплена , если вы купили какую то книгу то опять же пожалуйста отметьтесь там же чтобы не производить лишнюю ненужную работу. Да, и кстати , на Чародее применено очень удобное разделение труда - если вы например вычитываете но не имеете сканера и/или книг сканировать - то вы можете получить скан и вычитывать , если у вас есть сканер и книги а вы не имеете понятия как делать FB2 то вы можете отправить скан админу Старого Чародея и его сконвертирует и вычитает кто то другой. Короче, за работу товарищи ! :) Да, еще одна просьба, если вы не уверены что сможете сделать книгу в течении разумного периода времени (ну что то вроде месяца) то пожалуйста не беритесь за работу - этих книг ждут люди. Updated:
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Amelichka RE:Подайте бедному копеечку на книжку с литреса... 13 часов
TaKir RE:Валерия Сергеевна Черепенчук А. Н. Николаева - Мифы... 1 день Isais RE:Древняя Греция. Читаем... 2 дня laurentina1 RE:Ирина Александровна Велембовская - Немцы 4 дня Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 неделя Саша из Киева RE:Избранное 1 неделя Alligatoreader RE:Багрепорт - 2 1 неделя fedor.de RE:Отображение страницы Librusek 2 недели Isais RE:Чиполь Сергеевич Наглецов - Огненный дракон [СИ] 2 недели kopak RE:Таинственная личность админа Флибусты 2 недели blahblahblah2024 RE:Беженцы с Флибусты 2 недели sem14 RE:Что читать о блокаде Ленинграда. Подборка книг 2 недели sem14 RE:Михаил Юрьевич Берг - Андеграунд. Итоги. Ревизия_5 1 месяц Oleg V.Cat RE:B343695 Александр. Книга 1 1 месяц Isais RE:Калибрятина/Самиздатина 1 месяц md2k15 RE:Относительно Вархаммер 40 000 1 месяц tvnic RE:"Коллектив авторов" 1 месяц SergL197 RE:Регистрация 1 месяц Впечатления о книгах
Stanislaw Wartownik про Гюисманс: Наоборот [À rebours ru] (Классическая проза)
03 12 Перевод здесь плохой. Переводчик некий Карабутенко. Язык Гюисманса как-то вульгарно осовременен. (Вот и иллюстрации подстать: забавны, но тоже совершенно не подходят к эпохе и содержанию романа.) Перевод Головкиной в разы лучше! Оценка: неплохо
Skyns71 про Васюков: Дембель неизбежен! Армейские были. О службе с юмором и без прикрас (Современная проза, Юмористическая проза)
03 12 Прекрасный образец суконной армейской "публицистики"... Словно списано с газеты "Правда" тех времен. При чем здесь юмор? Оценка: нечитаемо
скунс про Дроздов: Зубных дел мастер (Попаданцы, Самиздат, сетевая литература)
03 12 Нормально читается,продолжение прочту Оценка: хорошо
kolombok про Попаданец в Таларею
02 12 Детский сад с трахом. В самом начале герою были выданы такие рояли, я думал ну может нормализуется. Я был не прав.
Isais про Крылова: Сказки Деда Мороза (Сказка, Самиздат, сетевая литература)
01 12 На Либрусеке нет тэга "Творчество умственно отсталых графоманов"? Только "Творчество душевнобольных"? Ради такого вот стоило бы завести... Оценка: нечитаемо
Iron Man про Ахмадулина: Свеча (Поэзия: прочее)
01 12 Из интервью с Беллой Ахмадулиной: «— Вы знаете, что останется от моих стихов? Останутся только... письма читателей. Своего литературного значения я никогда не преувеличивала. Я знаю, что была человеком своего времени и ………
S@iRus про Иноходец (Рымжанов)
01 12 У меня сложилось такое же впечатление, как и у Олега, о данной серии.
андрей169 про Шалашов: Господин следователь 1 [СИ] (Альтернативная история, Исторический детектив, Попаданцы, Самиздат, сетевая литература)
29 11 Забавная книга. Мне лично зашло хорошо. С продолжением обязательно ознакомлюсь. Оценка: хорошо
udrees про Баковец: Не тот господин 3 (Порно, ЛитРПГ, Самиздат, сетевая литература)
29 11 Книга строго для отдыха мозгов, тем кому нравится читать про влажные подростковые фантазии про гарем, воплощенные в реальность, и сексуальные подвиги, перемешанные с фэнтези. Герой настолько крут, что особо не заморачивается ……… Оценка: неплохо
udrees про Михайлов: Без пощады. Книга 3 [СИ] (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература)
29 11 Последняя книга из серии, но не последняя книга про месть киборга Вертинского. Написано в том же стиле, что и предыдущие книги. Описание во многом уделено экшену, поэтому всегда держит в тонусе, сражения, драки, убийства и ……… Оценка: отлично!
lukmak про Сочинения Иосифа Бродского в 7 томах
29 11 Бродский - гений. А кто его не понимает - что ж... Он непрост. Но, ребята, если вы его не понимаете - может, это ваша проблема?.. И пиндосы тут ни при чём.
nik_ol про Донцова: Амур с гранатой (Иронический детектив, Детективы: прочее)
27 11 Конечно, я рада, что книги Донцовой выходят и выходят, но неужели, если она сама их пишет, то не помнит, что «старичок» был не Коробков, а Гри, её первый муж, до Ивана в этой серии?! Или всё-таки литературные негры клепают?! Оценка: неплохо |
Комментарии
Отв: Хотим много книг, или сканировщики всех стран ...
господа, если кто ещё не понял - я блондинка. вообще. от слова совсем.
1) расширение у отсканированного файла *tif
2) там есть такая кнопочка как "распознать текст".
3) после чего банально выделить мышкой и вставить в ворд. можно контрл с :)
компьютер собирала не я, софт кем только не устанавливался. если для этого самого копипэйста у меня что-то установлено - скажите где искать (пошагово).
если я не поняла тонкого юмора - простите, если я ввела невольно всех в заблуждение - тоже простите)
Отв: Хотим много книг, или сканировщики всех стран ...
Ясно.
Кнопочка "распознать текст" - только у программы OCR.
Главное работает, хоть и у блондинки.
Отв: Хотим много книг, или сканировщики всех стран ...
Если я спрошу что такое ORC это уже будет злоупотреблением святой невинностью и измывательством над профессионалами? честное слово - чувствую себя идиоткой, которая ещё и делает 20 движений, вместо одного.
Отв: Хотим много книг, или сканировщики всех стран ...
OCR переводится с буржуйского как "распознавание букв на картинках".
Отв: Хотим много книг, или сканировщики всех стран ...
OCR - это оптическое распознавание текста по аглицки )
Сканируете всю книгу в тифы например, потом все их открывате специальной программой для OCR - FineReader называется.
И в ней сразу все распознаете.
Если отсканировано более-менее хорошо (300 точек на дюйм) то ничего вручную набирать не придется. Тем более 30%, как Вы пишите.
Сканировать можно и сразу через файнридер, там остается только страницы листать, сканер сам сканирует все страницы подряд.
Отв: Хотим много книг, или сканировщики всех стран ...
Где в слове OCR вы увидели распознавание текста?
Отв: Хотим много книг, или сканировщики всех стран ...
*рассмеявшись* простите, все вопросы сняты. проще будет самой разобраться. если уж в основах единства мнений нет... и кто говорил что компьютерщики не гуманитарии?:))
Отв: Хотим много книг, или сканировщики всех стран ...
Optical Character Recognition
Отв: Хотим много книг, или сканировщики всех стран ...
Видимо, у блондинки установлен OCR-компонент MS Office (я серьезно, он там входит в полный комплект, но распознает, правда, хуже файнридера). Такой вариант, как достаточно экзотический, упоминался здесь на форуме в разделе soft.
Отв: Хотим много книг, или сканировщики всех стран ...
судя по всему - именно так. а может быть вы файнридером поделитесь? пыталась его найти пару месяцев назад - не вышло :(
Отв: Хотим много книг, или сканировщики всех стран ...
http://rapidlinks.ru/link/?lnk=29614
Отв: Хотим много книг, или сканировщики всех стран ...
А не подскажете, какие должны быть кавычки в книге? А то 3 разных вида получилось.
Отв: Хотим много книг, или сканировщики всех стран ...
Интересно также по поводу вложенных кавычек второй степени. Какие есть мнения?
Борис
Отв: Хотим много книг, или сканировщики всех стран ...
«» - кавычки первого уровня (Сочетание клавиш: Alt+0171 и Alt+00187 соответственно),
„“ - кавычки второго уровня (Сочетание клавиш: Alt+0132 и Alt+0147 соответственно).
Отв: Хотим много книг, или сканировщики всех стран ...
А вот если "третий вид" - это кавычки третьего уровня вложенности, то тоже ничего хорошего: поскольку в природе кавычки тройной вложенности практически не встречаются, то можно заподозрить парную потерю кавычек (например, в начале крупного фрагмента потерялась закрывающая кавычка или даже две, а в конце - открывающая).
Типовая причина - принятые в типографии правила расстановки сдвоенных кавычек, если используются кавычки только одного вида (ёлочки). Пример:
Операция "Золото" == «Операция „Золото“» == «Операция «Золото»» (неправильно) == «Операция «Золото» (правильно - одна закрывающая ёлочка вместо двух подряд).
Текст с такой расстановкой ёлочек нуждается в дообработке перед прогоном скрипта "кавычки на ёлочки" - надо найти все места, где под одиночной ёлочкой подразумевается двойная, и добавить недостающую кавычку. Признаком наличия таких мест может быть ненормально большое количество кавычек второго уровня (лапок) и/или наличие кавычек третьего уровня. Найти "урезанную" закрывающую ёлочку несложно - от открывающей лапки искать назад до закрывающей ёлочки. С урезанной открывающей ёлочкой чуть сложнее, но тоже можно, я просто навскидку не помню.
Отв: Хотим много книг, или сканировщики всех стран ...
Вообще-то, по-правильному нужно отличать кавычку (какой она направленности) по пробелу и прилепленности ее к слову, а потом уже считать пары. Но возможно компьютерный интеллект еще не готов.
Отв: Хотим много книг, или сканировщики всех стран ...
Скрипт в FBE отлично справляется с этим. "Ручная работа" нужна в считанных случаях.
Отв: Хотим много книг, или сканировщики всех стран ...
ах, спасибо!!! счастье есть и имя ему файнридер!!!! вычитала 20 страниц так, между делом! ох, чудо какое! спасибо огромное!
Отв: Хотим много книг, или сканировщики всех стран ...
И не думайте, что это счастье.
Теперь вы порабощены навеки...
:) :) :)
Отв: Хотим много книг, или сканировщики всех стран ...
спасибо за ссылку, полезностей много:) попытаюсь в свободное время разобраться...
Отв: Хотим много книг, или сканировщики всех стран ...
Посмотрите и здесь: http://publ.lib.ru/publib.html
Отв: Хотим много книг, или сканировщики всех стран ...
Уже писал свое мнение, повторюсь - на сегодняшний день считаю более пригодным для получения предварительного материала не сканер, а цифровой фотоаппарат (не менее 5 МПикс). Гораздо быстрее, а результат ничуть не хуже + книги не надо портить (особенно актуально для толстых и ветхих книг).
Отв: Хотим много книг, или сканировщики всех стран ...
Ребята, о чем спор? Просто сотрясание воздуха, а не разговор о сканировании. По моему надо просто сканировать. При использовании планшетного сканера, FR и некоторых специализированных программ выдача 600-страничной книги в формате Word занимает от 3 до 5 суток на русском или украинском языках. Надо СКАНИРОВАТЬ и ВЫЧИТЫВАТЬ, а не спорить о ни о чем.
Отв: Хотим много книг, или сканировщики всех стран ...
НАДО:) только, как было сказано выше, из-за того, что я не понимаю как оптимизировать процесс у меня несколько месяцев уходит на скан и вычитку 300 страниц. месяц - потому что комментарии вбитые мелким шрифтом только вручную и вбивать - не распознаются. а их много. но если есть возможность основной текст книги распознать по-человечески - поделитесь программой. тем же файнридером, о котором все говорят. но никто не дает. а классическую литературу вряд ли набежит толпа желающих вычитывать. потому и занимаюсь собственноручно.
Отв: Хотим много книг, или сканировщики всех стран ...
Киньте-ка мне пару страниц с комментариями на пробу, посмотрю, как файнридер справится с распознаванием. Залейте на ифолдер. А там, может, объединим усилия.
Отв: Хотим много книг, или сканировщики всех стран ...
большое спасибо за предложение, но файнридер их распознал (о, да! счастье есть!) так что скорость работы серьезно возросла (за 2 дня сделан тот объем работ, на который раньше уходила пару месяцев!!) :) так что спасибо, но лучше если вы потом это в fb2 переведете, этого я пока не умею:)
Отв: Хотим много книг, или сканировщики всех стран ...
Хорошо, сделайте rtf/doc и пришлите на почту библиотекарей.
Отв: Хотим много книг, или сканировщики всех стран ...
Проблема ,имхо, не в классичности литературы, а в том, что мы не умеем вычитывать. Мы - остальные блондинки и я вместе с ними. Как это "вычитывать"? Как вычитывать если нет бумажного экземпляра книги? Или я глупость какую спросила?
Отв: Хотим много книг, или сканировщики всех стран ...
Не совсем глупость :) мне без бумаги тоже гораздо тяжелей, но все же не смертельно , просто не люблю когда читаю перед компом сидеть а тут приходится. Хоть экран и 24" а все равно раздражает.
Отв: Хотим много книг, или сканировщики всех стран ...
А никак. Нет способа сделать качественную вычитку без оригинала. Правда, оригиналом вполне может служить дежавю вычитываемой книги. Не так удобно, но приемлимо.
Вот ведь какие загадочные существа блондинки. Кажется, глупость спросят, а подумаешь - совсем наоборот выходит...
Отв: Хотим много книг, или сканировщики всех стран ...
Тьфу-тьфу-тьфу! Пусть продукт жизнедеятельности выходит обычным путем. Совсем наоборот тоже не в радость получится ;)
У меня есть предложение к опытным товарищам: возьмите шефство над чайниками! Сканировщик вырастит сканировщика, спец по вычитке научит блондинку читать. Число участвующих и делающих работу на приемлемом уровне увеличится вдвое - спасем залежи неоцифрованых книг. Как там? Убил бобра - спас дерево. Хм, убил блондинку - спас вычитку...? Возьмите меня в подшефные! Я бестолковая совершенно, но очень терпеливая. Раз уж медведей учат ездить на велосипеде, то я могу научиться вычитывать. Может даже найдется кто из Украины, чтоб можно было запросто связаться по мобильному...
Отв: Хотим много книг, или сканировщики всех стран ...
Клевета на блондинок. Сегодня конвертила два любовных романа в fb2 из доков - идеальная вычитка OCR-а. Никакая чистка не нужна. Такую бы вычитку, да книгам других жанров... :)))
Отв: Хотим много книг, или сканировщики всех стран ...
А может это брюнетки, или, свят-свят, рыжие вычитывали? )))
Отв: Хотим много книг, или сканировщики всех стран ...
Не может этого быть!!! Скан, окр и вычитка - один и то же человек. )))
Отв: Хотим много книг, или сканировщики всех стран ...
Т.е. дама, умеющая "Скан, окр и вычитка" по определению не может быть брюнеткой или рыжей? )))
Ларисе респект в любом случае )
Отв: Хотим много книг, или сканировщики всех стран ...
Ларисе респект безусловно - очень качественная работа.
Отв: Хотим много книг, или сканировщики всех стран ...
И в бумажном издании бывают опечатки (а с 90х годов - очень даже часто). Такое тоже стоит поправлять, но осторожно.
Djvu, как и pdf, сделанный из djvu, иногда содержат глюки, особенно если закодировали книгу разрешением при 300dpi и менее. И не всегда эти глюки можно распознать. Некоторые буквы просто заменяются в нем другими, - похожими. Мне попадались даже попадались подмены-многозначности, когда по смыслу подходило и так, и эдак (смысл менялся, но логика повествования оставалась).
Отв: Хотим много книг, или сканировщики всех стран ...
Я предпочитаю FR7, хотя уже есть 9-й. А делится? Уж слишком он емкий.
Отв: Хотим много книг, или сканировщики всех стран ...
Все сканеры сейчас комплектуются программой распознавания IRIS. Это похуже FineReader, но тоже неплохо.
Очень быстрые сканеры без искажения у сгиба книги - Plustek (3 секунды на страницу). Книга раскрывается на 90 градусов (сканирование до сгиба, который приходится на край сканера). Такие сканеры немного дороже. Я, будучи админом в библиотеке, купил вот такой: http://www.plustek.com/product/book4600.asp для сканирования книг, а сейчас закупаю еще 4 штуки. Единственно что драйвер в комплекте был недоделанный, пришлось выкачивать свежий с сайта фирмы. Да, рекомендуется именно Plustek OpticBook 4600, то же самое модели 3600 по сети имеет плохие отзывы.
Отв: Хотим много книг, или сканировщики всех стран ...
У 4600 тоже хватает недостатков, особенно в софте и цветопередаче, но в принципе книжки сканировать - само то.
Да , кстати, он у вас тоже с последним драйвером стал после возврата (по окончании сканирования листа) "позиционироваться" (дергаться вперед-назад на сантиметра два)?
Отв: Хотим много книг, или сканировщики всех стран ...
я очень извеняюсь но всем спосибо узнал много адресов библиотек
сербезно СПОСИБО
Отв: Хотим много книг, или сканировщики всех стран ...
Скачайте словарь для начала.
Отв: Хотим много книг, или сканировщики всех стран ...
А Вы - FAQ по сетевой этике.
Отв: Хотим много книг, или сканировщики всех стран ...
Дайте ссылку. Пока что у меня есть только толстый-толстый FAQ по троллингу.
Отв: Хотим много книг, или сканировщики всех стран ...
Прямо научно-практическая конференция дояров.
Отв: Хотим много книг, или сканировщики всех стран ...
Не уж-то читали?
Всё под контролем, слава богу :)
Отв: Хотим много книг, или сканировщики всех стран ...
Да. прочитал. И тоже думаю что всё в порядке.
Искатели журналы сейчас сканирую. Никогда в таких масштабах этим не занимался, что-то тяжеловато с непривычки:(
Отв: Хотим много книг, или сканировщики всех стран ...
Распределяйте нагрузку. Не надрывайтесь. Вы нам нужны здоровый и веселый.
Отв: Хотим много книг, или сканировщики всех стран ...
Спасибо. Постараюсь:)
Отв: Хотим много книг, или сканировщики всех стран ...
Igorek67 : Выложите их (Искатели) в виде PDF(jpeg)/JPG/DjVu(лучшеphoto) или хоть обычном DjVu, пожалуйста!
Страницы