Вы здесьПроект по вычитке книг, подобный альдебарановскому и олдмаглибовскому.
Опубликовано пт, 04/04/2008 - 01:59 пользователем soshial
Форум пока очень неудобный для этого, так что пока будем обсуждать здесь...
Понятное дело, мы и сейчас вычитываем... некоторые люди. их мало. И это просто не очень организованно пока, кустарно что ли... ;)
я предлагаю "сплочиться" =D
просто собрать организованную кучку ocr-щиков и вычитывающих, которые будут друг другу помогать.)
Выглядеть все будет таким образом... кто-то заказывает (в смысле, предлагает ее для вычитывания) вычитку книги - кто-то эту вычитку выполняет.
СПИСКИ "НА ВЫЧИТКУ", "НА OCR" И СПИСОК УЧАСТНИКОВ - ЗДЕСЬ.
FAQ:
> Не сочтите за наглость но если работа предстоит с фантастикой/детективами/любовными романами то тогда извините но отказываюсь сразу.
Работа ведется во всех направлениях - любые жанры и стили литературы, даже не только художественной =)
что хотите то и выбираете)
> С каким форматом предстоит работать?
с fb2. наиболее распространенный в рунете и наиболее удобный формат для чтения и редактирования =)
общая информация здесь и тут
в нем нет ничего сложного, просто надо более-менее помнить теги. это просто. к тому же, вы будете эти теги коррекировать, а не создавать с нуля. ;)
1. общая информация о формате
2. описание тегов и простой пример книги.
3. как сделать книгу
4. Вычитка, редактура и создание fb2-файла с начала и до конца, с помощью FictionBook Designer 4.0 и не только
5. несколько статей и инструкций по fb2
6. Создание электронных книг в формате FictionBook 2.1: практическое руководство
> Условия, правила вычитки, форматирования?
правил форматирования почти нету за счет того, что инфа об абзацах, эпиграфах и т.д. хранится в тегах а не стилях (болд, италик и т.д.); правила вычитки только в процессе создания, пока прорабатывается. сейчас главное - вычитка.)
[quote]а теперь главное!
в этом посте: вносим свои предложения, предлагаем идеи, предлагаем книжки для вычитки, делимся планами, высказываем свои мысли и т.д.)) (не знаю, как выразиться лаконичнее)))[/quote]
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
NickNem RE:Подайте бедному копеечку на книжку с литреса... 9 часов
Isais RE:Семейственность в литературе 19 часов kopak RE:Таинственная личность админа Флибусты 4 дня kopak RE:О группе Дятлова. О той самой, того самого... 4 дня babajga RE:Ласси возвращается домой 5 дней sem14 RE:Подборка о Первой Мировой 6 дней Isais RE:удаление "двойников" 1 неделя Isais RE:Кармен Мола - Пурпурная сеть [litres] 2 недели Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 2 недели Isais RE:Катя Водянова - Дом и два жениха в придачу 3 недели Aleks_Sim RE:Прошу переформатировать, распознать, etc... 3 недели Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 месяц Isais RE:Дмитрий Анатольевич Горчев - ЖЖ Дмитрия Горчева (2009–2010) 1 месяц Саша из Киева RE:Детям о Ленине (Издание 1965 года) 1 месяц Саша из Киева RE:Приключения Мишки-Ушастика (Перевод Марата Брухнова) 1 месяц babajga RE:Белая княжна 1 месяц Isais RE:Файл достаточно хорош. Нет смысла в его улучшении. Ага,... 1 месяц mazay RE:Sleepy Xoma - Bagⲣѱnoⲣojdennaѱ 1 месяц Впечатления о книгах
187 про Царевич: За Отчизну! (История)
21 02 Годная детская книжка, как и Приключения Каспера Берната в Польше и других странах. Оценка: отлично!
Дей про Воспитанник орков
21 02 Какой же ГГ тряпка и слюнтяй. Нет, он храбр и, в общем-то, довольно сообразительный, хоть и несколько тугодум, но он трясётся над жизнью каждой мрази, встречающейся на его пути. Он оставил за спиной несчитанное количество ………
dolle про Корнев: Артефакт острее бритвы (Фэнтези, Приключения: прочее, Самиздат, сетевая литература)
21 02 Неплохо. С каждой книгой сюжет становится динамичнее, интриг и врагов становится больше . Оценка: хорошо
tlittle про Никитин: Бешеный лев (Фэнтези)
20 02 Примитивно. Очень примитивно. Такое впечатление, что художественные "изыски" добавляли в рассказ при втором проходе, они выглядят чужеродными. При этом куча (просто хренова гора) примитивных орфографических ошибок. "Ни как", ……… Оценка: плохо
Barbud про Семин: Конструктор (Попаданцы, Самиздат, сетевая литература)
20 02 Малоинтересное чтиво без художественных достоинств и исторической достоверности. Автор поднаторел на написании сказок с магией и прочими вытребеньками, где не нужно знать историю и следить за отсутствием анахронизмов, поэтому ……… Оценка: нечитаемо
nik_ol про Донцова: Дезертир из рая [litres] (Иронический детектив)
19 02 Ребятки, а что так редко стали выкладывать Донцову, Луганцеву и Полякову? Ну, Полякова-то понятно, там её невестка как бы сейчас книги пишет, а Донцова? Скучаю уже, я её между Пелевеным читаю, например, для разгузки мозга))). Оценка: хорошо
decim про Ксенз: Золотая стена (Современная проза, Публицистика)
19 02 Автор не буйный , это хорошо. Больше ничего хорошего. Ну там Фаэтон, Гиперборея, Атлантида... а Чёрное море, должно быть, выкопали на сдачу. Потомков ассуров(так в книге) сдали на съедение Горбачёв с Волкогоновым. Который ……… Оценка: нечитаемо
mysevra про Зорич: Очень мужская работа [HL] (Боевая фантастика)
19 02 Здесь больше Зорича, чем Жарковского. «Тварь» показалась интереснее. Оценка: плохо
mysevra про Жарковский: Времена смерти [litres] (Космическая фантастика, Научная фантастика)
19 02 Это было необычно, мне бы хотелось продолжения. Оценка: хорошо
alexk про Скабер: Двойник короля. Книга 5 [СИ] (Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
19 02 Неужели так сложно понять, что если аннотация не отображается, то в ней присутствуют символы, которые сайт либрусека игнорирует? И поправить залитый файл? Я уж не мечтаю о том, что вы будете заливать валидные файлы сразу...
decim про Бобров: Эпоха мертворожденных [= Украина в огне] (Альтернативная история)
19 02 Автор не взял тяжёлую тему. Надорвался при первом подходе. Можно усвоить, что война была неизбежна. В данном раскладе да. И что мы усвоим ещё - что автор любит боёвку, аж пищит, и не любит баб как пол. И всё! Что ………
Nicout про Владимирский: На киевском направлении (Военная документалистика)
18 02 Сколько погибло советских солдат при взятии Киева? По немецким данным, под Киевом к 24 сентября было взято в плен 665 тысяч человек. По данным, опубликованным в 1993 году Генштабом Вооружённых Сил РФ, советские потери ……… |
Комментарии
Отв: несколько орг. вопросов по вычитке
golma1 Есть несколько орг. вопросов по вычитке, свяжись, плиз, со мной по почте: epaper.ru[собака]gmail.com
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Добавлю вдогонку: если автор в библиотеке уже есть, лучше всего сохранять уже существующее написание (с отчеством или без, например).
Я сама на этом споткнулась с Гумилёвым.
имя автора
Гм... Хоть я и не согласен с таким подходом (ИМХО, если было без отчества, но оно известно, то стоит отчество добавить), но на будущее - учту
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Беру Барбара Хэмбли-Вампиры
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
В распознании висит две книги, после Вампиров, если никто не займёт, могу распознать.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Насчёт распознавания я не в курсе. Нужно подождать soshial.
Всё остальное внесла в таблицу. :-)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
эт две книги висят на ocr'e - кто-то отсканить должен.
а распознаваний пока нет, но если хочешь могу скинуть - правда, я не уверен, что ты возьмёшься за учебник польского))
да и не знаю, возможно ли это: из djvu одних картинок склепать pdf с нормальным текстом без слоя со сканом???
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Девятый файнридер вроде такое умеет: finereader.abbyy.com/?param=137522#Formats. Сама не пробовала.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Если задача из djvu в pdf (хорошее качество скана), думаю можно без распознавания. djvu открыть в IrfanView, затем печать в PDFCreator.
Как вариант сойдёт и 9-й Файнридер.
Скинь ссылки на djvu - посмотрю.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
http://lib.rus.ec/b/104779
http://lib.rus.ec/b/104814
это те учебники, из которыхз надо бы удалить слой сканннинга и оставить текст (векторный, ну ты понимаешь ;))
и еще, я тут книгу одну собираюсь сканить... тебе можно будет ее кинуть в tiff'e?
за распознание возьмешся?
если да - то отвечай в личку.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Учебники в pdf будут под 20 Мб - нужны?
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
я думал, что если из них сделать ocr/pdf, то как наоборот весить они будут меньше...
Наталья Галкина - done
Теперь можно и за Андрэ Нортон взяться... :)
Ударнику труда!
Да Вам фронт работ никак не обеспечить. ;-)
Всё отметила.
Андрэ Нортон
Похоже, без "работы" Вы не останетесь. :-(
Сегодня у Нортон появилось ещё 3 книги в doc - см. серию "Повелитель животных".
Re: Андрэ Нортон
Так это же хорошо! :)
Re: Андрэ Нортон
А как Вы относитесь к англоязычным книгам? Всё так же "одной левой"? ;-))))
Re: Андрэ Нортон
С Повелителем животных" все оказалось намного проще :)
Он был в моей библиотеке...
Залил на сайт :)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Ой-ой-ой... Я в этом ничего не понимаю.
Придётся мне пользоваться "стандартными" программами.
В любом случае, спасибо за разъяснения.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
http://www.the-ebook.org/forum/viewtopic.php?t=7858
http://www.the-ebook.org/forum/viewtopic.php?p=124019#124019
Много всего вперемешку, но и про CSS хватает. Это только темы, которые навскидку нашлись.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Ага. Спасибо, я почитаю. Но, по-моему, ты слишком хорошо обо мне думаешь. В-)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Так у меня для Вас уже ого-го какой список. :-D
А тут всё добавляется и добавляется. ;-)))
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
привет, помнишь про мою просьбу? =)
*конспирируясь* спросила его? ;)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Нет. Забыла. :-Р
Re: Проект по вычитке книг, подобный альдебарановскому
Английский у меня - со словарем :(
Поэтому могу "зевать" кучу ляпов :(
Думаю, к англоязычным книгам можно будет приступать, когда не останется русскоязычных :)
Re: Проект по вычитке книг, подобный альдебарановскому
Слушай, тут книга эксклюзивная... нигде не мог найти - даже в мегараздачах на торрентсе.
В этом или прошлом году автор получил Путлицеровскую премию...
можно тебя попросить в fb2 перегнать?? пожалуйста.
http://lib.rus.ec/a/30558
Re: Проект по вычитке книг, подобный альдебарановскому
ОК, перегоним :)
Re: Проект по вычитке книг, подобный альдебарановскому
ух ты!!! спасибо тебе большое!!! =)
Re: Проект по вычитке книг, подобный альдебарановскому
Вот теперь - пожалуйста :)
Книга залита :)
ЗЫ Качество распознавания - паршивое :( Что смог - пофиксил
Re: Проект по вычитке книг, подобный альдебарановскому
спасибо!!
много багов осталось, но их я вычитаю ;)
еще раз благодарю! =)
С Андрэ Нортон покончено (-)
-
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Барбара Хэмбли - Вампиры готова http://lib.rus.ec/b/105617
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
ОК, отметила.
Что-нибудь ещё себе присмотрели? ;-)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Собиратели осколков - вычитать? Или проверить на полноту книги?
На всякий случай скачал, почитаю, если что будет исправит - исправлю :-)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Там какая-то странная книга. Я в неё заглянула, но не поняла: то ли это огромное количество опечаток, то ли автором так задумано.
Надеюсь, Вы сумеете разобраться. ;-)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Самое интересное
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Вот-вот! Вычитываю Ле Гуин "Толкователи". Тоже nickname - rusec -nickname
email -lib_at_rus.ec - email
author program-used - LibRusEc kit
и 2013 год. Открылся только Букдизайнером.Интересно, а зачем rusec делает такие "инвалидные" книжки?Нечаянно?
Вручную пришлось прописывать тэги и стряпать валидный файл. Вроде получилось.
И что обидно, только я знаю, что это с моей стороны подвиг, т.к. тяжело болею компьютерным идиотизмом и обоеруколевостью.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Это книги автоматом сконвертированные, с соответствующим качеством :-\ из txt (если не ошибаюсь, из библиотеки Мошкова), в самом начале работы либрусека. Наверное, только для первоначального привлечения.
Если находится такая книга, и есть "нормальный", не "автоматизированный", вариант, то желательно залить нормальный вариант в эту библиотеку.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Практически все файлы, созданные "rusec", нуждаются в обработке. Так что нужно принять как данность и всё.
Как правильно заметил Cd_spb, проще всего заменять такие файлы. Ну, или править ручками, если нет другого варианта. :-(
Ну, а за подвиг - гран мерси! Мы все ценим. :-)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Я уже увидела "Толкователей". Посмотрела в своих читалках - всё в порядке. :-)
Кстати, замену дефисов на тире в FBE можно делать как "заменить все". Только нужно выбрать [пробел-дефис-пробел] и, соответственно, [пробел-тире-пробел]. Потом можно пройтись ещё раз с комбинацией [дефис-пробел] заменить на [тире-пробел] - для реплик в диалоге.
Или в Investigator'e можно воспользоваться юникодами:
(uni32)(uni45)(uni32)
заменить на
(uni32)(uni151)(uni32).
И тоже выбрать "replace all".
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Только, ради бога, не пробел! Перед тире, если вас не затруднит, ставьте неразрывный пробел, а в начале реплик после тире - тоже неразрывный. А то очень мерзко смотрится, когда в длинном диалоге на выровненном тексте тире стоят строем, а текст после тире отплясывает. Да и тире, оторвавшееся от предыдущего слова и улетевшее на следующую строку, изящества тексту не добавляет. :(
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
А можно с помощью этих интересных символов найти и заменить следующее , (запятая) слово (-а), затем закрывающая скобка, на ((скобка) слова, слова) (скобка)?
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Попробуйте почитать Кондратовича, раздел Регулярные выражения (приложение Д).
Там много интересного. ;-)
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Для меня это пока китайская грамота, м.б. сумею разобраться.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Не подскажете, как это сделать в FBE?
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Ага, у меня уже тик начинается от "Собирателей осколков"
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
Сочувствую.
Я только заглянула, и мне уже плохо стало.
Re: Проект по вычитке книг, подобный альдебарановскому и олдмагл
При просмотре fb2 в AkelPade имеются куски текста - "Российская Федерация( Белоруссия и Украина( выступившие" - со скобками (не закрываются), такое можеть быть? Причём эти скобки идут по всему абзацу.
Страницы