Вы здесьНевалидные файлы и Либрусек
Опубликовано пт, 13/03/2009 - 11:20 пользователем Alexx_S
Forums: Сильно подозреваю, что вопрос уже поднимался и неоднократно. Но проблема существует - в библиотеке огромное количество невалидных книг и их количество будет увеличиваться. В качестве мер по борьбе с этим явлением предлагаю следующее: 1. Ввести оценку, метку, называйт это как хотите - аналог знака качества. Невалидные книги будут помечаться этим знаком, их можно будет просмотреть отдельно. Дополненение. Более корректно мое предложение сформулировал Ulenspiegel: Web-сервис, по имеющемуся файлу сообщающий:
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
kopak RE:О группе Дятлова. О той самой, того самого... 1 день
aldan RE:Подайте бедному копеечку на книжку с литреса... 1 день Isais RE:Катя Водянова - Дом и два жениха в придачу 1 день Aleks_Sim RE:Прошу переформатировать, распознать, etc... 2 дня kopak RE:Таинственная личность админа Флибусты 1 неделя Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 неделя Isais RE:Дмитрий Анатольевич Горчев - ЖЖ Дмитрия Горчева (2009–2010) 1 неделя Саша из Киева RE:Детям о Ленине (Издание 1965 года) 2 недели Саша из Киева RE:Приключения Мишки-Ушастика (Перевод Марата Брухнова) 2 недели babajga RE:Белая княжна 3 недели Isais RE:Файл достаточно хорош. Нет смысла в его улучшении. Ага,... 3 недели mazay RE:Sleepy Xoma - Bagⲣѱnoⲣojdennaѱ 4 недели zlyaka RE:С Новым годом! 4 недели Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 1 месяц SparkySpirit RE:Жорж Санд - переводы 19 века 1 месяц Саша из Киева RE:Наш дом - СССР 1 месяц babajga RE:Чернушка. Повести 1 месяц Саша из Киева RE:Сказки далёких островов 1 месяц Впечатления о книгах
Chernovol про Полтавченко: В прицеле «Азов» (Современная проза, О войне, Роман)
30 01 При чем тут "гражданская война"? Разве что граждане рф пришли убивать граждан Украины. Оценка: нечитаемо
Aleks_Sim про Полтавченко: В прицеле «Азов» (Современная проза, О войне, Роман)
30 01 Лысенко Владимир Андреевич" - а что "Азов" это современный украинский мир ? Оценка: отлично!
Лысенко Владимир Андреевич про Полтавченко: В прицеле «Азов» (Современная проза, О войне, Роман)
30 01 Нечитаемо, как хорошо убивать всех несогласных с русским миром, все наши правильные, а кто думает по другому должны быть убиты, осталось только Аляску захватить. Оценка: нечитаемо
Barbud про Фонд: Баба Люба. Вернуть СССР 4 (СИ) (Попаданцы, Самиздат, сетевая литература, Фантастика)
29 01 Дерьмище редкостной зловонности. Главное, что автор писать умеет, пишет образно, без "картона", коим грешат очень многие кропатели нетленки. Но боже мой, какую же херню он пишет! Первые две части осилил, остальные пролистнул по диагонали, ибо чушь. Оценка: нечитаемо
decim про Р. Дж. Баркер
29 01 Хорошо, а местами и отлично. Было бы совсем отлично, если бы автор не растянул историю на три тома, но это обычное дело.
mysevra про Баркер: Алые песнопения (Ужасы, Триллер, Детективы: прочее)
29 01 Как часть истории «Восставшего» - мило и познавательно. Но зачем такое изобилие обсценной лексики уличного разлива? Для реализьму, так сказать? Так у меня дл вас плохие новости, мои маленькие друзья, это лет 30 назад такое ………
lukyanelena про Гремучий ручей
29 01 Хотите серию про вампиров? Пожалуйста! Только забудьте про романтичные истории с загадочными красавцами и красавицами. Будет больно, будет страшно, будет неприятно, но я скорее поверю в таких тварей, чем в слащавых вампирчиков.
Лысенко Владимир Андреевич про Земляной: Игровой практикум [СИ] (Боевая фантастика, Фэнтези, ЛитРПГ)
29 01 Книга понравилась, читается легко, жду продолжения. Оценка: отлично!
Nicout про Сушков: "Ленинградское дело": генеральная чистка колыбели революции (Документальная литература)
29 01 Говорите, во время блокады Ленинграда руководство города голодало, как и остальные жители, а все рассказы про пирожные, колбасу и икру для коммуняк - вранье и клевета? Ну так прочтите что из себя представляли питерские деятели, ……… Оценка: отлично!
Синявский про Николай Егорович Дронников
28 01 На 95-м году жизни скончался Николай Дронников - советский и французский художник, график, скульптор, прозаик и издатель авторских книг, "летописец русской эмиграции".
ve51 про Чейз: Плоть орхидеи [The Flesh of the Orchid ru] (Крутой детектив)
27 01 Книга не входит в цикл "Дэйв Фэннер
Skyns71 про Гузман: Тропой священного козерога, или В поисках абсолютного центра (Современная проза, Биографии и Мемуары)
27 01 Господи... Жизнеописание наркомана. |
Отв: Невалидные файлы и Либрусек
1. Уже есть.
2. Тоже уже есть. Если к примеру нет названия, посылает.
3. Нереально. Этих книг более 40к+. Вообщем, если видите при переходе на линк "исправить" в тегах rusec - книга не валидная. Помочь может Fb2Fix.
Отв: Невалидные файлы и Либрусек
Это, как раз, вполне реально сделать - прогнать Librusec-Kit-овые книги через Fb2Fix и перезалить. Но я, честно говоря, не вижу в этом особого смысла.
Отв: Невалидные файлы и Либрусек
я имел, прежде всего, книги вновь добавляемые.
Отв: Невалидные файлы и Либрусек
Видимо я не так выразился :(. Валидность и качество книги - разные вещи. Я имел в виду как раз качество. Привести в порядок 40к+ книг в разумные сроки не реально. Сделать валидными - да реально, но смысла нет.
Отв: Невалидные файлы и Либрусек
Я имел в виду полноценную валидацию именно при добавлении и автоматическую выставку оценки.
Если политика такова, что лучше книга плохого качества, чем никакой (лично я категорически против), то лучше хоть как-то дать знать человеку, что с его файлом не все в порядке. И дать знать другим, кстати, тоже.
3. Абсолютно реально, если посомтреть что на данный момень сделано.
Отв: Невалидные файлы и Либрусек
Слава богам, что не Вы определяете политику.
Отв: Невалидные файлы и Либрусек
Может быть. Потворствовать лени и неуважению к другим пользователям я бы точно не стал
Отв: Невалидные файлы и Либрусек
Громкие слова. Вот лучше объясните мне: чем отсутствие книги лучше её присутствия в плохо оформленном виде? Для библиотеки, не для Вас лично.
Отв: Невалидные файлы и Либрусек
1. Плохо сделанный файл ничего кроме раздражения не вызывает. Читать его невозможно, каталогизировать аналогично.
2. Если в библиотеке есть плохо сделанный файл, велика вероятность, что другой заливальщик впишет в поиск название, увидит "ага, такая книга уже есть" и не будет заливать новую.
3. Проще делать fb2 из того же doc или txt, чем переделывать кривой fb2.
Отв: Невалидные файлы и Либрусек
Подпишусь под вышесказанным. Именно так я и считаю.
Кроме того, вопрос поставлен некорректно. Я не призываю изменить существующий порядок, я за то, чтобы книги в библиотеке стали более качесвенными - надеюсь, это желание сомнений не вызывает?
Можно долго спорить - место ли корявым файлам в библиотеке. Но указать заливающему на то, что файл невалидный можно ведь? А сделать удобным отображение этих невалидных файлов? А, в идеале, не просто сообщить о невалидности, а указать что за ошибка?
Отв: Невалидные файлы и Либрусек
Что некорректного в вопросе "чем отсутствие книги лучше её присутствия в плохо оформленном виде?"?
Не о чем тут спорить. Место - если лучших нет.
Это да. Но Ларин, увы - один, и рук у него всего две.
Отв: Невалидные файлы и Либрусек
В переводе спора на более удобные рельсы. Мои личные предпочтения можно обсудить в ПМ, вопрос, который я вынес на обсуждение, звучит иначе.
А голов сколько? :) Хоть одна есть? Отлично, значит он дееспособен и в состоянии сам за себя решить ;)
Отв: Невалидные файлы и Либрусек
Рельсы "лучше никакой книги, чем плохо оформленная" Вам удобны, а рельсы "лучше плохо оформленная книга, чем никакой" - неудобны? А можно узнать - почему?
Отв: Невалидные файлы и Либрусек
Рельсы "Лучше.... чем" мне неудобны в любом случае - они уводят в сторону обсуждение.
Как мы уже выяснили, Вы не против того, что я предлагаю, что еще обсуждать? Мою позицию? Я ее высказал в самом начале. Спорить чья позиция лучше? Не хочу.
Отв: Невалидные файлы и Либрусек
Я не понял почему и куда "Лучше... чем" уводят обсуждение. Ну да, впрочем, и ангел с ними.
Я влез в этот разговор после Вашего "Если политика такова, что лучше книга плохого качества, чем никакой (лично я категорически против)" и именно из-за Вашего "лично я категорически против".
Влез потому, что это не первый и не восьмой раз такое мнение высказывается. Влез с двумя целями: 1. Сообщить читающим это обсуждение что по данному поводу есть и другие мнения, и 2. Попытаться уяснить себе обоснование Вашего мнения.
Второй цели я, как обычно, не достиг.
Отв: Невалидные файлы и Либрусек
Опять танцы с бубнов вокруг fb2-валидности!
Думаю что основное обоснование в таких случаях - правильно, потому что Я так считаю. Мнения остальных, которым важно содержание книги, а не её обложка и красиво оформленные сноски (кстати, не пользуюсь не в специальной литературе) как обычно "ф топку".
Отв: Невалидные файлы и Либрусек
Т.е Ваше мнение - файлы просто обязаны быть невалидными? То, что о них спотыкаются программы для чтения и каталогизации - ф топку, как Вы выражаетесь?
Еще раз - я не за то, чтобы эти книги убрать, я за то, чтобы при добавлении невалидной книги автору документа сообщалось, что с книгой что-то не так.
Отв: Невалидные файлы и Либрусек
Господа, компромиссное предложение. Web-сервис, по имеющемуся файлу сообщающий:
- является ли файл коректным XML - файлом
- соответствует ли файл схеме FB2
- содержит ли ошибки, препятствующие его чтению наиболее популярных читалках
даст возможность добросовестному книголожцу вовремя заметить ошибки и, при вменяемой диагностике, их исправить. А недобросовестному не поможет ничего.
Отв: Невалидные файлы и Либрусек
А почему компромисное? Именно это я и предлагаю
Отв: Невалидные файлы и Либрусек
Тогда не понимаю сути холивора.
Отв: Невалидные файлы и Либрусек
Честно говоря, я тоже не понимаю
Отв: Невалидные файлы и Либрусек
Передёргиваете? Можно ссылочку на место, где я писал про обязательную невалидность?
Хотя лично мне валидность по барабану. В txt почти наверняка можно конвертировать и потом переформатировать как угодно. А если какая книга и не почитается, у меня их только в txt и только фантастики более 5 гиг. (каюсь, ибо грешен, люблю фантастику), не говоря уже обо всём остальном.
Насчёт автоматической каталогизации - не могу понять людей, проводящих всё это автоматом. Я перед сохранением в архив обычно просиатриваю книги и решаю, стоит ли её сохранять и куда именно.
??????????????????
Отв: Невалидные файлы и Либрусек
Почему же? Мое предложение - проверка и вывод информации о валидности. Все остальное - флуд на тему моих личных предпочтений, которые почему-то считаются более важными для обсуждения. То, что Вы процитирвали - яркий тому пример. Да, я категорически не согласен с текущим положением дел, но уважая чужое мнение я предлагаю компромисный вариант.
Отв: Невалидные файлы и Либрусек
То, что я процитировал - явный пример противоречия и ничего более.
Насчёт валидации. Поскольку это Вики-библиотека, никто не мешает тем, кому это важно (Вам в том числе) заняться проверкой валидности заливаемых книг (обычно их не более двух-трёх десятков в день). Сформируйте группу энтузиастов (если это действительно важно, их будет много), распределяйте новае книги по членам группы, оценивайте, предупреждайте... Наберётся в группу человек 10, проверите каждый по 2-3 книги. Ну или напишите соответствующий скрипт для проверки и вышлите Ларину.
И пожалуйста не мешайте заливать новые книги всем желающим.
Отв: Невалидные файлы и Либрусек
Никакого противоречия. И никому я не мешаю. Предложение по группе энтузиастов комментировать не буду.
Отв: Невалидные файлы и Либрусек
Отв: Невалидные файлы и Либрусек
А я - как очень вероятную. Если я хочу отсканировать книгу - я смотрю, есть ли такая в библиотеке. Если есть - сканировать не буду. Если есть, но кривая -править тоже не буду, есть много других интересных книг, сделаю еще что-нибудь.
Отв: Невалидные файлы и Либрусек
Ну и даже если это невероятное-вероятное произойдёт, и случится "есть много других интересных книг, сделаю еще что-нибудь" - чем это плохо?
Отв: Невалидные файлы и Либрусек
Отсутствие таблиц, определенных страниц, перепутанные куски текста, номера страниц посреди текста, разорванные абзацы - это все прелести неумелого конвертирования pdf. Оччень приятно читать такое, ага.
Ключевое слово "своей". Человек нашел в другой библиотеке файл, дальше продолжать? Люди знаешь ли имеют тенденцию не напрягаться.
Представь, что в оригинальном документе есть иллюстрации, сноски и латинские слова. Криво конвертируем и получаем отсутствие допустим 100 сносок(которые можно было бы расставить автоматом), отсутствие картинок (которые могут быть важны для понимания текста, пример - таблицы), и вопросительные знаки посреди латинских слов. Ты точно уверен, что править fb2 проще?
Отв: Невалидные файлы и Либрусек
Ты всё время съезжаешь с очень простого вопроса. Никто и не спорит, что хороший файл лучше плохого. Я только говорю (да, ещё разок напомню - говорю вслед за Лариным), что плохой файл - лучше, чем никакого.
Отв: Невалидные файлы и Либрусек
Я говорю не вслед за кем-то, а всегда за себя. Так вот я говорю - плохой файл плох тем что он бесполезен. Еще раз - бесполезен. Чтение плохого файла убьет все удовольствие от книги. Ессно файл в котором к примеру неправильные кавычки или минусы вместо тире лучше, чем никакого. Пример плохого файла в моем понимании читай выше.
Отв: Невалидные файлы и Либрусек
Пожалуйста, вот Вам "валидная" (в понимании Танюши) книжка: http://lib.rus.ec/a/37259
Типические (типа "е" вместо "с") и не очень опечатки не считаю.
Оборванный абзац тоже.
Расстановка кавычек - никакая.
+ кириллица в названиях аглицких книг --- вообще блеск!
Отв: Невалидные файлы и Либрусек
Это книга сделана с достаточным количеством ляпов. Начать можно с того, что там не все сноски расставлены. Тем не менее плохой, я ее назвать не могу. Это четверка. А расстановка кавычек кстати, делается скриптом за пять минут.
Если книга на русском языке, у нее пишется русское название.
Отв: Невалидные файлы и Либрусек
Чтобы отучить товарища от голословного хамства могу предложить ему конкретный .doc :)))
Чисто в воспитательных целях.
Отв: Невалидные файлы и Либрусек
1. Товарищу есть чем опровергнуть данное утверждение?
2. В упор не вижу хамства.
3. Давно прошло то время, когда меня можно было взять на слабо.
Отв: Невалидные файлы и Либрусек
Абсолютно пустой файл валиден - оценка 5.
Файл в котором сплошной текст - ни заголовков, ни сносок валиден - оценка 5.
Файл в котором заголовки, сноски расставлены, но присутствует не к месту лишний empty-line - невалиден. Оценка 2.
Вывод: валидность - не показатель качества книги.
Да нету никакой политики. Вообще. Никто не запрещает лить хлам, никто не запрещает лить хорошие книги. Разговорами о политике прикрываются обычно те, кому влом нормально сделать книгу.
Отв: Невалидные файлы и Либрусек
А я что-то говорил об оценке? Я говорил о метке - валиден или не валиден, да или нет, оценка качества книги здесь совершенно не при чем.
Я не думаю, что хлам льют исключительно по лени или кривости рук, скорее по незнанию. Нет ничего плохого, если человек при заливке узнае, что с его файлом что-то не так.
Вот моя самая первая книга в фб2: http://lib.rus.ec/b/137530
Чем я прикрываюсь?
Отв: Невалидные файлы и Либрусек
Как оказалось, говорил. Но смысл вкладывал именно такой - невалидность, это не двойка или тройка, это просто факт. У нормального автора наверняка возникнет желание эту метку снять.
Отв: Невалидные файлы и Либрусек
Я вообще то имел в виду не вас, а товарищей вроде peshehodrost-а и Anarhist-a. Не нужно все сказанное принимать на свой счет.
Человек заливает хлам один раз, ему говорят - "это хлам!". Он вместо того чтобы прислушаться, начинает завывать о том, что свободу его злобно ущемили злые библиотекари и напрочь игнорирует все советы. Говорить такому что либо - бесполезная трата времени и нервов. Где-то потерялась темка, в которой peshehodrost, когда всем его файлам поставили(вполне заслуженно) черную метку, поднял визг до небес.
А если человек хочет научится, он как правило сперва хоть чуть-чуть читает FAQ по редактированию книг и как минимум говорит "Это моя первая книга, посмотрите, что может быть не так". И смотрят и помогают. Но при условии, что есть желание учиться.
Отв: Невалидные файлы и Либрусек
Вот такой вопрос к pkn для уточнения его позиции: некий пользователь вчера-сегодня залил некоторое количество книг (ссылки в конце поста). Автором всех этих файлов значится Стремиительный Свет. Все они сделаны скриптом doc2fb. Т.е. сделаны они из doc, частично - даже из Doc, ранее уже залитых на сайт. Дескрипшен имеет такой вот вид:
FB2 document-info:
* fictionbook/description/title-info/book-title Мы уходим
* fictionbook/description/title-info/date 2009-03-14
* fictionbook/description/document-info/author/first-name Стремиительный Свет
* fictionbook/description/document-info/program-used doc2fb
* fictionbook/description/document-info/date 2009-03-14
* fictionbook/description/document-info/version 2
У всех файлов. Валидацию они не проходят. Едва ли они корректно будут обрабатываться каталогизатором Либрусека (могу ошибаться).
В данном случае я не говорю о качестве и структуре самого текста, только о заполнении дескрипшена и именно валидности.
А вот, собственно, и сам вопрос:
Считаете ли Вы такую деятельность правильной и полезной для библиотеки?
Вот ссылки:
http://lib.rus.ec/b/141862/edit
http://lib.rus.ec/b/141859/edit
http://lib.rus.ec/b/141857/edit
http://lib.rus.ec/b/141856/edit
http://lib.rus.ec/b/141853/edit
http://lib.rus.ec/b/141852/edit
http://lib.rus.ec/b/141851/edit
http://lib.rus.ec/b/141850/edit
http://lib.rus.ec/b/141849/edit
http://lib.rus.ec/b/141848/edit
http://lib.rus.ec/b/141847/edit
http://lib.rus.ec/b/141846/edit
http://lib.rus.ec/b/141845/edit
http://lib.rus.ec/b/141844/edit
http://lib.rus.ec/b/141843/edit
http://lib.rus.ec/b/141842/edit
http://lib.rus.ec/b/141786/edit
http://lib.rus.ec/b/141784/edit
http://lib.rus.ec/b/141783/edit
Это не все, но мне надоело копипастить.
Отв: Невалидные файлы и Либрусек
Да. В чём проблема-то? Я немножко покликал - никаких особых проблем с файлами не обнаружил (невалидность - это не проблема), а из Вашего текста так и не понял - какие у Вас, собствено, претензии к этим файлам. Что этот "Стремиительный Свет" версию сразу 2 поставил, что ли?
Отв: Невалидные файлы и Либрусек
1. Оглавление.
2. Сноски.
3. Отсутствие нормально прописанного автора\названия, да и вообще дескрипшена.
Менее значительные:
1. кавычки
2. минусы вместо тире
По сути это txt. Внимание вопрос. Зачем заливать txt, если есть doc?
Отв: Невалидные файлы и Либрусек
Мне лично - пофиг. (и, думаю, не только мне)
Да, хорошо бы было иметь их работающими. Но и без них несмертельно.
Нэнада. Без нормально прописанного автора\названия файл не может быть каталогизирован, следовательно, они там есть.
Дважды пофиг.
Трижды пофиг.
Например затем, что это всё-таки fb2, а не txt и не doc, и, следовательно, с ним работают и MyHomeLib, и читалки, и вообще весь фб2-софт.
Отв: Невалидные файлы и Либрусек
Неправильно думаешь. Если посчитать по головам - ты в меньшинстве.
Ога. Как тебе автор с именем Михаил Валерьевич Садов. Наверно в fb2 ФИО с жиру придумали дикие люди, да?
Если человек делает для себя - он может сказать "А пофиг, и так сойдет. Не собираюсь я его каталогизировать.", но если он делает для других, то никаких пофигов быть не должно.
З.Ы. Чуть не забыл - анотации. Аккуратно добавлены руками на сайте. Тобишь в myhomelib их уже не увидеть.
Судя по всему человек действительно хочет делать нормальные книжки, но просто еще не опытен. Я ему уже кинул в личку ссылку на руководство по созданию fb2 и на FBE.
Отв: Невалидные файлы и Либрусек
Аа, блин, дотуда я не докликал, пардон... а там, оказывается <first-name>Михаил Валерьевич Садов</first-name> с пустым ласт-неймом. Да, за такое надо этого "Стремиительного света" расстрелять и над могилой надругаться. И попросить больше так не делать, каталогизацию ломать - это не кавычки лапками.
Упдате: кстати, наверное, имеет смысл попросить Ларина добавить ещё запрет на fb2 с отсутствующим или пустым title-info - author - last-name.
Отв: Невалидные файлы и Либрусек
А дотуда и не надо было - ссылки специально на "edit" были - видно же как сайт обрабатывает все эти файлы и что он там в дескрипшене находит. Но зато на вопрос Вы постепенно ответили. Спасибо... Bullfear
Отв: Невалидные файлы и Либрусек
Либрусек в дескрипшне не показывает автора.
Отв: Невалидные файлы и Либрусек
Ну да , это я перехожу оттуда машинально на автора и смотрю написание. У всех же свои способы проверки, это да. (
Отв: Невалидные файлы и Либрусек
Упдате: кстати, наверное, имеет смысл попросить Ларина добавить ещё запрет на fb2 с отсутствующим или пустым title-info - author - last-name.
Не согласен с автором данного поста в целом. Я скачал и прочитал книги. Есть парочка ничего.Я не такой ленивый как многие здесь. Так что кое-чего подправил в файлах данного Стремиительного света. Да и так читать можно. А всякими программами типа MyHomeLib не пользуюсь в принципе. Еще раз повторяю читать можно. А косяки поначалу у всех бывают. Лишь те кто привык жить на всем готовеньком, как говорила моя прабабушка, потерявшая во время войны от готода маленького сына, могут говорить такое. Руки и голова всем даны. Взял да исправил. И не поднимал такой шум. Я же не орал когда скачал где=то 30 книг которые не открываются из ошибки в структуре. Взял для себя подправил и нормально. Только многие привыкли пользоваться трудами других. Я считаю, что лучше уж такие файлы, чем те где автор прописан правильно, но нарушена структура fb2.
Отв: Невалидные файлы и Либрусек
Дело не в том чем кто из нас пользуется у себя. Штука в том, что движок Либрусека заточен под автоматическую обработку и катологизацию fb2, потому
и важен правильно заполненный дескрипшен - для Либрусека и его сервисов, не только для отдельных пользователей.
(тяжело вздохнув)
ИМХО лучше уж такие файлы, где и автор прописан правильно, и дескрипшен правильно, и структура не нарушена... А pkn и Вы почему-то требуете выбрать что-нибудь одно. Злые вы.
Страницы