Вы здесьНевалидные файлы и Либрусек
Опубликовано пт, 13/03/2009 - 11:20 пользователем Alexx_S
Forums: Сильно подозреваю, что вопрос уже поднимался и неоднократно. Но проблема существует - в библиотеке огромное количество невалидных книг и их количество будет увеличиваться. В качестве мер по борьбе с этим явлением предлагаю следующее: 1. Ввести оценку, метку, называйт это как хотите - аналог знака качества. Невалидные книги будут помечаться этим знаком, их можно будет просмотреть отдельно. Дополненение. Более корректно мое предложение сформулировал Ulenspiegel: Web-сервис, по имеющемуся файлу сообщающий:
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
kopak RE:О группе Дятлова. О той самой, того самого... 1 час
babajga RE:Ласси возвращается домой 1 день Den_Klimov RE:Таинственная личность админа Флибусты 1 день sem14 RE:Подборка о Первой Мировой 2 дня wvd RE:Подайте бедному копеечку на книжку с литреса... 2 дня Isais RE:удаление "двойников" 3 дня Isais RE:Кармен Мола - Пурпурная сеть [litres] 1 неделя Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 1 неделя Isais RE:Катя Водянова - Дом и два жениха в придачу 2 недели Aleks_Sim RE:Прошу переформатировать, распознать, etc... 2 недели Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 3 недели Isais RE:Дмитрий Анатольевич Горчев - ЖЖ Дмитрия Горчева (2009–2010) 4 недели Саша из Киева RE:Детям о Ленине (Издание 1965 года) 1 месяц Саша из Киева RE:Приключения Мишки-Ушастика (Перевод Марата Брухнова) 1 месяц babajga RE:Белая княжна 1 месяц Isais RE:Файл достаточно хорош. Нет смысла в его улучшении. Ага,... 1 месяц mazay RE:Sleepy Xoma - Bagⲣѱnoⲣojdennaѱ 1 месяц zlyaka RE:С Новым годом! 1 месяц Впечатления о книгах
Belomor.canal про Ширвиндт: Мемуары двоечника (Биографии и Мемуары)
17 02 Текст, написанный сыном известного артиста, который с ранних лет был частью артистической среды. Вечеринки заканчивались в три часа ночи, а иногда и позже. Всё это происходило под руководством Маркуши Захарова из «Ленкома», ……… Оценка: хорошо
Aleks_Sim про Владимирский: На киевском направлении (Военная документалистика)
17 02 Книга сделана и перезалита на основе текста из militera.lib.ru
mysevra про Замяткин: Тай-чи языка, или Вас невозможно научить иностранному языку (Языкознание, Иностранные языки, Самиздат, сетевая литература)
17 02 По форме - много пустой болтовни в фиглярской манере, но по сути метод очень хорош, опробован на английском: в результате заполнились пробелы в аудировании и спонтанном говорении, которые до этого не могли исправить ни школа, ……… Оценка: отлично!
mysevra про Антошенко: Дар Богов (Детективная фантастика, Самиздат, сетевая литература)
17 02 Купилась на "необычные способности людей". Не стоило. Оценка: плохо
mysevra про Акунин: Москва-Синьцзин (Исторический детектив)
17 02 Мило, поверхностно и водевильно. А страна - страна не меняется. Оценка: хорошо
Nicout про Сетров: Воинствующая олигархия США против всего мира и нас (Публицистика)
17 02 Вот я думаю: а может, нас для примера держат. Весь мир смотрит и пальцем показывает: - Видите, дети, так жить нельзя." М.Жванецкий Оценка: нечитаемо
Barbud про Старый: Начало пути (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
16 02 Чудовищное многословие. За пространными авторскими отступлениями и историческими справками нить сюжета еле видна, действие не разворачивается, а вяло подергивается. Явно не осилю. Оценка: нечитаемо
Barbud про Санфиров: Дважды в одну и ту же реку не войти (Альтернативная история)
16 02 И здесь Санфиров ничем не удивил. Все то же суховатое, практически безэмоциональное изложение, почти протокол или синопсис. Ему бы хорошо подошло писать научно-техническую литературу. Попаданец и тут нормальный, без закидонов ……… Оценка: неплохо
Den_Klimov про Бобров: Эпоха мертворожденных [= Украина в огне] (Альтернативная история)
16 02 Случайно дошли руки полистать данный опус, покрытый говном мамонта. Изнутри как оказалась субстанция та же. Литературных качеств касается также. ;) .. Автор, к слову, родом из той местности в Луганской области, куда ………
trampak про Сетров: Воинствующая олигархия США против всего мира и нас (Публицистика)
16 02 Россия-СССР выполнила одну из важнейших своих исторических миссий – она показала человечеству, как не надо жить и поступать.Для самих жителей россии урок не пошёл впрок. Оценка: нечитаемо
Линтра про Зеланд: Трансерфинг себя [litres] (Эзотерика, Самосовершенствование)
16 02 Везде, на всех ресурсах вижу эту книгу. Кто-нить читал? что хорошего сказать могёте, друзья?
Shelest2000 про Хренов: Московское золото, или Нежная попа комсомолки. Часть 1 [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
16 02 Нормально. С юмором и без кучи роялей в кустах. Надеюсь на третью книгу. |
Отв: Невалидные файлы и Либрусек
1. Уже есть.
2. Тоже уже есть. Если к примеру нет названия, посылает.
3. Нереально. Этих книг более 40к+. Вообщем, если видите при переходе на линк "исправить" в тегах rusec - книга не валидная. Помочь может Fb2Fix.
Отв: Невалидные файлы и Либрусек
Это, как раз, вполне реально сделать - прогнать Librusec-Kit-овые книги через Fb2Fix и перезалить. Но я, честно говоря, не вижу в этом особого смысла.
Отв: Невалидные файлы и Либрусек
я имел, прежде всего, книги вновь добавляемые.
Отв: Невалидные файлы и Либрусек
Видимо я не так выразился :(. Валидность и качество книги - разные вещи. Я имел в виду как раз качество. Привести в порядок 40к+ книг в разумные сроки не реально. Сделать валидными - да реально, но смысла нет.
Отв: Невалидные файлы и Либрусек
Я имел в виду полноценную валидацию именно при добавлении и автоматическую выставку оценки.
Если политика такова, что лучше книга плохого качества, чем никакой (лично я категорически против), то лучше хоть как-то дать знать человеку, что с его файлом не все в порядке. И дать знать другим, кстати, тоже.
3. Абсолютно реально, если посомтреть что на данный момень сделано.
Отв: Невалидные файлы и Либрусек
Слава богам, что не Вы определяете политику.
Отв: Невалидные файлы и Либрусек
Может быть. Потворствовать лени и неуважению к другим пользователям я бы точно не стал
Отв: Невалидные файлы и Либрусек
Громкие слова. Вот лучше объясните мне: чем отсутствие книги лучше её присутствия в плохо оформленном виде? Для библиотеки, не для Вас лично.
Отв: Невалидные файлы и Либрусек
1. Плохо сделанный файл ничего кроме раздражения не вызывает. Читать его невозможно, каталогизировать аналогично.
2. Если в библиотеке есть плохо сделанный файл, велика вероятность, что другой заливальщик впишет в поиск название, увидит "ага, такая книга уже есть" и не будет заливать новую.
3. Проще делать fb2 из того же doc или txt, чем переделывать кривой fb2.
Отв: Невалидные файлы и Либрусек
Подпишусь под вышесказанным. Именно так я и считаю.
Кроме того, вопрос поставлен некорректно. Я не призываю изменить существующий порядок, я за то, чтобы книги в библиотеке стали более качесвенными - надеюсь, это желание сомнений не вызывает?
Можно долго спорить - место ли корявым файлам в библиотеке. Но указать заливающему на то, что файл невалидный можно ведь? А сделать удобным отображение этих невалидных файлов? А, в идеале, не просто сообщить о невалидности, а указать что за ошибка?
Отв: Невалидные файлы и Либрусек
Что некорректного в вопросе "чем отсутствие книги лучше её присутствия в плохо оформленном виде?"?
Не о чем тут спорить. Место - если лучших нет.
Это да. Но Ларин, увы - один, и рук у него всего две.
Отв: Невалидные файлы и Либрусек
В переводе спора на более удобные рельсы. Мои личные предпочтения можно обсудить в ПМ, вопрос, который я вынес на обсуждение, звучит иначе.
А голов сколько? :) Хоть одна есть? Отлично, значит он дееспособен и в состоянии сам за себя решить ;)
Отв: Невалидные файлы и Либрусек
Рельсы "лучше никакой книги, чем плохо оформленная" Вам удобны, а рельсы "лучше плохо оформленная книга, чем никакой" - неудобны? А можно узнать - почему?
Отв: Невалидные файлы и Либрусек
Рельсы "Лучше.... чем" мне неудобны в любом случае - они уводят в сторону обсуждение.
Как мы уже выяснили, Вы не против того, что я предлагаю, что еще обсуждать? Мою позицию? Я ее высказал в самом начале. Спорить чья позиция лучше? Не хочу.
Отв: Невалидные файлы и Либрусек
Я не понял почему и куда "Лучше... чем" уводят обсуждение. Ну да, впрочем, и ангел с ними.
Я влез в этот разговор после Вашего "Если политика такова, что лучше книга плохого качества, чем никакой (лично я категорически против)" и именно из-за Вашего "лично я категорически против".
Влез потому, что это не первый и не восьмой раз такое мнение высказывается. Влез с двумя целями: 1. Сообщить читающим это обсуждение что по данному поводу есть и другие мнения, и 2. Попытаться уяснить себе обоснование Вашего мнения.
Второй цели я, как обычно, не достиг.
Отв: Невалидные файлы и Либрусек
Опять танцы с бубнов вокруг fb2-валидности!
Думаю что основное обоснование в таких случаях - правильно, потому что Я так считаю. Мнения остальных, которым важно содержание книги, а не её обложка и красиво оформленные сноски (кстати, не пользуюсь не в специальной литературе) как обычно "ф топку".
Отв: Невалидные файлы и Либрусек
Т.е Ваше мнение - файлы просто обязаны быть невалидными? То, что о них спотыкаются программы для чтения и каталогизации - ф топку, как Вы выражаетесь?
Еще раз - я не за то, чтобы эти книги убрать, я за то, чтобы при добавлении невалидной книги автору документа сообщалось, что с книгой что-то не так.
Отв: Невалидные файлы и Либрусек
Господа, компромиссное предложение. Web-сервис, по имеющемуся файлу сообщающий:
- является ли файл коректным XML - файлом
- соответствует ли файл схеме FB2
- содержит ли ошибки, препятствующие его чтению наиболее популярных читалках
даст возможность добросовестному книголожцу вовремя заметить ошибки и, при вменяемой диагностике, их исправить. А недобросовестному не поможет ничего.
Отв: Невалидные файлы и Либрусек
А почему компромисное? Именно это я и предлагаю
Отв: Невалидные файлы и Либрусек
Тогда не понимаю сути холивора.
Отв: Невалидные файлы и Либрусек
Честно говоря, я тоже не понимаю
Отв: Невалидные файлы и Либрусек
Передёргиваете? Можно ссылочку на место, где я писал про обязательную невалидность?
Хотя лично мне валидность по барабану. В txt почти наверняка можно конвертировать и потом переформатировать как угодно. А если какая книга и не почитается, у меня их только в txt и только фантастики более 5 гиг. (каюсь, ибо грешен, люблю фантастику), не говоря уже обо всём остальном.
Насчёт автоматической каталогизации - не могу понять людей, проводящих всё это автоматом. Я перед сохранением в архив обычно просиатриваю книги и решаю, стоит ли её сохранять и куда именно.
??????????????????
Отв: Невалидные файлы и Либрусек
Почему же? Мое предложение - проверка и вывод информации о валидности. Все остальное - флуд на тему моих личных предпочтений, которые почему-то считаются более важными для обсуждения. То, что Вы процитирвали - яркий тому пример. Да, я категорически не согласен с текущим положением дел, но уважая чужое мнение я предлагаю компромисный вариант.
Отв: Невалидные файлы и Либрусек
То, что я процитировал - явный пример противоречия и ничего более.
Насчёт валидации. Поскольку это Вики-библиотека, никто не мешает тем, кому это важно (Вам в том числе) заняться проверкой валидности заливаемых книг (обычно их не более двух-трёх десятков в день). Сформируйте группу энтузиастов (если это действительно важно, их будет много), распределяйте новае книги по членам группы, оценивайте, предупреждайте... Наберётся в группу человек 10, проверите каждый по 2-3 книги. Ну или напишите соответствующий скрипт для проверки и вышлите Ларину.
И пожалуйста не мешайте заливать новые книги всем желающим.
Отв: Невалидные файлы и Либрусек
Никакого противоречия. И никому я не мешаю. Предложение по группе энтузиастов комментировать не буду.
Отв: Невалидные файлы и Либрусек
Отв: Невалидные файлы и Либрусек
А я - как очень вероятную. Если я хочу отсканировать книгу - я смотрю, есть ли такая в библиотеке. Если есть - сканировать не буду. Если есть, но кривая -править тоже не буду, есть много других интересных книг, сделаю еще что-нибудь.
Отв: Невалидные файлы и Либрусек
Ну и даже если это невероятное-вероятное произойдёт, и случится "есть много других интересных книг, сделаю еще что-нибудь" - чем это плохо?
Отв: Невалидные файлы и Либрусек
Отсутствие таблиц, определенных страниц, перепутанные куски текста, номера страниц посреди текста, разорванные абзацы - это все прелести неумелого конвертирования pdf. Оччень приятно читать такое, ага.
Ключевое слово "своей". Человек нашел в другой библиотеке файл, дальше продолжать? Люди знаешь ли имеют тенденцию не напрягаться.
Представь, что в оригинальном документе есть иллюстрации, сноски и латинские слова. Криво конвертируем и получаем отсутствие допустим 100 сносок(которые можно было бы расставить автоматом), отсутствие картинок (которые могут быть важны для понимания текста, пример - таблицы), и вопросительные знаки посреди латинских слов. Ты точно уверен, что править fb2 проще?
Отв: Невалидные файлы и Либрусек
Ты всё время съезжаешь с очень простого вопроса. Никто и не спорит, что хороший файл лучше плохого. Я только говорю (да, ещё разок напомню - говорю вслед за Лариным), что плохой файл - лучше, чем никакого.
Отв: Невалидные файлы и Либрусек
Я говорю не вслед за кем-то, а всегда за себя. Так вот я говорю - плохой файл плох тем что он бесполезен. Еще раз - бесполезен. Чтение плохого файла убьет все удовольствие от книги. Ессно файл в котором к примеру неправильные кавычки или минусы вместо тире лучше, чем никакого. Пример плохого файла в моем понимании читай выше.
Отв: Невалидные файлы и Либрусек
Пожалуйста, вот Вам "валидная" (в понимании Танюши) книжка: http://lib.rus.ec/a/37259
Типические (типа "е" вместо "с") и не очень опечатки не считаю.
Оборванный абзац тоже.
Расстановка кавычек - никакая.
+ кириллица в названиях аглицких книг --- вообще блеск!
Отв: Невалидные файлы и Либрусек
Это книга сделана с достаточным количеством ляпов. Начать можно с того, что там не все сноски расставлены. Тем не менее плохой, я ее назвать не могу. Это четверка. А расстановка кавычек кстати, делается скриптом за пять минут.
Если книга на русском языке, у нее пишется русское название.
Отв: Невалидные файлы и Либрусек
Чтобы отучить товарища от голословного хамства могу предложить ему конкретный .doc :)))
Чисто в воспитательных целях.
Отв: Невалидные файлы и Либрусек
1. Товарищу есть чем опровергнуть данное утверждение?
2. В упор не вижу хамства.
3. Давно прошло то время, когда меня можно было взять на слабо.
Отв: Невалидные файлы и Либрусек
Абсолютно пустой файл валиден - оценка 5.
Файл в котором сплошной текст - ни заголовков, ни сносок валиден - оценка 5.
Файл в котором заголовки, сноски расставлены, но присутствует не к месту лишний empty-line - невалиден. Оценка 2.
Вывод: валидность - не показатель качества книги.
Да нету никакой политики. Вообще. Никто не запрещает лить хлам, никто не запрещает лить хорошие книги. Разговорами о политике прикрываются обычно те, кому влом нормально сделать книгу.
Отв: Невалидные файлы и Либрусек
А я что-то говорил об оценке? Я говорил о метке - валиден или не валиден, да или нет, оценка качества книги здесь совершенно не при чем.
Я не думаю, что хлам льют исключительно по лени или кривости рук, скорее по незнанию. Нет ничего плохого, если человек при заливке узнае, что с его файлом что-то не так.
Вот моя самая первая книга в фб2: http://lib.rus.ec/b/137530
Чем я прикрываюсь?
Отв: Невалидные файлы и Либрусек
Как оказалось, говорил. Но смысл вкладывал именно такой - невалидность, это не двойка или тройка, это просто факт. У нормального автора наверняка возникнет желание эту метку снять.
Отв: Невалидные файлы и Либрусек
Я вообще то имел в виду не вас, а товарищей вроде peshehodrost-а и Anarhist-a. Не нужно все сказанное принимать на свой счет.
Человек заливает хлам один раз, ему говорят - "это хлам!". Он вместо того чтобы прислушаться, начинает завывать о том, что свободу его злобно ущемили злые библиотекари и напрочь игнорирует все советы. Говорить такому что либо - бесполезная трата времени и нервов. Где-то потерялась темка, в которой peshehodrost, когда всем его файлам поставили(вполне заслуженно) черную метку, поднял визг до небес.
А если человек хочет научится, он как правило сперва хоть чуть-чуть читает FAQ по редактированию книг и как минимум говорит "Это моя первая книга, посмотрите, что может быть не так". И смотрят и помогают. Но при условии, что есть желание учиться.
Отв: Невалидные файлы и Либрусек
Вот такой вопрос к pkn для уточнения его позиции: некий пользователь вчера-сегодня залил некоторое количество книг (ссылки в конце поста). Автором всех этих файлов значится Стремиительный Свет. Все они сделаны скриптом doc2fb. Т.е. сделаны они из doc, частично - даже из Doc, ранее уже залитых на сайт. Дескрипшен имеет такой вот вид:
FB2 document-info:
* fictionbook/description/title-info/book-title Мы уходим
* fictionbook/description/title-info/date 2009-03-14
* fictionbook/description/document-info/author/first-name Стремиительный Свет
* fictionbook/description/document-info/program-used doc2fb
* fictionbook/description/document-info/date 2009-03-14
* fictionbook/description/document-info/version 2
У всех файлов. Валидацию они не проходят. Едва ли они корректно будут обрабатываться каталогизатором Либрусека (могу ошибаться).
В данном случае я не говорю о качестве и структуре самого текста, только о заполнении дескрипшена и именно валидности.
А вот, собственно, и сам вопрос:
Считаете ли Вы такую деятельность правильной и полезной для библиотеки?
Вот ссылки:
http://lib.rus.ec/b/141862/edit
http://lib.rus.ec/b/141859/edit
http://lib.rus.ec/b/141857/edit
http://lib.rus.ec/b/141856/edit
http://lib.rus.ec/b/141853/edit
http://lib.rus.ec/b/141852/edit
http://lib.rus.ec/b/141851/edit
http://lib.rus.ec/b/141850/edit
http://lib.rus.ec/b/141849/edit
http://lib.rus.ec/b/141848/edit
http://lib.rus.ec/b/141847/edit
http://lib.rus.ec/b/141846/edit
http://lib.rus.ec/b/141845/edit
http://lib.rus.ec/b/141844/edit
http://lib.rus.ec/b/141843/edit
http://lib.rus.ec/b/141842/edit
http://lib.rus.ec/b/141786/edit
http://lib.rus.ec/b/141784/edit
http://lib.rus.ec/b/141783/edit
Это не все, но мне надоело копипастить.
Отв: Невалидные файлы и Либрусек
Да. В чём проблема-то? Я немножко покликал - никаких особых проблем с файлами не обнаружил (невалидность - это не проблема), а из Вашего текста так и не понял - какие у Вас, собствено, претензии к этим файлам. Что этот "Стремиительный Свет" версию сразу 2 поставил, что ли?
Отв: Невалидные файлы и Либрусек
1. Оглавление.
2. Сноски.
3. Отсутствие нормально прописанного автора\названия, да и вообще дескрипшена.
Менее значительные:
1. кавычки
2. минусы вместо тире
По сути это txt. Внимание вопрос. Зачем заливать txt, если есть doc?
Отв: Невалидные файлы и Либрусек
Мне лично - пофиг. (и, думаю, не только мне)
Да, хорошо бы было иметь их работающими. Но и без них несмертельно.
Нэнада. Без нормально прописанного автора\названия файл не может быть каталогизирован, следовательно, они там есть.
Дважды пофиг.
Трижды пофиг.
Например затем, что это всё-таки fb2, а не txt и не doc, и, следовательно, с ним работают и MyHomeLib, и читалки, и вообще весь фб2-софт.
Отв: Невалидные файлы и Либрусек
Неправильно думаешь. Если посчитать по головам - ты в меньшинстве.
Ога. Как тебе автор с именем Михаил Валерьевич Садов. Наверно в fb2 ФИО с жиру придумали дикие люди, да?
Если человек делает для себя - он может сказать "А пофиг, и так сойдет. Не собираюсь я его каталогизировать.", но если он делает для других, то никаких пофигов быть не должно.
З.Ы. Чуть не забыл - анотации. Аккуратно добавлены руками на сайте. Тобишь в myhomelib их уже не увидеть.
Судя по всему человек действительно хочет делать нормальные книжки, но просто еще не опытен. Я ему уже кинул в личку ссылку на руководство по созданию fb2 и на FBE.
Отв: Невалидные файлы и Либрусек
Аа, блин, дотуда я не докликал, пардон... а там, оказывается <first-name>Михаил Валерьевич Садов</first-name> с пустым ласт-неймом. Да, за такое надо этого "Стремиительного света" расстрелять и над могилой надругаться. И попросить больше так не делать, каталогизацию ломать - это не кавычки лапками.
Упдате: кстати, наверное, имеет смысл попросить Ларина добавить ещё запрет на fb2 с отсутствующим или пустым title-info - author - last-name.
Отв: Невалидные файлы и Либрусек
А дотуда и не надо было - ссылки специально на "edit" были - видно же как сайт обрабатывает все эти файлы и что он там в дескрипшене находит. Но зато на вопрос Вы постепенно ответили. Спасибо... Bullfear
Отв: Невалидные файлы и Либрусек
Либрусек в дескрипшне не показывает автора.
Отв: Невалидные файлы и Либрусек
Ну да , это я перехожу оттуда машинально на автора и смотрю написание. У всех же свои способы проверки, это да. (
Отв: Невалидные файлы и Либрусек
Упдате: кстати, наверное, имеет смысл попросить Ларина добавить ещё запрет на fb2 с отсутствующим или пустым title-info - author - last-name.
Не согласен с автором данного поста в целом. Я скачал и прочитал книги. Есть парочка ничего.Я не такой ленивый как многие здесь. Так что кое-чего подправил в файлах данного Стремиительного света. Да и так читать можно. А всякими программами типа MyHomeLib не пользуюсь в принципе. Еще раз повторяю читать можно. А косяки поначалу у всех бывают. Лишь те кто привык жить на всем готовеньком, как говорила моя прабабушка, потерявшая во время войны от готода маленького сына, могут говорить такое. Руки и голова всем даны. Взял да исправил. И не поднимал такой шум. Я же не орал когда скачал где=то 30 книг которые не открываются из ошибки в структуре. Взял для себя подправил и нормально. Только многие привыкли пользоваться трудами других. Я считаю, что лучше уж такие файлы, чем те где автор прописан правильно, но нарушена структура fb2.
Отв: Невалидные файлы и Либрусек
Дело не в том чем кто из нас пользуется у себя. Штука в том, что движок Либрусека заточен под автоматическую обработку и катологизацию fb2, потому
и важен правильно заполненный дескрипшен - для Либрусека и его сервисов, не только для отдельных пользователей.
(тяжело вздохнув)
ИМХО лучше уж такие файлы, где и автор прописан правильно, и дескрипшен правильно, и структура не нарушена... А pkn и Вы почему-то требуете выбрать что-нибудь одно. Злые вы.
Страницы