Вы здесьВалидация fb2
Опубликовано ср, 15/04/2009 - 19:50 пользователем larin
Forums: 1. Добавил валидацию загружаемых книг.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Леди Стервa RE:Подайте бедному копеечку на книжку с литреса... 4 часа
kopak RE:О группе Дятлова. О той самой, того самого... 15 часов Isais RE:Катя Водянова - Дом и два жениха в придачу 1 день Aleks_Sim RE:Прошу переформатировать, распознать, etc... 2 дня kopak RE:Таинственная личность админа Флибусты 6 дней Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 неделя Isais RE:Дмитрий Анатольевич Горчев - ЖЖ Дмитрия Горчева (2009–2010) 1 неделя Саша из Киева RE:Детям о Ленине (Издание 1965 года) 1 неделя Саша из Киева RE:Приключения Мишки-Ушастика (Перевод Марата Брухнова) 2 недели babajga RE:Белая княжна 3 недели Isais RE:Файл достаточно хорош. Нет смысла в его улучшении. Ага,... 3 недели mazay RE:Sleepy Xoma - Bagⲣѱnoⲣojdennaѱ 4 недели zlyaka RE:С Новым годом! 4 недели Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 1 месяц SparkySpirit RE:Жорж Санд - переводы 19 века 1 месяц Саша из Киева RE:Наш дом - СССР 1 месяц babajga RE:Чернушка. Повести 1 месяц Саша из Киева RE:Сказки далёких островов 1 месяц Впечатления о книгах
Chernovol про Полтавченко: В прицеле «Азов» (Современная проза, О войне, Роман)
30 01 При чем тут "гражданская война"? Разве что граждане рф пришли убивать граждан Украины. Оценка: нечитаемо
Aleks_Sim про Полтавченко: В прицеле «Азов» (Современная проза, О войне, Роман)
30 01 Лысенко Владимир Андреевич" - а что "Азов" это современный украинский мир ? Оценка: отлично!
Лысенко Владимир Андреевич про Полтавченко: В прицеле «Азов» (Современная проза, О войне, Роман)
30 01 Нечитаемо, как хорошо убивать всех несогласных с русским миром, все наши правильные, а кто думает по другому должны быть убиты, осталось только Аляску захватить. Оценка: нечитаемо
Barbud про Фонд: Баба Люба. Вернуть СССР 4 (СИ) (Попаданцы, Самиздат, сетевая литература, Фантастика)
29 01 Дерьмище редкостной зловонности. Главное, что автор писать умеет, пишет образно, без "картона", коим грешат очень многие кропатели нетленки. Но боже мой, какую же херню он пишет! Первые две части осилил, остальные пролистнул по диагонали, ибо чушь. Оценка: нечитаемо
decim про Р. Дж. Баркер
29 01 Хорошо, а местами и отлично. Было бы совсем отлично, если бы автор не растянул историю на три тома, но это обычное дело.
mysevra про Баркер: Алые песнопения (Ужасы, Триллер, Детективы: прочее)
29 01 Как часть истории «Восставшего» - мило и познавательно. Но зачем такое изобилие обсценной лексики уличного разлива? Для реализьму, так сказать? Так у меня дл вас плохие новости, мои маленькие друзья, это лет 30 назад такое ………
lukyanelena про Гремучий ручей
29 01 Хотите серию про вампиров? Пожалуйста! Только забудьте про романтичные истории с загадочными красавцами и красавицами. Будет больно, будет страшно, будет неприятно, но я скорее поверю в таких тварей, чем в слащавых вампирчиков.
Лысенко Владимир Андреевич про Земляной: Игровой практикум [СИ] (Боевая фантастика, Фэнтези, ЛитРПГ)
29 01 Книга понравилась, читается легко, жду продолжения. Оценка: отлично!
Nicout про Сушков: "Ленинградское дело": генеральная чистка колыбели революции (Документальная литература)
29 01 Говорите, во время блокады Ленинграда руководство города голодало, как и остальные жители, а все рассказы про пирожные, колбасу и икру для коммуняк - вранье и клевета? Ну так прочтите что из себя представляли питерские деятели, ……… Оценка: отлично!
Синявский про Николай Егорович Дронников
28 01 На 95-м году жизни скончался Николай Дронников - советский и французский художник, график, скульптор, прозаик и издатель авторских книг, "летописец русской эмиграции".
ve51 про Чейз: Плоть орхидеи [The Flesh of the Orchid ru] (Крутой детектив)
27 01 Книга не входит в цикл "Дэйв Фэннер
Skyns71 про Гузман: Тропой священного козерога, или В поисках абсолютного центра (Современная проза, Биографии и Мемуары)
27 01 Господи... Жизнеописание наркомана. |
Отв: Валидация fb2
Вы сюда потроллить пришли? Ну, продолжайте без меня.
Отв: Валидация fb2
Я сюда пришел предложить Вам получше продумывать Ваши предложения. Однако корм, как видно, не в коня.
Отв: Валидация fb2
Дело в том, что «расширенное» название для некоторых публикаций — всего-навсего вынужденная мера, — в связи с тем, что в здешней базе данных не может равноправно храниться две единицы с одинаковым названием, одна из них должна стать «дублем». А если, например, у романа два разных перевода, то в здешней библиотеке нет другого выхода, кроме как «расширять» название с учётом переводчика. Вот и всё.
Отв: Валидация fb2
Значит, надо исправлять библиотеку. Бардак очень легко устроить и потом очень сложно разобрать. Я с буквально такой же проблемой сталкивался — люди забивали в одно поле разную по сути информацию, и когда настало время обновлять систему, пришлось долго и упорно весь этот мусор вычищать. Далее, fb2-файл — это образ конкретной книги, а не обобщённый образ литературного произведения, как на фантлабе. Разные издания одной книги должны одновременно сосуществовать в рамках одной библиотеки, пусть даже для него не будет загруженного файла книги. Библиотеку делает библиотекой не куча книг, а структурированный каталог. Если часть этой структуры не поддерживается форматом файла, нужно это унести на уровень библиотеки (например, альтернативные названия, альтернативные издания (журнальный вариант, к примеру) и так далее). На фантлабе построена очень хорошая система каталогизации книг и к ней очень хорошо прикручивается непосредственно файл книги, но из-за политики фантлаба это невозможно. Вот нам нужно что-то типа фантлаба, но с файлами книг, открытой базой и открытым кодом, чтобы коллективный труд нельзя было одним махом прикрыть.
Отв: Валидация fb2
Ну я бы не стал брать ФантЛаб за образец каталогизации книг — именно потому что ФантЛаб не библиотека, а только картотека, каталог. То есть у ФантЛаба сугубо информационная функция — сообщить данные об авторе и всех неэлектронных изданиях его произведений. А Либрусеку нужно в первую очередь снабжать читателей текстами и делать это так, чтобы читатель не путался в многочисленных дубликатах или вариантах одного и того же текста.
И я не могу радикально не возразить такому твоему предложению: «Разные издания одной книги должны одновременно сосуществовать в рамках одной библиотеки, пусть даже для него не будет загруженного файла книги». Нет! нет! и ещё раз нет! В каталоге библиотеки должно быть только то, что в ней есть — только уже загруженные единицы хранения. Сведения же о всех фактических изданиях должны помещаться в раздел «описание автора».
Отв: Валидация fb2
Это никакое не возражение. Я за то, чтобы информация структурированно хранилась в библиотеке, а уж в каком месте она будет показываться — это дело десятое. Если данные структурированные, то их представление можно менять как угодно, в этом и прелесть подхода. У фантлаба данные структурированы, поэтому там можно легко сделать что угодно. На бардаке легко сделать не получится. У фантлаба есть один большой недостаток — там информация может изменяться лишь очень небольшим кругом людей, и некоторых авторов они не хотят принимать по причинам типа «отсутствие публикаций» и так далее. Вот если взять за основу схему данных фантлаба, да сделать на ней открытый движок, да ещё детально описать все правила работы — получится просто фантастическая неубиваемая штука.
Отв: Валидация fb2
Ещё раз — на ФантЛабе структурированы странички с инфой по книгам, имеющим неэлектронное издание. Но не файлы с самими книгами. Разница существенная — у них заведомо нет проблемы с дубликатами текста, ведь текстов нет вообще!
Кроме того, заметь, как на ФантЛабе «прекрасно» структурованы данные о романе «Оружие скальда» Дворецкой, если посмотреть на странички work90693 и work18313. Ну просто сразу всё понятно, где первая редакция, а где вторая, значительно переработанная… — инфа об этом внесена только на страничку цикла, на страничках изданий об этом ни гу-гу. А вообще разобраться с этим циклом, где там именно первые издания романов, а где переделки — без поллитры не разберёшь. Но нужна именно поллитра, помимо ФантЛаба приобретаемая, потому что ФантЛаб нужную инфу не представил.
Отв: Валидация fb2
А электронные книги откуда берутся? Правильно — из неэлектронных. Прикрутить поддержку файлов в книг в схеме фантлаба очень легко. А вот прикрутить поддержку разнообразных метаданных о книгах в либрусеке сложно. И даже если книга изначально электронная, в фантлабе проблем не возникаетю
Блин, это проблема предстваления. Информация-то об этом явно представлена в метаданных книги. Поэтому её можно вывести и на страницу книги. А если не сделано…, ну, мало ли багов в фантлабе. Но заметьте — это баги представления, которые легко фиксятся. Баги в ядре фиксятся сложно.
Отв: Валидация fb2
Очень легко только рассуждать здесь о том, что очень легко прикрутить там. Потому что представление о механизме фиксации данных предельно абстрактное. :-/
В третий раз повторяю. На ФантЛабе для книг создаются страницы — для одного и то же текста этих страниц можно насоздавать чёртову тучу. И, конечно, разобраться в этой чёртовой туче не составит труда, если это один и тот же текст. А вот если один и тот же роман оказывается в нескольких переводах или в нескольких редакциях с разными названиями, то и на ФанЛабе появляются «расширенные» названия с пояснениями в скобках. Чем эта ситуация в положительную сторону отличается от ситуации на Либрусеке, а? Ничем. Всё те же «неправомерные» перелицовки названий.
Дальше. На ФантЛабе строчка в авторской библиографии ссылается на что? — правильно, на страницу с инфой по книге. А эта страница ссылается на страницы с инфой по каждому отдельному изданию. (И читателю ФантЛаба должен ковыряться в этих многочисленных страничках, прежде он поймёт какое издание чем именно отличается от другого, что, например, роман «Железная голова» не входит в роман «Корни гор» 2004 года издания, но представляет собой половину романа «Корни гор» 2007 года издания (роман входит в… роман оригинальное представление инфы, однако)). На Либрусеке строка авторской библиографии должна содержать ссылку на текст. Но никак не на страницу с несколькими ссылками на несколько текстов.
Наконец, есть ли на ФантЛабе рубрика, которая бы объединяла идентичные тексты произведения и обосабливала другие (другой редакции, другого перевода)? Нету. Потому что ФантЛабовцам пофик эти проблемы — их посетители должны отправляться в магазин, а не получать текст на месте.
Отв: Валидация fb2
Вообще-то валидатор ничего в файле не меняет, он только проверяет на вшивость. Или вы про что?
Отв: Валидация fb2
Я про валидатор ничего не знаю. Я лишь предлагаю добавлять в файл информацию о характере изменений, если меняется книга из библиотеки. То есть берётся файл, исправляются ошибки валидации и снова заливается в систему (заменяется битый на новый). При этом увеличивается версия и добавляется блок history. Улучшать в битых файлах можно много чего. Часто там, например, нет разбивки на главы и весь текст идёт одной секцией. Или сноски оформлены угловыми скобками. В идеале это всё надо фиксить, но это долго.
Отв: Валидация fb2
А почему Вы решили, что это не делается? Кто Вам это сказал? Это "предлагается" примерно около года. И если файл правится, а не верстается заново - так и положено делать.
Да, долго. Но надо.
P.S. Если сноски оформлены угловыми скобками - файл так и останется битым. Однозначно.
--------------------
Постепенно дошло и до меня - Вы, похоже, предлагаете добавлять информацию в history автоматом при заливке новой версии? Едва ли это правильно. Оно получится "малоинформативным".
Отв: Валидация fb2
Ну вот неплохо было бы на какое-нибудь видное место положить такие правила, я пока не нашёл.
Да, долго. Но надо.
P.S. Если сноски оформлены угловыми скобками - файл так и останется битым. Однозначно.
--------------------
Нет, нет, нет. Я не предлагают править автоматически fb2-файл. Я предлагал просто как-то стандартизировать процесс изменений, см. начало сообщения.
У меня была другая идея, но я её пока не озвучивал: хочется иметь историю изменения книги в библиотеке. Это совершенно не то же, что document-info/history из файла, это именно лог причин обновлений книги. Например, автор обновляет книгу в библиотеке и пишет на вебформе обновления комментарий типа «фикс ошибок валидации: убраны ошибки распознавания, тег middle-name помещён на правильное место» или «заменено на новую, более качественную версию из другого источника». Но эта идея скорее к функциональности библиотеки относится
Отв: Валидация fb2
Не относится, но определенный смысл в ней есть - если например добавить такое поле да еще и обязательное в "Нашел дубля. Кликните разрешить конфликт" то есть если человек меняет одну книгу на другую ее версию - пусть напишет почему втбрал именно этот вариант" , польза от этого в том что хоть некотторых заставит задуматься прежде чем автоматом кликать на тот что залил сам , да и библиотекарям если разбирать такой "конфликт" то будет легче.
Впрочем вся эта дискуссия к валидации вообще не имеет никакого отношения.
Отв: Валидация fb2
добавте пожалуйста валидацию без загрузки на сайт
Отв: Валидация fb2
http://code.google.com/p/fb2utils/downloads/list
Скачайте себе последнюю версию и тогда Вы сможете валидировать файл до загрузки на сайт.
Отв: Валидация fb2
Как в валидаторе отключить проверку даты?
Отв: Валидация fb2
А как валидатор совместить с новыми жанрами FBE?
Отв: Валидация fb2
Это легко. Достаточно заменить файл FictionBookGenres.xsd (из папки валидатора) на новый.
Отв: Валидация fb2
Спасибо! Успешно.
Отв: Валидация fb2
А вот мне всегда сомнительно, надо ли это делать. Для других библиотек ведь эти файлы тогда могут оказаться невалидными. Или это пофигу и нафигу, и все равно надо чтобы прямо в файле новые жанры?
Отв: Валидация fb2
Уважаемые, столкнулся с такой проблемой валидации данных.
Данный прием использования секций некорректен, выдается ошибка нарушения схемы DTD (expecting image, p...):
<body>
<title><p>Author</p><p>Book name</p></title>
<section>
<title><p>Title of section 1 level</p></title>
<p>Text 1.</p>
<section>
<title><p>Title of section 2 level</p></title>
<p>Text 2.</p>
</section>
</section>
</body>
После валидации курсор ставится в проблемное место - в конце тэга вложенной секции (после второго < section >). Что это значит?
Но если текст 1 заключить в секцию - валидация проходит.
<body>
<title><p>Author</p><p>Book name</p></title>
<section>
<title><p>Title of section 1 level</p></title>
<section>
<p>Text 1.</p>
</section>
<section>
<title><p>Title of section 2 level</p></title>
<p>Text 2.</p>
</section>
</section>
</body>
С чем это связано? Нарушение структуры, правил использования схемы? По логике-то все верно..
Отв: Валидация fb2
При чем тут логика?
В Вашем первом варианте слишком большая нагрузка на интерпретатор читалки получается. Второй вариант проще.
Но все уже давно привыкли к тому, что текст должен быть заключен в теги "section" и теги "p" и "section" не могут быть на одном уровне.
Отв: Валидация fb2
Не может секция начинаться посередине текста. Перед началом секции обязательно должна быть либо (а) закрыта предыдущая секция либо (б) закрыт её title. Иными словами недопустимым является вот это
.
....</p>
<section>.....
Отв: Валидация fb2
Но на практике такое часто случается, даже в моей текущей книге. И как, тогда такие исключения обходить? Согласно описанному второму варианту?
И еще.. валидатор FBUtils на такие случаи размещения секций смотрит спокойно. Либо баг программы, либо это допустимо.
Отв: Валидация fb2
Исправлять.
Отв: Валидация fb2
Путем использования второго варианта? Очевидно..
Отв: Валидация fb2
<body>
<title>
<p>Титл</p>
</title>
<section>
<title>
<p>Уровень 1</p>
</title>
<section>
<p>****************</p>
</section>
<section>
<title>
<p>Уровень 2</p>
</title>
<p>◦******************</p>
</section>
<section>
<title>
<p>Уровень 2</p>
</title>
<section>
<p>◦********************</p>
</section>
<section>
<title>
<p>◦Уровень 3</p>
</title>
<p>**************************</p>
</section>
</section>
</section>
</body>
Отв: Валидация fb2
Да, таким же образом я и поступаю сейчас. Но в этом случае на лицо пустые подзаголовки (< section >) в оглавлении.
Отв: Валидация fb2
Ну и? Почему это Вам мешает?
Ситуация довольно распространённая.
Отв: Валидация fb2
Если так Должно быть, то вопрос по этой теме снимается. Я в создании fb2 еще новичок и потому каждое несоответствие, подозрительное действие воспринимаю критично. :)
Кстати, выше означенная проблема уже описана в http://lib.rus.ec/node/111115
Но мне не дает покоя - почему валидатор FB2Utils такие несоответствия проглатывает? Он не безгрешен? FB2Utils vs FBE - 0:1 :)
Отв: Валидация fb2
Так может быть.
Насчёт валидатора: хотелось бы увидеть конкретный файл.
Отв: Валидация fb2
Отправил в личку файл.
Отв: Валидация fb2
Я Вам ответила. Файл невалидный:
Так что валидатор работает штатно. ;)
Отв: Валидация fb2
Да, спасибо :) без посторонней помощи я бы погряз в самодурстве и лжекритике))
Высказывание про косячность FB2Utils было скороспелым. Выяснилось, что ошибки с секциями он не пропускает.. пока что. Так что, FB2Utils vs FBE - дружественная НИЧЬЯ! :)
Отв: Валидация fb2
Если сделать согласно второму варианту, то в оглавлении появляется пустой раздел (без title, соответствует абзацу с текстом 1):
< Title of section 1 level >
< section >
< Title of section 2 level >
Но это терпимо.
Отв: Валидация fb2
Не все программы для чтения этим грешат. Например, в CR2 в оглавлении никаких пустых разделов не наблюдается. Так что не заморачивайтесь на этот счет, пусть разработчики программ об этом думают.
Отв: Валидация fb2
Согласен. Достаточно лишь не отображать подобные пустышки, а редактор FBE по идее как раз и должен отображать все секции независимо, имеют ли они заголовки (title) или нет.
Зато они в CR3 наблюдаются :)
Отв: Валидация fb2
А вот HaaliReader, AlReader и CoolReader2 это дело в оглавлениях игнорируют.
Отв: Валидация fb2
Вопрос к технической службе.
А можно ли сделать так, чтобы заливаемый fb2 файл в случае выявления on-line валидатором ошибок (речь идёт об ошибках, не носящих критического характера) выдавал бы предупреждение (список выявленных ошибок) и предлагал выбор из двух вариантов:
[а] Ой, простите. Не надо такое заливать, я сейчас поправлю; (XOR)
[б] Всё-таки залить несмотря на ошибки!
При этом по умолчанию работает вариант [а].
Отв: Валидация fb2
сам задавался этим вопросом, пока не увидел тут http://lib.rus.ec/soft в самом низу оффлайн прожку выполняющую проверку) прежде чем заливать просто ей проверяйте :)
Отв: Валидация fb2
Полностью поддерживаю предложение VolgoDon-а. Причиной ляпа может быть обычная запарка или рассеянность, но пути назад уже нет - файл на сайте.
Отв: Валидация fb2
+1
Отв: Валидация fb2
Меньше некачественных файлов будет.
Отв: Валидация fb2
+1000!
Отв: Валидация fb2
Не уверен, сюда ли обращаюсь..
Мне интересно знать, какие стили распознает doc2fb, кроме основного текста и подразделов? Как форматировать цитаты, стихи и т.п.?
Отв: Валидация fb2
Все что выходит из под doc2fb необходимо допиливать руками на FictionBook Editor. Формат doc и pdf вообще лучше сразу перегонять в этот редактор с помощью Any2FB2. И там опять же допиливать вручную.
Отв: Валидация fb2
Лучше воспользуйтесь OOoFBTools, в нем можно все стили расставить, какие нужны для FB2 и даже не требует допиливания в FBE, сразу создает валидный документ, не требует наличия Ворда, как doc2fb, но работает на OpenOffice и требует либо OpenOPffice либо LibreOffice. И все же, хотя допил в FBE после OOoFBTools не требуется, всё же лучше пройтись FBE и посмотреть, что получилось, может что нужно подправить.
Отв: Валидация fb2
Вопрос молодого-начинающего.
Честно все прочитал с самого начала
и не понял - как валидатор установить
и как им пользваться?
Отв: Валидация fb2
http://ge.tt/7W0d0Jt/v/0
Скачать, распаковать, кликнуть на validator-gui перейти к проверяемому фб2 файлу и постараться расшифровать на что валидатор возмущается
Страницы