Невалидные файлы и Либрусек

Сильно подозреваю, что вопрос уже поднимался и неоднократно.
Поэтому не буду предлагать решать проблему невалидных файлов "в лоб", наверняка их присутствию и постоянному увеличению их количества в библиотеке есть объяснение.

Но проблема существует - в библиотеке огромное количество невалидных книг и их количество будет увеличиваться. В качестве мер по борьбе с этим явлением предлагаю следующее:

1. Ввести оценку, метку, называйт это как хотите - аналог знака качества. Невалидные книги будут помечаться этим знаком, их можно будет просмотреть отдельно.
2. Про добавлении книги проверять ее валидность. В библиотеку добавлять, но помечать и выдавать сообщение на странице добавления.
3. В идеале, прогнать через валидатор все имеющиеся книги, отмаркировать невалидные и на странице книги выдать информции об ошибках.

Дополненение. Более корректно мое предложение сформулировал Ulenspiegel:

Web-сервис, по имеющемуся файлу сообщающий:
- является ли файл коректным XML - файлом
- соответствует ли файл схеме FB2
- содержит ли ошибки, препятствующие его чтению наиболее популярных читалках

Alor написал:
Я не такой ленивый как многие здесь.

(весело смеётся)

pkn написал:
Alor написал:
Я не такой ленивый как многие здесь.

(весело смеётся)

Больше ничего сказать что-ли не можешь?

Alor написал:
pkn написал:
Alor написал:
Я не такой ленивый как многие здесь.

(весело смеётся)

Больше ничего сказать что-ли не можешь?

А больше ничего и не нужно.

Bullfear написал:
Если человек делает для себя - он может сказать "А пофиг, и так сойдет. Не собираюсь я его каталогизировать.", но если он делает для других, то никаких пофигов быть не должно.

+ 100

Алексей_Н написал:
Bullfear написал:
Если человек делает для себя - он может сказать "А пофиг, и так сойдет. Не собираюсь я его каталогизировать.", но если он делает для других, то никаких пофигов быть не должно.

+ 100

+100

И мне предложение Alexx_S очень нравится.

Bullfear написал:
По сути это txt. Внимание вопрос. Зачем заливать txt, если есть doc?

Тезис о фактическом превосходстве наличного конкретного .doc'а над .txt традиционно не доказан.

В личной практике таковые (реально превосходящие txt по наличным элементам структурирования) doc'и - это хорошо если 10% от общего числа.

pkn написал:

Да. В чём проблема-то? Я немножко покликал - никаких особых проблем с файлами не обнаружил (невалидность - это не проблема), а из Вашего текста так и не понял - какие у Вас, собствено, претензии к этим файлам. Что этот "Стремиительный Свет" версию сразу 2 поставил, что ли?

Ну-у-у, pkn, я же специально вид дескрипшиена привела, нет там ни жанра, ни отображающегося автора, ну причем здесь версия 2, а?

Tanja45 написал:
pkn написал:

Да. В чём проблема-то? Я немножко покликал - никаких особых проблем с файлами не обнаружил (невалидность - это не проблема), а из Вашего текста так и не понял - какие у Вас, собствено, претензии к этим файлам. Что этот "Стремиительный Свет" версию сразу 2 поставил, что ли?

Ну-у-у, pkn, я же специально вид дескрипшиена привела, нет там ни жанра, ни отображающегося автора, ну причем здесь версия 2, а?

Либрусек в дескрипшне не показывает автора, поэтому мне, пока Bullfear не сказал, и не пришло в голову, что чтобы обнаружить косяк, нужно сгрузить книжку и посмотреть в редакторе. А отсутствие жанра я, каюсь, просто не заметил.

Соглашусь с предложениями Alexx_S-а, они на самом деле весьма разумны. Касательно 40K невалидных книг - делались они достаточно примитивным скриптом, потому и проблемы. Imho, переделывать их нет нужды, достаточно было-бы пройтись fb2fix-ом (хотя-бы для того, чтобы они открывались Haali Reader-ом). Но вот касательно новых книг - я считаю, что валидация нужна обязательно. Правда, как уже заметили, валидация отнюдь не означает хорошего качества книги :-( Imho, отчасти эту проблему можно было-бы решить путем "ручной" проверки. Могу предложить такой вариант: каждому скачавшему предлагается оценить (в полуобязательном порядке, как на ebay-е покупку), качество книги. При достижении некоего порогового значения о низком качестве, автору документа (либо залившему его) отправляется email, а сама книга переводится в режим on hold до улучшения.

Страницы

X