Вы здесьОбработка дублей.
Опубликовано сб, 31/05/2008 - 08:16 пользователем xxxyurixxx
Может все-таки стоит запретить удаление книг для всех? Сделать удаление и обработку дублей модерируемыми? Просто некоторые товарищи уже задолбали заменять отличные файлы неправлеными eBookDownloader'овскими. Сборники Лукьяненко, например, заменили. Сейчас залил назад нормальные.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Aliki RE:Подайте бедному копеечку на книжку с литреса... 23 часа
laurentina1 RE:Ирина Александровна Велембовская - Немцы 2 дня Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 5 дней Саша из Киева RE:Избранное 1 неделя Alligatoreader RE:Багрепорт - 2 1 неделя fedor.de RE:Отображение страницы Librusek 1 неделя Isais RE:Чиполь Сергеевич Наглецов - Огненный дракон [СИ] 1 неделя kopak RE:Таинственная личность админа Флибусты 2 недели blahblahblah2024 RE:Беженцы с Флибусты 2 недели sem14 RE:Что читать о блокаде Ленинграда. Подборка книг 2 недели sem14 RE:Михаил Юрьевич Берг - Андеграунд. Итоги. Ревизия_5 3 недели TaKir RE:Валерия Сергеевна Черепенчук А. Н. Николаева - Мифы... 4 недели Oleg V.Cat RE:B343695 Александр. Книга 1 1 месяц Isais RE:Калибрятина/Самиздатина 1 месяц md2k15 RE:Относительно Вархаммер 40 000 1 месяц tvnic RE:"Коллектив авторов" 1 месяц SergL197 RE:Регистрация 1 месяц ejik.v RE:Viva Stiver! 1 месяц Впечатления о книгах
monochka про Михайлин: Бобер, выдыхай! [заметки о советском анекдоте и об источниках анекдотической традиции] (Анекдоты, Литературоведение)
01 12 какая неприличная книжка однако
S@iRus про Иноходец (Рымжанов)
01 12 У меня сложилось такое же впечатление, как и у Олега, о данной серии.
андрей169 про Шалашов: Господин следователь 1 [СИ] (Альтернативная история, Исторический детектив, Попаданцы, Самиздат, сетевая литература)
29 11 Забавная книга. Мне лично зашло хорошо. С продолжением обязательно ознакомлюсь. Оценка: хорошо
udrees про Баковец: Не тот господин 3 (Порно, ЛитРПГ, Самиздат, сетевая литература)
29 11 Книга строго для отдыха мозгов, тем кому нравится читать про влажные подростковые фантазии про гарем, воплощенные в реальность, и сексуальные подвиги, перемешанные с фэнтези. Герой настолько крут, что особо не заморачивается ……… Оценка: неплохо
udrees про Михайлов: Без пощады. Книга 3 [СИ] (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература)
29 11 Последняя книга из серии, но не последняя книга про месть киборга Вертинского. Написано в том же стиле, что и предыдущие книги. Описание во многом уделено экшену, поэтому всегда держит в тонусе, сражения, драки, убийства и ……… Оценка: отлично!
lukmak про Сочинения Иосифа Бродского в 7 томах
29 11 Бродский - гений. А кто его не понимает - что ж... Он непрост. Но, ребята, если вы его не понимаете - может, это ваша проблема?.. И пиндосы тут ни при чём.
nik_ol про Донцова: Амур с гранатой (Иронический детектив, Детективы: прочее)
27 11 Конечно, я рада, что книги Донцовой выходят и выходят, но неужели, если она сама их пишет, то не помнит, что «старичок» был не Коробков, а Гри, её первый муж, до Ивана в этой серии?! Или всё-таки литературные негры клепают?! Оценка: неплохо
neletay про Котов: Ценитель [СИ] (Городское фэнтези, Самиздат, сетевая литература, Приключения)
27 11 Прочитала только несколько первых глав - и уже очень, очень нравится. Нравится все - сюжет, стиль, язык, ГГ, а также автор, который за всем этим видится. С удовольствием читаю дальше, надеюсь не разочароваться.
Lan2292 про Ермаков: Май, весна и апокалипсис. Книга 1 (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература)
27 11 Так себе чтиво, но не скучно. Оценка: неплохо
Chernovol про Коровин: После «Украины» (Политика, Публицистика)
25 11 Интересно, такие книги кто-то покупает или их бесплатно раздают. Оценка: нечитаемо
sem14 про Лазарис: Белая ворона (Историческая проза)
25 11 Леонид Гомберг 24 июля 2007 Роман известного в Израиле прозаика, поэта и переводчика Владимира Лазариса «Белая ворона» (Тель-Авив: Ладо, 2003) в этом году был включен в «лонг-лист» популярной премии «Букер». И это ……… Оценка: отлично!
decim про Осне Сейерстад
25 11 Попробовала бы Сурайя-реис не подать в суд! Муж бы убил. "Для контекста добавлю, что после публикации книги семья героя подала на Сейерстад в суд за клевету, но после апелляции писательница была признана невиновной, а через ……… |
Комментарии
Re: Обработка дублей.
Зачем заливать? Можно восстановить удаленное. Насчет модерации не согласен - неудобно + много работы модераторам, которых сейчас нет и т.д. Что действительно нужно, если уж делать модераторов, то дать им(и только им!) возможность удаления книг навсегда. Зачем это надо? Есть авторы у которых написано 10 книг, а в удаленных 60+ Причем версии книги идут так: 1 версия --- добавлена анотация --- исправлена опечатка(одна) --- исправлена опечатка(еще одна) и т.д. Нафиг хранить все эти промежуточные вещи? Плюс появляются "доброжелатели", которые восстанавливают все подряд. Итог: каша на полке у автора.
Re: Обработка дублей.
Да-да-да! Я сама недавно только с 3-го раза "правильно" залила книгу. *краснеет*
Промежуточных два варианта никому не нужны.
Re: Обработка дублей.
Не знал. Спасибо. Работы, кстати, не так уж и много. Человек 5-10 вполне справятся. Думаю, что из числа постоянно заливающих книги, желающих быть модераторами наберется достаточно.
И восстанавливать уделенное не очень удобно. То что раньше в библиотеке была книга лучшего качества практически никто не знает и восстанавливать некому.
Re: Обработка дублей.
а что, резонно.
Re: Обработка дублей.
А может быть как-то присваивать "облизанным" вариантам статус незаменимых? Правда как это осуществить программно в Друпале не представляю.
Вот именно статусы "окончательного варианта" и можно было бы оставить модераторам. Или обратный вариант - под замену открыты только невалидные книги. Еще подумать надо. Вообще, задачка логистическая или управленческая, решения должны быть различными. В зависимости от степени ограничений, которые выставляются определенным группам пользователей.
Re: Обработка дублей.
Не знаю, реально ли тут что-то изменить. Сам вики-принцип формирования библиотеки не дает что-то сделать в этом плане. Иначе потеряем больше - затруднится заливка. Наверное, надо заливающим иметь больше ответственности. Дублей, действительно, море. Другое название, другой жанр... И вот вам новая книга, а по сути - та же самая, но хуже. И главное, люди ведь это делают не со зла, а считают, что помогают библиотеке :(. Предложение Ларину: при заливке книг сделать крупное, яркое сообщение - предупреждение, типа: А вы уверены, что заливаемая вами книга отсутствует в библиотеке? А вы уверены, что ваша версия лучше, чем имеющаяся в библиотеке? А модераторы - это несерьезно, увы.
Re: Обработка дублей.
Это не вариант. Я сейчас правлю поэзию - она полностью не отформатированная, зато формально валидная. :-(
Да и "простые" книги, прошедшие валидацию, не всегда могут получить статус "окончательного варианта". Так что валидность не может быть критерием.
Re: Обработка дублей.
"Приходите и модераторствуйте над нами!" - за такие неприличные предложения нужно банить :)
Можно посылать уведомления "залитая вами книга n1 заменена на n2", вывесить на видном месте список удаленных и замененных книг, помечать заведомо валидные книги, и т.д. То есть, следует соблюдать принципы wiki, раз уж взялись.
С этой задачей и простенький скрипт прекрасно справится. Когда понадобиться свободное место на диске.
Re: Обработка дублей.
Отвечу своей собственной цитатой:
Свободное место - последнее что меня волнует. Я же не говорю: давайте уберем возможность "удаления" книг пользователями. Я говорю: давайте выберем групу модераторов и дадим им возможность окончательного удаления промежуточных версий книг.
Не обижайся, но это маразм. Заливается и правится огромное количество книг ежедневно(около двух сотен, а иногда и больше).
Re: Обработка дублей.
И это тоже проще решить техсредствами.
Ну, и?.. Пара модераторов с этим справятся лучше пары сотен добровольцев?.. Не обижайся, но это не меньший маразм :)
Re: Обработка дублей.
Не знаю, как насчёт модераторов - не думала над этим вопросом, да и не чувствую (пока?) необходимости, но вот против рассылки я была бы категорически против.
Тут не получается отписаться от уведомлений об ответах из форума (кстати, кто-то знает, как это сделать?), а если к ним ещё добавятся уведомления о перезаливке книг, то вообще придётся заводить отдельный почтовый ящик только для этих целей. :-(
Представьте себе, что будет делаться у людей, заливающих регулярно книги. УжОс!
Re: Обработка дублей.
На ifolder.ru файлы заливать не доводилось? :)
Почтой слать уведомления совсем не обязательно. Можно в "личку". Можно (и нужно!) сделать страничку персональной статистики по залитым книгам... Само собой разумеется, юзер должен иметь возможность все это отключить.
Re: Обработка дублей.
Нет. А шо, страшно? ;-)
Re: Обработка дублей.
Нудно. Очень неудобный, для тех заливает, обменник.
А никто и не должен эту страничку видеть, кроме самого юзера.
Э... А как их проверять-то? Создадим СБ Либрусека? :)
Меня лично вполне бы устроил и чекбокс "показывать 'сомнительные' книги".
Re: Обработка дублей.
Держать на сервере любую информацию о том кто сколько какого копирайта залил - мягко говоря, нежелательно.
Re: Обработка дублей.
Ну, мне вот, мягко говоря, пофиг. А для кого опасно - тот конечно должен иметь возможность все это отключить.
Re: Обработка дублей.
Да мне как бы тоже пофиг... пока повестка не пришла ;-) (плюет по три раза через все плечи и стучит по всему деревянному - голова, естественно, отзывается глухой болью)
Но мне так кажется что это и для Ларина нежелательно.
И вот кстати попутная мысль - а нельзя ли сделать такой скрипт (локальный на клиенте, как Ваши пользовательские) который бы держал список залитых мною книг - но не на сервере, а на моем компе?
Хотя я пока и не вижу зачем (ну кроме тщеславие почесать) мне такой список был бы нужен... но все равно хочется. Не так чтобы сильно, правда. Я все равно держу в отдельном директории копии залитого.
Re: Обработка дублей.
* задумчиво смотрит на значки мюторрента и емула в трее *
Книжки, говорите?..
Ларину, пожалуй, тоже пофиг. Руки у ебук-копирастов (как звучит!) коротки.
Тогда уж лучше делать нормальный upload manager, на языке уровнем пониже скриптов.
Re: Обработка дублей.
*весело смотрит на зелененький индикатор Флешгета, качающего в двадцать четыре горла очередные хай-дефинишн кинухи с рапиды*
А мы пирингом не занимаемся. Соответственно, и не распространяем. Так что прихватить нас за выступающие части тела совсем не так легко.
Не знаю. Может быть. Я бы на его месте, все-таки, не держал на сервере информацию о том кто что залил.
Ну это явно оверкилл, задача того не стоит.
Re: Обработка дублей.
Ай-яй-яй! Задумайтесь - откуда на рапиде киношки берутся?.. Может, как раз я ее туда и залил? ;)
Как сказать... У JavaScript есть такой недостаток: максимальный размер cookie ~4Kb. Какие уж тут списки файлов...
Впрочем, попробую поиграть с относительно новой фичей "Local Storage" (~60Kb). Посмотрим, что из этого выйдет.
Re: Обработка дублей.
Как - откуда?! Самозарождаются, конечно. Как булки на деревьях.
Re: Обработка дублей.
Логично. И чего к нам защЫтники копирайтов цепляются?..
Re: Обработка дублей.
Я так думаю что исключительно из врожденной вредности.
Re: Обработка дублей.
О-о-о! Так ты тоже из Ксанфа? :D
Re: Обработка дублей.
это что такое?
королевство тёмных эльфов или павильон для уничтожения ядерных отходов?))))))))))
просто звучит немного пугающе название))))))
Re: Обработка дублей.
Энтони Пирс, серия "Ксанф", на русском читал 20 книг. Хотя написано для детей (в основном), но вполне доступно и взрослым :)
Re: Обработка дублей.
согласен, страничка статистики по всем книгам которые я заливал или правил - супер!!
типо watchlist'a на википедии =)
Re: Обработка дублей.
Цитируя pkn: ....мягко говоря, нежелательно.
Re: Обработка дублей.
Все это решается просто: книги отправляются в список не автоматом по факту заливки, а вручную. Если я хочу следить за данной книгой - жму на кнопку "наблюдать" (сейчас я пользуюсь для этой цели книжной полкой, но это не очень удобно). Конечно, наблюдать можно не только за теми книгами, которые залил сам.
Re: Обработка дублей.
отличная идея!!!! мне бы такое в голову никогда не пришло)))
кстати, у меня вопрос, эту случайно не ты в вычитке переводила отсканенные книги djvu в fb2? можно попросить тебя то же самое сделать с одним учебником??
Re: Обработка дублей.
Если ты о "1189 годе", то у меня был текстовый файл из другого источника. А что за учебник? Если в нем много иллюстраций и формул, лучше оставить в djvu, мне кажется.
Re: Обработка дублей.
я не о нем.
у мну есть учебник польского, но там нет ocr слоя.
я хочу оставить книгу в djvu, но!
1. я не знаю как добавить ocr слой
2. не знаю как сделать оглавление
обяснишь?)
Re: Обработка дублей.
Неа, сама не знаю.
Re: Обработка дублей.
Да... Да. Да!! Не нужно хранить на сервере ничего лишнего. Как сказал О. Бендер, - "уберите фотографа, он мешает моей шахматной мысли" ;) А мы тут не междупланетный турнир устраиваем, а всего лишь... Ну, да ладно, все и так знают. Что я заливаю, например, на рапиду, я оставляю у себя в виде ссылки. Там и адрес, и код удаления. И довольно.
Re: Обработка дублей.
Re: Обработка дублей.
Сам не разобрался. :( Пришлось изменить почтовый ящик в настройках на - теперь "спам" с либрусека не доходит.
Re: Обработка дублей.
блин, вот что значит глючный интернет :( Тройной пост
Re: Обработка дублей.
Мне придёт ТРИ уведомления. В-)
Re: Обработка дублей.
Я борюсь с этим путем максимального повышения терпения и максимального понижения нетерпения. Килкнул на "отправить" - оно му-му... му-му... му-му... тогда я не кликаю второй-третий раз, а перехожу к другим делам. Минут через десять возвращаюсь, рефрешу страничку в другом окне - как правило, пост появляется.
Re: Обработка дублей.
Что-то много воды... Вопрос к занимающимся оцифровкой и прочими премудростями, в просторечии именуемыми созданием электронных книг:
Насколько точно можно определить правильность книги и вообще, возможно ли это?
Какие критерии нужно использовать при таком отборе?
Если ответ отрицательный, то никаких рычагов управления, кроме жесткого администрирования (абсолютно не соответствует модели ресурса) не вижу.
Если "правильность" книги поддается определению, (кстати, можно увязать с проектом вычитки - уж там-то должны по определению получатся наиболее правильные варианты), напрашивается введение для таких книг введение статуса "Finish", который не позволяет удалить или заменить данный вариант без снятия статуса. Модераторы не нужны, просто установкой статусов и дальнейшей правкой статусных произведений будет заниматься группа вычитки и коррекции.
Окончательное удаление остается в руках Ларина - слишком серьезные права. Если группа вычитки будет работать и будет достаточно обширной - через некоторое время появится вполне приличная по объему вполне "правильная" подборка.
Еще один плюсик - в подборке будут в основном новинки и наиболее популярные произведения.
А дубли пусть существуют. Пока не стоит вопрос нехватки места, они не очень мешают. А вот статус позволит читателю отобрать из нескольких дублей тот, который наиболее близок к совершенству.
Могу ошибаться, или не видеть каких-то очевидных проблем. Может кто-то подскажет другое решение по данному вопросу...
Re: Обработка дублей.
Во-вторых, заливалка новых книг всегда бодро рапортует "дубль найден и удалён", а должна смотреть и на ebookdownloader'ность с fb2fix'ностью, и на номер версии (отказываться заменять более древнюю на более свежую, версией 1.0 вообще никакую не замещать, версии >= 2 не заменять никакими), и только если заливаемая свежЕе - тогда, так уж и быть, пусть выводит дубля и предлагает между ними выбрать.
В-третьих, при просмотре книги (и даже при наведении мыша на линк на книгу - по крайней мере, при поиске и просмотре обновлений) неплохо бы сообщать ID и номер версии документа, ник его автора и дату заливки. (Часть этой информации можно получить на странице исправления книги, но не всю и это не сильно удобно.)
Re: Обработка дублей.
Можно попробовать такой вариант до кучи:
1) Составить список признаков, явно отличающих более сложное форматирование книги от более простого
(заголовки, эпиграфы, стихи, цитаты, сноски и проч)
2) Наличие/отсутствие признаков ebookdownloader'ности с fb2fix'ностью
3) Размер
4) Картинки-обложки
5) Аннотации
6) Валидность
При попытке менять книгу со сложным форматированием на вариант плэйн-текста - отказывать.
Re: Обработка дублей.
по моему это довольно сложно воплотиьт, чтобы при заливке каждой книги такое делалось...
Re: Обработка дублей.
Помоему, все ушли не в ту степь.
Самый простой вариант, прикрутить оценки качества к книгам.
Книги с неким количеством проголосовавших, но получившие сумму оценок ниже определенного уровня, автоматом пусть убираются в спойлер "Книги сомнительного качества".
Пройдет время и библиотеке будет красота (но тут уже от читателей зависит).
А удаление всеми желающими - зло.
Re: Обработка дублей.
люди и самой книге ставят оценки не очень активно, а вот качеству книги совсем мизерное число будет((((
пусть лучше ларин обратно приделает поиск дублей по id книги.
теперь оно не работает((((((((((
папки "удалённые" и "дубли"
В контроле за удалением есть здравый смысл. Например, приходит какой-то поц с литреса и удаляет книги. В связи с этим предлагаю следующее. Удалённые книги должны лежать в особой папке "удалённые". Такая папка есть на целом ряде почтовых серверов. Файлы в предложенном варианте из папки "удалённые" пользователи удалить не могут, но могут при необходимости восстановить. Если файлы не восстановили в течении какого-то срока, скажем, недели с момента удаления, тогда они удаляются автоматически. Возможно, что есть смысл и в аналогичном контроле сверки дублей. Дубли при этом удаляются окончательно, а отправляются в папку "дубли", если их не затребовали назад на повторную сверку в течении недели - удаляются автоматически.
Re: Обработка дублей.
Возможно, следует делать так: Заменять/удалить книги не сразу, сделав предварительный опрос пользователей. Если какой-либо юзверь решил заменить/удалить книгу, то это происходит не сразу, а оба варианта помещаются в некий лист опроса: "Пользователь такой-то предлагает заменить книгу такую-то". Причина (заполняется инициатором) "более качественное форматирование" (допустим). И рядом голосовалка в простейшем виде. Любой, всяк сюда входящий, сможет просмотреть бегло оба варианта и голосовать "Да"/ "Нет". По итогам n дней книга автоматически заменяется/удаляется. Это защитит библиотеку от чистильщиков с литреса и просто неадекватных пофигистичных ламеров.
От дублей можно оборонятся аналогично "Пользователь такой-то предлагает добавить автору такому-то произведение такое-то". И рядом голосовалка Хотим/Не хотим/Это дубль/. В случае победы по п 3 книга попадает автоматически в опросник замены.
Библиотека выгодно отличается от Википедии в том, что там для того чтобы сделать вывод о качестве / правильности статьи надо обладать специальными знаниями. Здесь же большинство может все-таки отличить разницу между текстами.
Для экономии результат голосования выкладывать рядом с голосовалкой, чтобы, например, при подавляющем "за" люди не тратили время на сравнивание.
Ну если такой механизм не защитит, то уж, звиняйте, ничего не поможет, тогда и жаловаться нех.
Re: Обработка дублей.
У Крайтона Майкла есть дубли романа Крылья
Научная Фантастика Детектив
- Крылья 1118K
Триллер
- Крылья 676K
Первый нужно удалить; плохо отформатирован, без обложки.
Как или кто это сделает? ;-)
Re: Обработка дублей.
это под каждому из пользователей =)
надо просто нажать: исправить и объединить с другой книгой
Re: Обработка дублей.
Т.е. беру неправильную книгу, исправляю и объединяю с правильной? неправильная удалится?
И в чём отличие от просто "удалить"?
Страницы