Вы здесьОбработка дублей.
Опубликовано сб, 31/05/2008 - 08:16 пользователем xxxyurixxx
Может все-таки стоит запретить удаление книг для всех? Сделать удаление и обработку дублей модерируемыми? Просто некоторые товарищи уже задолбали заменять отличные файлы неправлеными eBookDownloader'овскими. Сборники Лукьяненко, например, заменили. Сейчас залил назад нормальные.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 11 часов
babajga RE:Блошкинс и Фрю. Опасное путешествие 22 часа aldan RE: 1 день kopak RE:О группе Дятлова. О той самой, того самого... 1 неделя alexk RE:Багрепорт - 2 6 дней babajga RE:Удивленная сова 2 недели Larisa_F RE:Серия «Квадрат» издательства «Текст» 2 недели Aleks_Sim RE:Беженцы с Флибусты 2 недели edvud RE:Прошу переформатировать, распознать, etc... 2 недели monochka RE:С 8 Марта! 3 недели babajga RE:Книга чуДОМищ 3 недели ProstoTac RE:Подборка о Первой Мировой 3 недели babajga RE:Нержавеющая сабля 4 недели sem14 RE:«Уроки русского» 4 недели Isais RE:Древний Рим. Подборка книг 1 месяц babajga RE:Отчаянная осень 1 месяц babajga RE:Сказки Сени Малины 1 месяц babajga RE:Сказки 1 месяц Впечатления о книгах
Синявский про Ален Жобер
30 03 В возрасте 84 лет скончался французский деятель культуры, известный как режиссер, писатель, актер, продюсер и переводчик — Ален Жобер. Об этом информирует портал Telerama. Жобер являлся коренным парижанином, в столице ………
dolle про Михайлов: Пепел доверия (Боевая фантастика, Социальная фантастика, Постапокалипсис, Самиздат, сетевая литература)
30 03 Продолжение в следующей книге может быть о крушении "пластмассового" мира , когда люди избавляются от всей лишней шелухи цивилизации, когда бывший офисный планктон матереет и борется за выживание в новых реалиях одновременно ……… Оценка: отлично!
Barbud про Ларин: Петров, к доске! (Альтернативная история, Юмор: прочее, Попаданцы, Самиздат, сетевая литература)
29 03 Это читать невозможно. Автор старается выписать так много деталей и подробностей разных рядовых событий, что за ними просто скрывается сюжет и действие не развивается, стреноженное этими подробностями. Характеры и поступки ……… Оценка: нечитаемо
msnaumov про Демиденко: Мастерство работы с ChatGPT 4: Полный гид для новичков и профессионалов (Учебные пособия, самоучители)
29 03 75 страниц общих рассуждений о необыкновенной пользе ИИ, полное отсутствие практической стороны.
Г.Гуслия про Влас Лещенко
29 03 про Лещенко: Узловой мир. Графомания с совершенно необязательными плевками в сторону Украины. Наверно иначе такое фуфло не напечатали бы. А уж ошибок - мама не горюй. ГГ уколы ставит под ряд (это где такое растет?), а ………
DGOBLEK про Короткевич: Дикая охота короля Стаха. Оружие. Цыганский король. Седая легенда [Сборник. Книга не полностью] (Исторический детектив, Историческая проза)
28 03 Книга не полностью. Отсутствует - Владимир Захаров. Певец седых легенд и народных поверий (послесловие), стр. 399-412
DGOBLEK про Короткевич: Дикая охота короля Стаха. Оружие. Цыганский король. Седая легенда [Книга не полностью] (Исторический детектив, Историческая проза)
28 03 Книга не полностью. Отсутствует - Владимир Захаров. Певец седых легенд и народных поверий (послесловие), стр. 399-412
pulochka про Халиди: Столетняя война за Палестину (История, Политика, Публицистика)
28 03 Вранье от первого до последнего слова! Оценка: нечитаемо
obivatel про Ковтунов: Идеальный мир для Лекаря. Книга 28 [СИ] (Боевая фантастика, Юмористическая фантастика, Фэнтези, Самиздат, сетевая литература)
28 03 Откровенно говоря, оно конечно такая долгоиграющая жвачка очень хорошо, но приелось уже. Так что при всём уважении и благодарности к автору за проделанную работу, цикл пора завершать. ИМХО ессно. Оценка: хорошо
Синявский про Лиза Джейн Смит
27 03 Л. Джейн Смит, автор романов «Дневники вампира», умерла в возрасте 66 лет. Писательница страдала от редкого аутоимунного заболевания.
Г.Гуслия про Плут
26 03 Очень неплохой ЛитРПГ. Читается без напряга, как раз то, что надо для отдыха. Оценка: твердое хорошо.
decim про Бенедикт Константинович Лившиц
26 03 Убит в 1938. А переводы печатались и до сих пор печатаются. Насчёт невостребованности. Самое невостребованное было - недаровитых авторов 1950-х. В букинистике, были одно время до потолка стопки всякого "Рассвета в степи" ……… |
Комментарии
Re: Обработка дублей.
Зачем заливать? Можно восстановить удаленное. Насчет модерации не согласен - неудобно + много работы модераторам, которых сейчас нет и т.д. Что действительно нужно, если уж делать модераторов, то дать им(и только им!) возможность удаления книг навсегда. Зачем это надо? Есть авторы у которых написано 10 книг, а в удаленных 60+ Причем версии книги идут так: 1 версия --- добавлена анотация --- исправлена опечатка(одна) --- исправлена опечатка(еще одна) и т.д. Нафиг хранить все эти промежуточные вещи? Плюс появляются "доброжелатели", которые восстанавливают все подряд. Итог: каша на полке у автора.
Re: Обработка дублей.
Да-да-да! Я сама недавно только с 3-го раза "правильно" залила книгу. *краснеет*
Промежуточных два варианта никому не нужны.
Re: Обработка дублей.
Не знал. Спасибо. Работы, кстати, не так уж и много. Человек 5-10 вполне справятся. Думаю, что из числа постоянно заливающих книги, желающих быть модераторами наберется достаточно.
И восстанавливать уделенное не очень удобно. То что раньше в библиотеке была книга лучшего качества практически никто не знает и восстанавливать некому.
Re: Обработка дублей.
а что, резонно.
Re: Обработка дублей.
А может быть как-то присваивать "облизанным" вариантам статус незаменимых? Правда как это осуществить программно в Друпале не представляю.
Вот именно статусы "окончательного варианта" и можно было бы оставить модераторам. Или обратный вариант - под замену открыты только невалидные книги. Еще подумать надо. Вообще, задачка логистическая или управленческая, решения должны быть различными. В зависимости от степени ограничений, которые выставляются определенным группам пользователей.
Re: Обработка дублей.
Не знаю, реально ли тут что-то изменить. Сам вики-принцип формирования библиотеки не дает что-то сделать в этом плане. Иначе потеряем больше - затруднится заливка. Наверное, надо заливающим иметь больше ответственности. Дублей, действительно, море. Другое название, другой жанр... И вот вам новая книга, а по сути - та же самая, но хуже. И главное, люди ведь это делают не со зла, а считают, что помогают библиотеке :(. Предложение Ларину: при заливке книг сделать крупное, яркое сообщение - предупреждение, типа: А вы уверены, что заливаемая вами книга отсутствует в библиотеке? А вы уверены, что ваша версия лучше, чем имеющаяся в библиотеке? А модераторы - это несерьезно, увы.
Re: Обработка дублей.
Это не вариант. Я сейчас правлю поэзию - она полностью не отформатированная, зато формально валидная. :-(
Да и "простые" книги, прошедшие валидацию, не всегда могут получить статус "окончательного варианта". Так что валидность не может быть критерием.
Re: Обработка дублей.
"Приходите и модераторствуйте над нами!" - за такие неприличные предложения нужно банить :)
Можно посылать уведомления "залитая вами книга n1 заменена на n2", вывесить на видном месте список удаленных и замененных книг, помечать заведомо валидные книги, и т.д. То есть, следует соблюдать принципы wiki, раз уж взялись.
С этой задачей и простенький скрипт прекрасно справится. Когда понадобиться свободное место на диске.
Re: Обработка дублей.
Отвечу своей собственной цитатой:
Свободное место - последнее что меня волнует. Я же не говорю: давайте уберем возможность "удаления" книг пользователями. Я говорю: давайте выберем групу модераторов и дадим им возможность окончательного удаления промежуточных версий книг.
Не обижайся, но это маразм. Заливается и правится огромное количество книг ежедневно(около двух сотен, а иногда и больше).
Re: Обработка дублей.
И это тоже проще решить техсредствами.
Ну, и?.. Пара модераторов с этим справятся лучше пары сотен добровольцев?.. Не обижайся, но это не меньший маразм :)
Re: Обработка дублей.
Не знаю, как насчёт модераторов - не думала над этим вопросом, да и не чувствую (пока?) необходимости, но вот против рассылки я была бы категорически против.
Тут не получается отписаться от уведомлений об ответах из форума (кстати, кто-то знает, как это сделать?), а если к ним ещё добавятся уведомления о перезаливке книг, то вообще придётся заводить отдельный почтовый ящик только для этих целей. :-(
Представьте себе, что будет делаться у людей, заливающих регулярно книги. УжОс!
Re: Обработка дублей.
На ifolder.ru файлы заливать не доводилось? :)
Почтой слать уведомления совсем не обязательно. Можно в "личку". Можно (и нужно!) сделать страничку персональной статистики по залитым книгам... Само собой разумеется, юзер должен иметь возможность все это отключить.
Re: Обработка дублей.
Нет. А шо, страшно? ;-)
Re: Обработка дублей.
Нудно. Очень неудобный, для тех заливает, обменник.
А никто и не должен эту страничку видеть, кроме самого юзера.
Э... А как их проверять-то? Создадим СБ Либрусека? :)
Меня лично вполне бы устроил и чекбокс "показывать 'сомнительные' книги".
Re: Обработка дублей.
Держать на сервере любую информацию о том кто сколько какого копирайта залил - мягко говоря, нежелательно.
Re: Обработка дублей.
Ну, мне вот, мягко говоря, пофиг. А для кого опасно - тот конечно должен иметь возможность все это отключить.
Re: Обработка дублей.
Да мне как бы тоже пофиг... пока повестка не пришла ;-) (плюет по три раза через все плечи и стучит по всему деревянному - голова, естественно, отзывается глухой болью)
Но мне так кажется что это и для Ларина нежелательно.
И вот кстати попутная мысль - а нельзя ли сделать такой скрипт (локальный на клиенте, как Ваши пользовательские) который бы держал список залитых мною книг - но не на сервере, а на моем компе?
Хотя я пока и не вижу зачем (ну кроме тщеславие почесать) мне такой список был бы нужен... но все равно хочется. Не так чтобы сильно, правда. Я все равно держу в отдельном директории копии залитого.
Re: Обработка дублей.
* задумчиво смотрит на значки мюторрента и емула в трее *
Книжки, говорите?..
Ларину, пожалуй, тоже пофиг. Руки у ебук-копирастов (как звучит!) коротки.
Тогда уж лучше делать нормальный upload manager, на языке уровнем пониже скриптов.
Re: Обработка дублей.
*весело смотрит на зелененький индикатор Флешгета, качающего в двадцать четыре горла очередные хай-дефинишн кинухи с рапиды*
А мы пирингом не занимаемся. Соответственно, и не распространяем. Так что прихватить нас за выступающие части тела совсем не так легко.
Не знаю. Может быть. Я бы на его месте, все-таки, не держал на сервере информацию о том кто что залил.
Ну это явно оверкилл, задача того не стоит.
Re: Обработка дублей.
Ай-яй-яй! Задумайтесь - откуда на рапиде киношки берутся?.. Может, как раз я ее туда и залил? ;)
Как сказать... У JavaScript есть такой недостаток: максимальный размер cookie ~4Kb. Какие уж тут списки файлов...
Впрочем, попробую поиграть с относительно новой фичей "Local Storage" (~60Kb). Посмотрим, что из этого выйдет.
Re: Обработка дублей.
Как - откуда?! Самозарождаются, конечно. Как булки на деревьях.
Re: Обработка дублей.
Логично. И чего к нам защЫтники копирайтов цепляются?..
Re: Обработка дублей.
Я так думаю что исключительно из врожденной вредности.
Re: Обработка дублей.
О-о-о! Так ты тоже из Ксанфа? :D
Re: Обработка дублей.
это что такое?
королевство тёмных эльфов или павильон для уничтожения ядерных отходов?))))))))))
просто звучит немного пугающе название))))))
Re: Обработка дублей.
Энтони Пирс, серия "Ксанф", на русском читал 20 книг. Хотя написано для детей (в основном), но вполне доступно и взрослым :)
Re: Обработка дублей.
согласен, страничка статистики по всем книгам которые я заливал или правил - супер!!
типо watchlist'a на википедии =)
Re: Обработка дублей.
Цитируя pkn: ....мягко говоря, нежелательно.
Re: Обработка дублей.
Все это решается просто: книги отправляются в список не автоматом по факту заливки, а вручную. Если я хочу следить за данной книгой - жму на кнопку "наблюдать" (сейчас я пользуюсь для этой цели книжной полкой, но это не очень удобно). Конечно, наблюдать можно не только за теми книгами, которые залил сам.
Re: Обработка дублей.
отличная идея!!!! мне бы такое в голову никогда не пришло)))
кстати, у меня вопрос, эту случайно не ты в вычитке переводила отсканенные книги djvu в fb2? можно попросить тебя то же самое сделать с одним учебником??
Re: Обработка дублей.
Если ты о "1189 годе", то у меня был текстовый файл из другого источника. А что за учебник? Если в нем много иллюстраций и формул, лучше оставить в djvu, мне кажется.
Re: Обработка дублей.
я не о нем.
у мну есть учебник польского, но там нет ocr слоя.
я хочу оставить книгу в djvu, но!
1. я не знаю как добавить ocr слой
2. не знаю как сделать оглавление
обяснишь?)
Re: Обработка дублей.
Неа, сама не знаю.
Re: Обработка дублей.
Да... Да. Да!! Не нужно хранить на сервере ничего лишнего. Как сказал О. Бендер, - "уберите фотографа, он мешает моей шахматной мысли" ;) А мы тут не междупланетный турнир устраиваем, а всего лишь... Ну, да ладно, все и так знают. Что я заливаю, например, на рапиду, я оставляю у себя в виде ссылки. Там и адрес, и код удаления. И довольно.
Re: Обработка дублей.
Re: Обработка дублей.
Сам не разобрался. :( Пришлось изменить почтовый ящик в настройках на - теперь "спам" с либрусека не доходит.
Re: Обработка дублей.
блин, вот что значит глючный интернет :( Тройной пост
Re: Обработка дублей.
Мне придёт ТРИ уведомления. В-)
Re: Обработка дублей.
Я борюсь с этим путем максимального повышения терпения и максимального понижения нетерпения. Килкнул на "отправить" - оно му-му... му-му... му-му... тогда я не кликаю второй-третий раз, а перехожу к другим делам. Минут через десять возвращаюсь, рефрешу страничку в другом окне - как правило, пост появляется.
Re: Обработка дублей.
Что-то много воды... Вопрос к занимающимся оцифровкой и прочими премудростями, в просторечии именуемыми созданием электронных книг:
Насколько точно можно определить правильность книги и вообще, возможно ли это?
Какие критерии нужно использовать при таком отборе?
Если ответ отрицательный, то никаких рычагов управления, кроме жесткого администрирования (абсолютно не соответствует модели ресурса) не вижу.
Если "правильность" книги поддается определению, (кстати, можно увязать с проектом вычитки - уж там-то должны по определению получатся наиболее правильные варианты), напрашивается введение для таких книг введение статуса "Finish", который не позволяет удалить или заменить данный вариант без снятия статуса. Модераторы не нужны, просто установкой статусов и дальнейшей правкой статусных произведений будет заниматься группа вычитки и коррекции.
Окончательное удаление остается в руках Ларина - слишком серьезные права. Если группа вычитки будет работать и будет достаточно обширной - через некоторое время появится вполне приличная по объему вполне "правильная" подборка.
Еще один плюсик - в подборке будут в основном новинки и наиболее популярные произведения.
А дубли пусть существуют. Пока не стоит вопрос нехватки места, они не очень мешают. А вот статус позволит читателю отобрать из нескольких дублей тот, который наиболее близок к совершенству.
Могу ошибаться, или не видеть каких-то очевидных проблем. Может кто-то подскажет другое решение по данному вопросу...
Re: Обработка дублей.
Во-вторых, заливалка новых книг всегда бодро рапортует "дубль найден и удалён", а должна смотреть и на ebookdownloader'ность с fb2fix'ностью, и на номер версии (отказываться заменять более древнюю на более свежую, версией 1.0 вообще никакую не замещать, версии >= 2 не заменять никакими), и только если заливаемая свежЕе - тогда, так уж и быть, пусть выводит дубля и предлагает между ними выбрать.
В-третьих, при просмотре книги (и даже при наведении мыша на линк на книгу - по крайней мере, при поиске и просмотре обновлений) неплохо бы сообщать ID и номер версии документа, ник его автора и дату заливки. (Часть этой информации можно получить на странице исправления книги, но не всю и это не сильно удобно.)
Re: Обработка дублей.
Можно попробовать такой вариант до кучи:
1) Составить список признаков, явно отличающих более сложное форматирование книги от более простого
(заголовки, эпиграфы, стихи, цитаты, сноски и проч)
2) Наличие/отсутствие признаков ebookdownloader'ности с fb2fix'ностью
3) Размер
4) Картинки-обложки
5) Аннотации
6) Валидность
При попытке менять книгу со сложным форматированием на вариант плэйн-текста - отказывать.
Re: Обработка дублей.
по моему это довольно сложно воплотиьт, чтобы при заливке каждой книги такое делалось...
Re: Обработка дублей.
Помоему, все ушли не в ту степь.
Самый простой вариант, прикрутить оценки качества к книгам.
Книги с неким количеством проголосовавших, но получившие сумму оценок ниже определенного уровня, автоматом пусть убираются в спойлер "Книги сомнительного качества".
Пройдет время и библиотеке будет красота (но тут уже от читателей зависит).
А удаление всеми желающими - зло.
Re: Обработка дублей.
люди и самой книге ставят оценки не очень активно, а вот качеству книги совсем мизерное число будет((((
пусть лучше ларин обратно приделает поиск дублей по id книги.
теперь оно не работает((((((((((
папки "удалённые" и "дубли"
В контроле за удалением есть здравый смысл. Например, приходит какой-то поц с литреса и удаляет книги. В связи с этим предлагаю следующее. Удалённые книги должны лежать в особой папке "удалённые". Такая папка есть на целом ряде почтовых серверов. Файлы в предложенном варианте из папки "удалённые" пользователи удалить не могут, но могут при необходимости восстановить. Если файлы не восстановили в течении какого-то срока, скажем, недели с момента удаления, тогда они удаляются автоматически. Возможно, что есть смысл и в аналогичном контроле сверки дублей. Дубли при этом удаляются окончательно, а отправляются в папку "дубли", если их не затребовали назад на повторную сверку в течении недели - удаляются автоматически.
Re: Обработка дублей.
Возможно, следует делать так: Заменять/удалить книги не сразу, сделав предварительный опрос пользователей. Если какой-либо юзверь решил заменить/удалить книгу, то это происходит не сразу, а оба варианта помещаются в некий лист опроса: "Пользователь такой-то предлагает заменить книгу такую-то". Причина (заполняется инициатором) "более качественное форматирование" (допустим). И рядом голосовалка в простейшем виде. Любой, всяк сюда входящий, сможет просмотреть бегло оба варианта и голосовать "Да"/ "Нет". По итогам n дней книга автоматически заменяется/удаляется. Это защитит библиотеку от чистильщиков с литреса и просто неадекватных пофигистичных ламеров.
От дублей можно оборонятся аналогично "Пользователь такой-то предлагает добавить автору такому-то произведение такое-то". И рядом голосовалка Хотим/Не хотим/Это дубль/. В случае победы по п 3 книга попадает автоматически в опросник замены.
Библиотека выгодно отличается от Википедии в том, что там для того чтобы сделать вывод о качестве / правильности статьи надо обладать специальными знаниями. Здесь же большинство может все-таки отличить разницу между текстами.
Для экономии результат голосования выкладывать рядом с голосовалкой, чтобы, например, при подавляющем "за" люди не тратили время на сравнивание.
Ну если такой механизм не защитит, то уж, звиняйте, ничего не поможет, тогда и жаловаться нех.
Re: Обработка дублей.
У Крайтона Майкла есть дубли романа Крылья
Научная Фантастика Детектив
- Крылья 1118K
Триллер
- Крылья 676K
Первый нужно удалить; плохо отформатирован, без обложки.
Как или кто это сделает? ;-)
Re: Обработка дублей.
это под каждому из пользователей =)
надо просто нажать: исправить и объединить с другой книгой
Re: Обработка дублей.
Т.е. беру неправильную книгу, исправляю и объединяю с правильной? неправильная удалится?
И в чём отличие от просто "удалить"?
Страницы