Массовый вброс книг

Может быть, тот, кто это делает, объяснит, что происходит?
1. В библиотеку поступает очень много книг (7 страниц назад http://lib.rus.ec/new?page=6 это началось).
2. Это дубли:
- н-р, Евтушенко - был без отчества - сейчас новый автор с отчеством - книги те же;
- н-р, Злотников - это просто дубли.

Комментарии

И что? Читаю я эти топики регулярно, зачем вы мне эти ссылки приводите?
Дубли нам зачем?

Это не "просто дубли", это - версии. И не "массовый вброс" - а пополнение.

Судя по тону высказываний, пополнением библиотеки вы очень недовольны. Что-то это мне напоминает...

rr3 написал:
Судя по тону высказываний, пополнением библиотеки вы очень недовольны. Что-то это мне напоминает...

1. И что же напоминает? Тон ваш мне тоже не нравится, в органы играете, Лаврентий Палыч?
2. Мне не нравится путаница, которая возникает при этом. Когда это закончится, кто будет порядок наводить? Объясните толком...

Если вас так возмущают "дубли" - займитесь сравнением текста и удалением худшего варианта (займись вы этим сразу - может, заметили бы, что заливаемые версии в 99% случаев лучше, чем те, которые уже есть на Либрусеке).

gospeller написал:
Тон ваш мне тоже не нравится, в органы играете?

Недовольным этими пополнениями может быть только особь, приближенная к пингвину и компании. В какую игру игратете вы, gospeller - не знаю, но требовать объяснений от незнакомых людей - действительно напоминает органы (тем более, что все расписано в соответствующих топиках, ссылки на которые вам уже дали).

rr3 написал:
Если вас так возмущают "дубли" - займитесь сравнением текста и удалением худшего варианта (займись вы этим сразу - может, заметили бы, что заливаемые версии в 99% случаев лучше, чем те, которые уже есть на Либрусеке).

4.2
Проверил несколько дублей. Новые файлы с литреса очевидно хуже уже имеющихся. Да, исправлены некоторые ошибки, но куда больше добавлено - и такое впечатление, что нарочно.

Цитата:
Проверил несколько дублей. Новые файлы с литреса очевидно хуже уже имеющихся. Да, исправлены некоторые ошибки, но куда больше добавлено - и такое впечатление, что нарочно.

Да ну? А примеры?

У Евтушенко все литресовские были лучше. А у кого хуже?

Ни у кого. groun0 это наш штатный провокатор :)

Stiver написал:
У Евтушенко все литресовские были лучше.

А давайте я скажу, чем лучше? Вот, например, 97631 и 109676:

1. Добавлено отчество автора.
2. Добавлена аннотация.
3. Исправлено форматирование 1-й (прописью: одной) цитаты.
4. Исправлен автор документа - был mike, стал MCat78.

И всё. Внушительные улучшения, не так ли? Особенно последнее. Сам текст книги, между тем, не отличается ни единой буковкой.

Цитата:
А у кого хуже?

Я, конечно, могу примеры. Но надо ли? Подозреваю, любая вычитанная энтузиастами книга будет "лучше", бо литрес вычиткой, судя по всему, не занимается - у них "авторский текст".
В конкретном случае, о котором я говорил, вычиткой занимались люди из "Библиотеки Луки Бомануара".
Однако литресовский "авторский" вариант там всё же не отбросишь, поскольку в том конкретном случае тексты отличаются не только орфографией и пунктуацией (а ими они отличаются - в худшую для литреса сторону). Будем объединять.

>И всё. Внушительные улучшения, не так ли? Особенно последнее. Сам текст книги, между тем, не отличается ни единой буковкой.

Ну мне лично нравится иметь аннотацию с обложкой к книге и правильно написанного автора :) И не очень хочется дописывать их всюду вручную. Так что улучшение, как ни крути.

>Однако литресовский "авторский" вариант там всё же не отбросишь, поскольку в том конкретном случае тексты отличаются не только орфографией и пунктуацией (а ими они отличаются - в худшую для литреса сторону). Будем объединять

Угу, куда же мы денемся. Зато потом уже будет понятно, от чего отталкиваться в дальнейшем.

Цитата:
Я, конечно, могу примеры. Но надо ли? Подозреваю, любая вычитанная энтузиастами книга будет "лучше", бо литрес вычиткой, судя по всему, не занимается - у них "авторский текст".

Надо, надо. Ибо фразы о том что у энтузиастов книги лучше, просто потому что они энтузиасты - голословные утверждения. Пожалуйста конкретные примеры, конкретных опечаток в литресовских книгах, которых(опечаток) нету в книгах энтузиастов. Кстати на счет энтузиастов. 90% этих энтузиастов это OCR-щики альда и фензина и сейчас входят в литрес. Единственные энтузиасты, которые действительно нормально вычитывают, это проект Испр@влено.
Я согласен что опечатки есть везде(и на литресе естественно тоже). Но вот в том что в книгах с librusek_kit опечаток на порядок больше, это я гарантирую. Да и по сравнению с eBookDownloaderom литрес выигрывает. Так что заливать надо(что я кстати почти закончил).

Может кто-то обьяснит - зачем на ровном месте перепалку устраивать?
rr3 - на мой взгляд первый пост вполне адекватен.

Краткое содержание предыдущих серий:

1. Пакет книг с альда и литреса появился на рапиде.
2. Книги заливаются на либрусек. Часть из них лучше отформатированы/вычитаны, чем те, что уже есть в либе (особенно продукты от librusec_kit), при этом - оба файла имеют один и тот же номер версии (например - 1.0).
3. Некоторые книги после заливки видны на страницах авторов в виде дублей. Для обработки - есть спецраздел форума и служебный блог от pkn.
4. gospeller размещает свой пост в блоге: "Может быть, тот, кто это делает, объяснит, что происходит?". На ссылки, обясняющие происхождение файлов - ответ "И что?".

Пост, основной мыслью которого было "зачем нам другие версии книг" - чему он адекватен?

Цитата:
первый пост вполне адекватен

спасибо

rr3 - оки, пусть будет - "не агрессивный". Я тоже не совсем сразу соотнёс наличие на рапиде литреснутого архива, и массового добавления уже существующих книг.

Цитата:
Может быть, тот, кто это делает, объяснит, что происходит?

Это я заливаю литрес. К сожаленью дурацкий алгоритм вылавливания дублей либрусека не справляется(а точнее подвисает если добавлять одним архивом больше 20 книг), отсюда и "двоящиеся" книги.

Кстати, с исправлениями лучше наверное погодить, пока не зальем все. Евтушенко я сейчас исправил (заняло три минуты), но заливка Альдебарана может снова внести избыточность. Сначала загрузим все, а потом будем разбираться. Глядишь, к тому времени и какая-нибудь разумная концепция модераторов уже появится..

Насчет альдебарана. Я думаю не стоит лить весь альдебаран. Надо скриптом вытащить обновления альда после 29-го мая и их заливать, т.к. альдебаран до 29-го уже заливался. Дело за малым. Осталось написать этот скрипт :D

Здравая мысль :) А как распознать эти обновления? Дата добавления где-то в свойствах fb2 сохраняется?

Либо в свойствах файлов внутри архивов(не факт что осталась старая), либо внутри тегов FB2(осталась 100%, но возможно стоит не во всех книгах).

Bullfear написал:
Насчет альдебарана. Я думаю не стоит лить весь альдебаран. Надо скриптом вытащить обновления альда после 29-го мая и их заливать, т.к. альдебаран до 29-го уже заливался. Дело за малым. Осталось написать этот скрипт :D

Я непременно этим займусь, только, увы, попозже, не сейчас - работа, волчара, неожиданно вышла из лесу...

Stiver написал:
Кстати, с исправлениями лучше наверное погодить, пока не зальем все. Евтушенко я сейчас исправил (заняло три минуты), но заливка Альдебарана может снова внести избыточность. Сначала загрузим все, а потом будем разбираться. Глядишь, к тому времени и какая-нибудь разумная концепция модераторов уже появится..

А надо ли заливать все - весь Альдебаран, весь литрес и.т.д.? Там ведь гавна полно. А в хорошей библиотеке главное не количество, а качество книжек.

По-моему, оптимально делать так.
Скачать доступные архивы, подсоединить их к myhomelib и пользоваться. При нахождении в них хорошей книжку, которой нет на либрусеке (либо есть но худшего качества), вычитываем (это по-возможности) и заливаем на любимый либрусек.

1_абрам написал:

По-моему, оптимально делать так.
Скачать доступные архивы, подсоединить их к myhomelib и пользоваться. При нахождении в них хорошей книжку, которой нет на либрусеке (либо есть но худшего качества), вычитываем (это по-возможности) и заливаем на любимый либрусек.

отличное решение!
но у кого есть эта фишка (myhomelib)?

Bullfear, снимаю все возражения, извини...

Да я и не обижался :) Бдительность это правильно. Думаю, если бы я увидел что-то подобное без обьяснений, я бы тоже стал бить тревогу. Тут есть и моя вина - я отписывался, что добавляю книги в теме, которая уехала на вторую страницу(решил не плодить темы дубли). Просто привык заходить через lib.rus.ec\tracker - там видны все обновления.

обиделся другой человек (особь, вернее)

Книги с литреса теперь переложены с Рапиды еще и сюда: http://www.qshare.com/get/247627/dirlist-litres4415-letters.txt.html http://www.qshare.com/get/247656/litres4415-A.rar.html http://www.qshare.com/get/247673/litres4415-BC.rar.html http://www.qshare.com/get/247667/litres4415-D.rar.html http://www.qshare.com/get/247669/litres4415-EFG.rar.html http://www.qshare.com/get/247663/litres4415-HIK.rar.html http://www.qshare.com/get/247658/litres4415-L.rar.html http://www.qshare.com/get/247659/litres4415-MN.rar.html http://www.qshare.com/get/247662/litres4415-O.rar.html http://www.qshare.com/get/247664/litres4415-PR.rar.html http://www.qshare.com/get/247668/litres4415-S.rar.html http://www.qshare.com/get/247666/litres4415-TUV.rar.html http://www.qshare.com/get/247654/litres4415-YZ.rar.html Кому удобнее - качайте (поддерживается докачка, проверено в Opera 9.5). Надеюсь, ничего не пропущено ;). Примечание: механизм ссылок таков, что они поддерживаются только из браузера, по крайней мере в DM данные ссылки без преобразования адреса не работают :(. Кто не в теме - напоминаю:

Цитата:
Posted June 26th, 2008 by pkn Update4: Выложено на Рапиду (30 June 2008): 4,415 книг в fb2 из Литрес-а - по буквам Пароля нет, добавлено 3% на восстановление. Содержимое - в файле dirlist-litres4415-letters.txt Организовано в RAR-архивы по первым буквам фамилий авторов - для удобства тех, кому не нужно всё собрание целиком. Это то же самое собрание книг, что и "4,316 книг в fb2 из Литрес-а". Книг стало 4,415 потому, что добавилось 99 книг в архиве litres4415-2008.06.rar. Остальные (побуквенные) архивы остались без изменений.
Архивы перекачаны с Рапиды 1:1, так что должны быть полностью совместимы (не проверял ;).
X