Перед изданием сверить! - Алгоритм поможет предугадать популярность "нетленнки" | Либрусек

Вы здесь Главная » Блоги » Блог пользователя AleksRonin Перед изданием сверить! - Алгоритм поможет предугадать популярность "нетленнки" Опубликовано вс, 26/01/2014 - 13:04 пользователем AleksRonin Считается, что предсказать продажи книги до её выхода в свет практически невозможно. Однако новый алгоритм, который разработали специалисты из Университета штата Нью-Йорк в Стоуни-Брук, позволяет сделать это с точностью в 84%. Исследователи воспользовались методом статистической стилометрии, с помощью которого анализировали тексты. Они воспользовались классическими произведениями проекта «Гутенберг», доступными бесплатно в онлайне. Пропустив их через алгоритм, который предсказывает продажи этих произведений, они сравнили полученные результаты с историческими данными, после чего было констатировано 84-процентное совпадение. Какова же формула успешной книги? Вот основные правила: нужно часто использовать союзы (например, «и», «но»), существительные и прилагательные; в неудачных работах чаще использовались глаголы и наречия для описания действий и эмоций; глаголы должны использоваться для описания мыслительного процесса («узнал», «вспомнил»). Исследователи также проверили свой алгоритм на книгах, которые продаются в Amazon, и обнаружили, что он работает и для современных произведений. Оригинал на английском: http://www.telegraph.co.uk/technology/news/10560533/Scientists-find-secret-to-writing-a-best-selling-novel.html открыть By Matthew Sparkes: Scientists find secret to writing a best-selling novel Computer scientists have developed an algorithm which can predict with 84 per cent accuracy whether a book will be a commercial success - and the secret is to avoid cliches and excessive use of verbs Scientists find the secret to writing a best-selling novel By downloading classic books from the Project Gutenberg archive they were able to analyse texts and then compare their predictions to historical information on the success of the work Photo: Alamy Scientists have developed an algorithm which can analyse a book and predict with 84 per cent accuracy whether or not it will be a commercial success. A technique called statistical stylometry, which mathematically examines the use of words and grammar, was found to be “surprisingly effective” in determining how popular a book would be. The group of computer scientists from Stony Brook University in New York said that a range of factors determine whether or not a book will enjoy success, including “interestingness”, novelty, style of writing, and how engaging the storyline is, but admit that external factors such as luck can also play a role. By downloading classic books from the Project Gutenberg archive they were able to analyse texts with their algorithm and compare its predictions to historical information on the success of the work. Everything from science fiction to classic literature and poetry was included. It was found that the predictions matched the actual popularity of the book 84 per cent of the time. They found several trends that were often found in successful books, including heavy use of conjunctions such as “and” and “but” and large numbers of nouns and adjectives. Less successful work tended to include more verbs and adverbs and relied on words that explicitly describe actions and emotions such as “wanted”, “took” or “promised”, while more successful books favoured verbs that describe thought processes such as “recognised” or “remembered”. To find “less successful” books for their tests, the researchers scoured Amazon for low-ranking books in terms of sales. They also included Dan Brown’s The Lost Symbol, despite its commercial success, because of “negative critiques if had attracted from media”. “Predicting the success of literary works poses a massive dilemma for publishers and aspiring writers alike,” said Assistant Professor Yejin Choi, one of the authors of the paper published by the Association of Computational Linguistics. “To the best of our knowledge, our work is the first that provides quantitative insights into the connection between the writing style and the success of literary works. “Previous work has attempted to gain insights into the ‘secret recipe’ of successful books. But most of these studies were qualitative, based on a dozen books, and focused primarily on high-level content - the personalities of protagonists and antagonists and the plots. Our work examines a considerably larger collection - 800 books - over multiple genres, providing insights into lexical, syntactic, and discourse patterns that characterise the writing styles commonly shared among the successful literature.” Блог пользователя AleksRonin Войдите или зарегистрируйтесь, чтобы отправлять комментарии Комментарии Отв: Перед изданием сверить! - Алгоритм поможет предугадать ... Постоянная ссылка (Permalink) Опубликовано вс, 26/01/2014 - 13:26 пользователем Isais Как интересно! Реальные основания для определения будущего бестселлера. Но - англоязычного. Поскольку у английской и русской литературы наверняка разное статистическое распределение лексических средств, для русских книг статистика должна быть обсчитана заново. А то безумно веселят неизданные рукописи, конкурирующие за звание русского bestseller. И кажется мне, что-то такое для русского языка уже встречалось в сети... Отв: Перед изданием сверить! - Алгоритм поможет предугадать ... Постоянная ссылка (Permalink) Опубликовано вс, 26/01/2014 - 13:39 пользователем AleksRonin Ну "основные правила" в принципе и для русскоязычного аффтора действительны: самые тягомотные на русском языке поделки переполнены описанием действий - "я пошел", "он поел", "она отдалась", изредка разбавленных чем то вроде прилагательных "восторженно" или "сурово"... А для более вдумчивого анализа русских текстов существуют, но только за деньги программки анализаторы вроде Ваала, или комплект Триз. Использовались раньше, при пиар компаниях на выборах, сейчас даже не знаю. Во всяком случае писателям не до них :) Отв: Перед изданием сверить! - Алгоритм поможет предугадать ... Постоянная ссылка (Permalink) Опубликовано вс, 26/01/2014 - 14:10 пользователем Isais AleksRonin написал: А для более вдумчивого анализа русских текстов существуют, но только за деньги программки анализаторы вроде Ваала, или комплект Триз. Использовались раньше, при пиар компаниях на выборах, сейчас даже не знаю. Во всяком случае писателям не до них :) понимающе Потому что програмки платные? Естественно... Рускописателям даже бесплатный спеллчек в Ворде включить тяжко. (А напрячься и придумать собственное, неворованное название для своего текста - так вообще мозгам невпроворот! Недавно еще один украл у Стругацких заглавие для собственного бестселлера. Думаю, и цопирайт на названье уже успел зарегистрировать. И гордо возмущается: "Пиратам лень мою новинку сканить!") Отв: Перед изданием сверить! - Алгоритм поможет предугадать ... Постоянная ссылка (Permalink) Опубликовано вт, 28/01/2014 - 12:38 пользователем AleksRonin Да нет... На 50 процентов думаю не в платности дело, а скорее в заглохших проектах. Не имеющих ни поддержки ни развития с дремучих 90 годов. Иногда даже непонятно как купить это. А может и не заглохших - просто товарищи ушли в те области где трава зеленее - ка к тот же горыныч который как говорят плавно превратился в Гугле голосовой поиск, и мелкие пользователи им просто неинтересны. Современные и писатели, и пейсатели и даже графоманы иногда вовсе не против выложить бабло за программу в поисках магической кнопки: "написать зашибись", просто предложения конкретно для русского рынка нет и не будет. Заглавие это еще ничего :) В конце концов кто там этих Стругацких сейчас помнит - у меня были случаи когда вообще книги целиком тырили в надежде что никто не вспомнит. Отв: Перед изданием сверить! - Алгоритм поможет предугадать ... Постоянная ссылка (Permalink) Опубликовано вт, 28/01/2014 - 13:07 пользователем Isais AleksRonin написал: ...Заглавие это еще ничего :) В конце концов кто там этих Стругацких сейчас помнит - у меня были случаи когда вообще книги целиком тырили в надежде что никто не вспомнит. Не целиком, но весьма симптоматичное воровство: http://lib.rus.ec/b/334084	Вход на сайт Имя пользователя * Пароль * Запомнить меня Регистрация Забыли пароль? Навигация Книги Издательские серии Премии Рекомендации Библиотечное ЧаВо Вычитка Про вычитку Технические темы Последние материалы Поиск по блогам и форумам Поиск книг Фильтр-список Популярные книги User menu Чёрно-белый список Книжная полка Последние комментарии Aleks_Sim RE:Багрепорт - 2 3 дня Telly RE:Подайте бедному копеечку на книжку с литреса... 4 дня babajga RE:Удивленная сова 1 неделя Larisa_F RE:Серия «Квадрат» издательства «Текст» 1 неделя Aleks_Sim RE:Беженцы с Флибусты 1 неделя edvud RE:Прошу переформатировать, распознать, etc... 1 неделя monochka RE:С 8 Марта! 1 неделя babajga RE:Книга чуДОМищ 2 недели ProstoTac RE:Подборка о Первой Мировой 2 недели babajga RE:Нержавеющая сабля 2 недели sem14 RE:«Уроки русского» 2 недели Isais RE:Древний Рим. Подборка книг 2 недели kopak RE:О группе Дятлова. О той самой, того самого... 2 недели babajga RE:Отчаянная осень 3 недели babajga RE:Сказки Сени Малины 3 недели babajga RE:Сказки 3 недели babajga RE:Мои четвероногие друзья 3 недели Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 3 недели Впечатления о книгах paradaise про Иван Александрович Белов 19 03 Очень талантливый автор!"Заступа-2" очень мрачный,что не отменяет юмор Белова и отличное темное фэнтези.Как подарок "Заступа-3" вышел.Почитаю и наверняка перечитаю.Пока все на 5 .Мастер слова! Синявский про Даг Солстад 18 03 17 марта после непродолжительного нахождения в больнице ушел из жизни норвежский прозаик и драматург. Среди его произведений — «Военная трилогия», «Стыд и достоинство», «Т. Зингер», «Семнадцатый роман». decim про Гэблдон: Чужестранка. Восхождение к любви [Outlander [= Cross Stitch] ru] (Исторические любовные романы, Любовная фантастика, Попаданцы) 18 03 Дамская сказка про любоффь. ЛФР как есть, и не худший образец. Рояли в кустах и кавалерия имеются в количествах, секс для дам - пожалуйста, бэкграунд - уточнить у Скотта В. и Бёрнса Р. Малость слэша тоже есть. Садомазо ……… Оценка: неплохо nik_ol про Устинова: Детектив на краю лета (Детективы: прочее) 17 03 А что, у Поляковой больше ничего не выхожит? Вместе с её соавтором?.. gruin про Чайка: Купец из будущего ч.1 (Альтернативная история, Попаданцы, Самиздат, сетевая литература) 17 03 Капитальная нудятина. Просто тошнит Оценка: нечитаемо mysevra про Чайлд: Забытая комната [The Forgotten Room ru] (Научная фантастика) 17 03 Персонажи невероятно тупят, выдавая лежащие на поверхности факты за сверхумные озарения. Сплошное разочарование. Оценка: плохо mysevra про Шемшук: Сыроедение – путь к бессмертию (Здоровье) 17 03 Такую разудалую пургу под одной обложкой редко встретишь. Тут и старость от слова star, и годовалые дети-мудрецы, и умершие от восторга деревья. И поработители, желающие уничтожить человечество, но доведшие популяцию уже до ……… Оценка: неплохо Belomor.canal про Яхина: Эйзен: роман-буфф (Современная проза) 17 03 Это не роман, то есть не худлит. Это нон фикшн, беллетризированная биография Эйзенштейна, но написанная так что биографию - то есть где и когда и с кем надо держат на коленках, потому как ЖЗЛ Эйзенштейн еще не оцифрован. В ……… Оценка: неплохо mysevra про Ершов: Конек-Горбунок (Сказка, Детские стихи) 17 03 Замечательна сказка. Со временем воспринимается по-другому, но нравится ещё больше. Оценка: отлично! jonyks про Гагин: Книга Достигатора (Психология, Самосовершенствование) 17 03 книга просто отличная! очень веселая miri.ness_ про Александер: Секс был. Интимная жизнь Советского союза (Публицистика, Эротика, Секс) 16 03 Мало кто знает, как Людмила Иванова (автор "Секса у нас нет") закончила фразу (под улюлюканье зала) так: "У нас есть любовь". Жаль, тут скриншот не прикрепишь. Может, не грохнут: https://nnmclub.to/forum/viewtopic.php?t=1763774 Оценка: плохо Gilean про Боксер [Дамиров, Гуров] 16 03 Читаю 3 книгу и это начинает напоминать, того же Курсанта. Герой начинает "вляпываться" в закрытый кружок получателей благ в СССР через девочек. В общем-то читать интересно, но если для вас это не первая серия писателя, ……… больше впечатлений