Перед изданием сверить! - Алгоритм поможет предугадать популярность "нетленнки"

Считается, что предсказать продажи книги до её выхода в свет практически невозможно. Однако новый алгоритм, который разработали специалисты из Университета штата Нью-Йорк в Стоуни-Брук, позволяет сделать это с точностью в 84%.

Исследователи воспользовались методом статистической стилометрии, с помощью которого анализировали тексты. Они воспользовались классическими произведениями проекта «Гутенберг», доступными бесплатно в онлайне. Пропустив их через алгоритм, который предсказывает продажи этих произведений, они сравнили полученные результаты с историческими данными, после чего было констатировано 84-процентное совпадение.
Какова же формула успешной книги? Вот основные правила: нужно часто использовать союзы (например, «и», «но»), существительные и прилагательные; в неудачных работах чаще использовались глаголы и наречия для описания действий и эмоций; глаголы должны использоваться для описания мыслительного процесса («узнал», «вспомнил»).

Исследователи также проверили свой алгоритм на книгах, которые продаются в Amazon, и обнаружили, что он работает и для современных произведений.

Оригинал на английском:
http://www.telegraph.co.uk/technology/news/10560533/Scientists-find-secret-to-writing-a-best-selling-novel.html

Комментарии

Аватар пользователя Isais

Как интересно! Реальные основания для определения будущего бестселлера. Но - англоязычного.
Поскольку у английской и русской литературы наверняка разное статистическое распределение лексических средств, для русских книг статистика должна быть обсчитана заново. А то безумно веселят неизданные рукописи, конкурирующие за звание русского bestseller.
И кажется мне, что-то такое для русского языка уже встречалось в сети...

Ну "основные правила" в принципе и для русскоязычного аффтора действительны: самые тягомотные на русском языке поделки переполнены описанием действий - "я пошел", "он поел", "она отдалась", изредка разбавленных чем то вроде прилагательных "восторженно" или "сурово"...

А для более вдумчивого анализа русских текстов существуют, но только за деньги программки анализаторы вроде Ваала, или комплект Триз. Использовались раньше, при пиар компаниях на выборах, сейчас даже не знаю. Во всяком случае писателям не до них :)

Аватар пользователя Isais

AleksRonin написал:
А для более вдумчивого анализа русских текстов существуют, но только за деньги программки анализаторы вроде Ваала, или комплект Триз. Использовались раньше, при пиар компаниях на выборах, сейчас даже не знаю. Во всяком случае писателям не до них :)
*понимающе* Потому что програмки платные?
Естественно... Рускописателям даже бесплатный спеллчек в Ворде включить тяжко.
(А напрячься и придумать собственное, неворованное название для своего текста - так вообще мозгам невпроворот!
Недавно еще один украл у Стругацких заглавие для собственного бестселлера. Думаю, и цопирайт на названье уже успел зарегистрировать. И гордо возмущается: "Пиратам лень мою новинку сканить!")

Да нет... На 50 процентов думаю не в платности дело, а скорее в заглохших проектах. Не имеющих ни поддержки ни развития с дремучих 90 годов. Иногда даже непонятно как купить это.
А может и не заглохших - просто товарищи ушли в те области где трава зеленее - ка к тот же горыныч который как говорят плавно превратился в Гугле голосовой поиск, и мелкие пользователи им просто неинтересны.

Современные и писатели, и пейсатели и даже графоманы иногда вовсе не против выложить бабло за программу в поисках магической кнопки: "написать зашибись", просто предложения конкретно для русского рынка нет и не будет.

Заглавие это еще ничего :) В конце концов кто там этих Стругацких сейчас помнит - у меня были случаи когда вообще книги целиком тырили в надежде что никто не вспомнит.

Аватар пользователя Isais

AleksRonin написал:
...Заглавие это еще ничего :) В конце концов кто там этих Стругацких сейчас помнит - у меня были случаи когда вообще книги целиком тырили в надежде что никто не вспомнит.

Не целиком, но весьма симптоматичное воровство: http://lib.rus.ec/b/334084
X