скрипт для лингвистического анализа текста
Опубликовано вс, 28/12/2008 - 12:58 пользователем Wictor
Forums: Просматривая отзывы на книгу Хаецкой Царство небесное натолкнулся на интересную статистику, сгенерированную скриптом (http://fantlab.ru/work9929): Цитата: Лингвистический анализ текста: Учитывая то, что большинство современных книг весьма низкого качества, задумался: можно ли дать предварительную оценку книги на основании этих цифр. Вообще при выборе книги вы бы на такую статистику обращали бы внимание?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
sem14 RE:Координация сканирования и вычитки 18 часов
Моржехрен RE:Помогите найти!.. #2 2 дня babajga RE:Кто сможет раздобыть и оцифровать нужные мне книги? 3 дня Isais RE:Мои открытия 4 дня aldan RE:Подайте бедному копеечку на книжку с литреса... 4 дня kopak RE:О группе Дятлова. О той самой, того самого... 1 неделя A5. RE:Не присылает пароль на почту 1 неделя babajga RE:Плюмаж 3 недели babajga RE:Блошкинс и Фрю. Опасное путешествие 3 недели alexk RE:Багрепорт - 2 1 месяц babajga RE:Удивленная сова 1 месяц Larisa_F RE:Серия «Квадрат» издательства «Текст» 1 месяц Aleks_Sim RE:Беженцы с Флибусты 1 месяц edvud RE:Прошу переформатировать, распознать, etc... 1 месяц monochka RE:С 8 Марта! 1 месяц babajga RE:Книга чуДОМищ 1 месяц ProstoTac RE:Подборка о Первой Мировой 1 месяц babajga RE:Нержавеющая сабля 1 месяц Впечатления о книгах
Oleg68 про Куанг: Пылающий бог [litres] (Героическая фантастика, Фэнтези)
23 04 Мне понравилась книга. Окончание очень неожиданное. Оценка: отлично!
A5. про Норфолк: В обличье вепря [In the Shape of a Boar ru] (Современная проза)
22 04 Убеждаюсь: обалденный автор. Как и предполагалось, дикое количество объёмистых комментариев и пояснений в сносках отнюдь не облегчает процесс чтения сего опуса на ебуке. Но, как опять же и ожидалось, — удовольствие получено ……… Оценка: отлично!
A5. про Топор: Зима под столом [L'Hiver sous la table ru] (Комедия)
22 04 A5 в 12:30 ( 01:00) 30-01-2018, Оценка: отлично! Драма абсурда. Она бы и была просто весёлой, милой драмой абсурда с видимостью плавного перехода в комедию, если бы автор не приделал к ней вот такую концовку. Присовокупил ………
A5. про Якобсен: Чистая вода [Det nye vannet ru] (Современная проза)
22 04 A5 в 10:11 ( 02:00) / 16-07-2017, Оценка: отлично! Оченно понравилось. Атмосферно - скандинавия, дождь, снег, зябко, мрачно, безысходно, дух смятенный, характеры, исчезновение одного персонажа... Любителям холодной скандинавщинки ……… Оценка: хорошо
Barbud про Шалашов: Господин следователь. Книга 7 [СИ] (Альтернативная история, Исторический детектив, Попаданцы, Самиздат, сетевая литература)
21 04 Продолжается ровное и неторопливое повествование без особых драматизьмов, потрясений и неожиданных поворотов сюжета. Можно читать на сон грядущий, слегка убаюкивает. Отметил один анахронизм - ГГ лакомится пошехонским сыром, ………
Lan2292 про Сластин: Первый пользователь. Книга 1 (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература)
21 04 если вам нравится пересказ бродилки, может и зайдет, скучно.
mysevra про Свечин: Завещание Аввакума [litres] (Исторический детектив)
21 04 Интересно написано, декорации понравились даже больше собственно "детектива". Всё так степенно и благополучно, и руководство ценит, осыпает наградами и обучает - милота. Оценка: хорошо
mysevra про Нури: Волчий остров [СИ litres] (Ужасы, Самиздат, сетевая литература)
21 04 Изложено хорошо, истории занятные, но нет никаких завязка-развитие-кульминация-развязка, просто эпизоды. Оценка: неплохо
mysevra про Кейли: Жатва [litres] (Триллер, Детективы: прочее)
21 04 Невнятно описанный театр абсурда. Сплошной сумбур, и всё слишком узнаваемо, чтобы быть новым и оригинальным. Даже редактору поленились показать: автору все равно что "отринула", что "отпрянула"; какие-то скрепы в цепи и пр. Оценка: плохо
[email protected] про Степанова: Корень зла среди трав [litres] (Классический детектив, Детективы: прочее)
20 04 Серия неинтересная, какая то надуманная и далека от реальности Оценка: хорошо
nik_ol про Донцова: Кладбище чужих секретов (Иронический детектив, Детективы: прочее)
17 04 Спасибо огромное, что выложили! (❁´◡`❁) Оценка: хорошо
Sello про Раззаков: Другой Владимир Высоцкий (Биографии и Мемуары)
17 04 Литературный говномеситель. Мертвые сраму не имут. Тем более, что и ответить говномесителю покойный не может. Оценка: нечитаемо |
Отв: скрипт для лингвистического анализа текста
Хотите поверить алгеброй гармонию? :)
Нет. Цифры любопытные, но, увы, о качестве книги они ровным счетом ничего не говорят.
Отв: скрипт для лингвистического анализа текста
А если бедный язык у автора? Ну т.е. значение "Активный словарный запас"?
Отв: скрипт для лингвистического анализа текста
Вы считаете, что у Елены Хаецкой "бедный язык"? :)
Отв: скрипт для лингвистического анализа текста
Я вот тоже очень удивилась. Зато выявилась достоверность "скриповой" оценки текста. :)
Отв: скрипт для лингвистического анализа текста
Под словом "автор" я имел в виду автора гипотетического. Хаецкая мне нравится, хотя в некоторых ее произведения встречаются повторы чуть ли не абзацев. Например куски текста из Саги о Хелоте встречаются в Харольде.
Отв: скрипт для лингвистического анализа текста
Не люблю говорить о сферических конях в вакууме. В Вашем примере активный словарный запас автора "ниже среднего". С творчеством автора Вы знакомы. Значит, можете сделать выводы. Вы считаете, что у данного автора "бедный язык"? Если ответ "да", то Вы можете смело использовать данный скрипт для предварительной оценки произведения :)
Отв: скрипт для лингвистического анализа текста
На именно такую статистику - скорее не обращал бы, чем обращал.
Но вообще-то идея не такая уж дурацкая, гармонию - не гармонию, а некоторые характеристики текста программно поймать вполне можно, хоть тот же "Штампомер" вспомнить. У меня давно свербила идея попробовать на зубок тексты людей, явно не умеющих писать (ака графоманов).
Есть как минимум два довольно легко формализуемых признака графоманского текста:
1. Избыток восклицательных знаков в прямой речи героев.
2. Вязкость словоупотребления, то бишь - одинаковые или однокоренные слова в соседних предложениях (например "Но вообще-то идея не такая уж дурацкая..." и "У меня давно свербила идея...").
Был ешё и третий признак, но я его, каюсь, забыл...
Отв: скрипт для лингвистического анализа текста
Вот ещё можно вдоволь поиграться: http://rusf.ru/books/analysis/ :)
Отв: скрипт для лингвистического анализа текста
Можно обращать и на такую но ... только строить ее не по книге, а по автору. Т.е. ввести весь его опубликованный корпус и построить профиль, желательно в привязке ко времени, что б была видна и динамика. Но при этом не забывать, что это относительные характеристики и их надо сравнивать с "подпольем" и "потолком" ;), т.к. средняя температура по больнице ничего толкового не выявит.