скрипт для лингвистического анализа текста
Опубликовано вс, 28/12/2008 - 12:58 пользователем Wictor
Forums: Просматривая отзывы на книгу Хаецкой Царство небесное натолкнулся на интересную статистику, сгенерированную скриптом (http://fantlab.ru/work9929): Цитата: Лингвистический анализ текста: Учитывая то, что большинство современных книг весьма низкого качества, задумался: можно ли дать предварительную оценку книги на основании этих цифр. Вообще при выборе книги вы бы на такую статистику обращали бы внимание?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Aliki RE:Подайте бедному копеечку на книжку с литреса... 1 день
babajga RE:Плюмаж 1 день Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 3 дня babajga RE:Блошкинс и Фрю. Опасное путешествие 3 дня kopak RE:О группе Дятлова. О той самой, того самого... 1 неделя alexk RE:Багрепорт - 2 1 неделя babajga RE:Удивленная сова 3 недели Larisa_F RE:Серия «Квадрат» издательства «Текст» 3 недели Aleks_Sim RE:Беженцы с Флибусты 3 недели edvud RE:Прошу переформатировать, распознать, etc... 3 недели monochka RE:С 8 Марта! 3 недели babajga RE:Книга чуДОМищ 4 недели ProstoTac RE:Подборка о Первой Мировой 1 месяц babajga RE:Нержавеющая сабля 1 месяц sem14 RE:«Уроки русского» 1 месяц Isais RE:Древний Рим. Подборка книг 1 месяц babajga RE:Отчаянная осень 1 месяц babajga RE:Сказки Сени Малины 1 месяц Впечатления о книгах
Nivigor про Леонтьева: Zа право жить (Современная проза, О войне)
02 04 Сколько бандерюг тут отметилось! Оценка: отлично!
ne_fanat про Капба: Как приручить дракона. Книга 1 [СИ] (Альтернативная история, Киберпанк, Попаданцы, Самиздат, сетевая литература)
02 04 Выскажусь за первые 4 книги цикла. По крайней мере человек умеет писать намного лучше подавляющего большинства заливаемых тут авторов. Нормальный, хороший, правильный язык и складное повествование. Рекомендую. Оценка: хорошо
virtcatty про Леонтьева: Zа право жить (Современная проза, О войне)
02 04 Не сильно Литературно, но читать можно, и ГЛАВНОЕ НУЖНО! Чтобы люди знали. Для Лысенко ВА Да Я Русский патриот и не в коем случае как Вы пишете "рашен" Кому жить , а кому умереть каждый решает САМ и способствует этому тоже САМ!
mysevra про Толкачев: Паутина противостояния [антология] (Фэнтези)
02 04 Слабенько даже по сравнению с предыдущей антологией. Оценка: неплохо
mysevra про Толкачев: Правила крови [антология] (Городское фэнтези)
02 04 Рассказы Панова понравились, остальное - на любителя. Оценка: хорошо
mysevra про Терехов: Каменный мост (Современная проза)
02 04 Была бы хорошая летопись тех времен и будней номенклатуры, если бы не "жесткая рефлексия самого героя" вместе с его беспорядочной личной жизнью. Даже хуже чем сериал, из-за которого решила прочитать книгу. Оценка: неплохо
Лысенко Владимир Андреевич про Леонтьева: Zа право жить (Современная проза, О войне)
01 04 Как всегда только мы русские можем решать, кому жить, а кому умереть. Если не по нашему то они бандеровцы. Нечитаемо, только для рашен патриотов. Оценка: нечитаемо
Paul von Sokolovski про Первый в касте бездны
31 03 Мне понравился этот сериал. Легко читается, симпатичный главгерой , чем то напомнило старую литературу для подростков. Отлично.
Gilean про Сопряжение [Астахов]
31 03 Шикарная серия, драйв нонстоп как говорится. И концовка понравилась.
RedRoses3 про Демиденко: Мастерство работы с ChatGPT 4 [полный гид для новичков и профессионалов] (Околокомпьютерная литература, Учебные пособия, самоучители)
31 03 Про ИИ надо не читать, а брать и делать
Синявский про Ален Жобер
30 03 В возрасте 84 лет скончался французский деятель культуры, известный как режиссер, писатель, актер, продюсер и переводчик — Ален Жобер. Об этом информирует портал Telerama. Жобер являлся коренным парижанином, в столице ………
dolle про Михайлов: Пепел доверия (Боевая фантастика, Социальная фантастика, Постапокалипсис, Самиздат, сетевая литература)
30 03 Продолжение в следующей книге может быть о крушении "пластмассового" мира , когда люди избавляются от всей лишней шелухи цивилизации, когда бывший офисный планктон матереет и борется за выживание в новых реалиях одновременно ……… Оценка: отлично! |
Отв: скрипт для лингвистического анализа текста
Хотите поверить алгеброй гармонию? :)
Нет. Цифры любопытные, но, увы, о качестве книги они ровным счетом ничего не говорят.
Отв: скрипт для лингвистического анализа текста
А если бедный язык у автора? Ну т.е. значение "Активный словарный запас"?
Отв: скрипт для лингвистического анализа текста
Вы считаете, что у Елены Хаецкой "бедный язык"? :)
Отв: скрипт для лингвистического анализа текста
Я вот тоже очень удивилась. Зато выявилась достоверность "скриповой" оценки текста. :)
Отв: скрипт для лингвистического анализа текста
Под словом "автор" я имел в виду автора гипотетического. Хаецкая мне нравится, хотя в некоторых ее произведения встречаются повторы чуть ли не абзацев. Например куски текста из Саги о Хелоте встречаются в Харольде.
Отв: скрипт для лингвистического анализа текста
Не люблю говорить о сферических конях в вакууме. В Вашем примере активный словарный запас автора "ниже среднего". С творчеством автора Вы знакомы. Значит, можете сделать выводы. Вы считаете, что у данного автора "бедный язык"? Если ответ "да", то Вы можете смело использовать данный скрипт для предварительной оценки произведения :)
Отв: скрипт для лингвистического анализа текста
На именно такую статистику - скорее не обращал бы, чем обращал.
Но вообще-то идея не такая уж дурацкая, гармонию - не гармонию, а некоторые характеристики текста программно поймать вполне можно, хоть тот же "Штампомер" вспомнить. У меня давно свербила идея попробовать на зубок тексты людей, явно не умеющих писать (ака графоманов).
Есть как минимум два довольно легко формализуемых признака графоманского текста:
1. Избыток восклицательных знаков в прямой речи героев.
2. Вязкость словоупотребления, то бишь - одинаковые или однокоренные слова в соседних предложениях (например "Но вообще-то идея не такая уж дурацкая..." и "У меня давно свербила идея...").
Был ешё и третий признак, но я его, каюсь, забыл...
Отв: скрипт для лингвистического анализа текста
Вот ещё можно вдоволь поиграться: http://rusf.ru/books/analysis/ :)
Отв: скрипт для лингвистического анализа текста
Можно обращать и на такую но ... только строить ее не по книге, а по автору. Т.е. ввести весь его опубликованный корпус и построить профиль, желательно в привязке ко времени, что б была видна и динамика. Но при этом не забывать, что это относительные характеристики и их надо сравнивать с "подпольем" и "потолком" ;), т.к. средняя температура по больнице ничего толкового не выявит.