fantlab ru



  Лингвистический анализ произведения
Произведение: Тридцать седьмое полнолуние
Автор: Инна Живетьева
Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:662763
Слов в произведении (СВП):97081
Приблизительно страниц:342
Средняя длина слова, знаков:5.31
Средняя длина предложения (СДП), знаков:39.25
СДП авторского текста, знаков:47.06
СДП диалога, знаков:30.75
Доля диалогов в тексте:37.66%
Доля авторского текста в диалогах:5.39%

Активный словарный запас

Использовано уникальных слов:10782
Активный словарный запас (АСЗ):10251
Активный несловарный запас (АНСЗ):531
Удельный АСЗ на 3000 слов текста:1308.93
Удельный АСЗ на 10000 слов текста:3020.28 —> 3350-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:21004 (21.64% от СВП)
Определённых частей речи (ОЧР), слов:76077 (78.36% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное25806 (33.92%)
          Прилагательное7444 (9.78%)
          Глагол22240 (29.23%)
          Местоимение-существительное6110 (8.03%)
          Местоименное прилагательное2631 (3.46%)
          Местоимение-предикатив6 (0.01%)
          Числительное (количественное)871 (1.14%)
          Числительное (порядковое)228 (0.30%)
          Наречие4053 (5.33%)
          Предикатив840 (1.10%)
          Предлог10008 (13.16%)
          Союз6289 (8.27%)
          Междометие1537 (2.02%)
          Вводное слово314 (0.41%)
          Частица5312 (6.98%)
          Причастие1123 (1.48%)
          Деепричастие227 (0.30%)
Служебных слов:32434 (42.63%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая110.23
          .    точка134.36
          -    тире29.48
          !    восклицательный знак10.18
          ?    вопросительный знак20.02
          ...    многоточие6.06
          !..    воскл. знак с многоточием0.21
          ?..    вопр. знак с многоточием0.15
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.82
          "    кавычка14.52
          ()    скобки0.02
          :    двоеточие8.15
          ;    точка с запятой0.31




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Инна Живетьева
 49
2. Иван Сербин
 41
3. Виктор Глумов
 39
4. Сергей Волков
 39
5. Марина и Сергей Дяченко
 39
6. Алексей Олейников
 38
7. Алекс Орлов
 38
8. Данил Корецкий
 38
9. Олег Верещагин
 38
10. Анна Чарова
 38
...смотреть весь список >>
⇑ Наверх