fantlab ru



  Лингвистический анализ произведения
Произведение: Зов из бездны
Автор: Михаил Ахманов
Дата проведения анализа: 19 сентября 2022 года

Общая статистика

Длина текста, знаков:468965
Слов в произведении (СВП):72895
Приблизительно страниц:241
Средняя длина слова, знаков:4.99
Средняя длина предложения (СДП), знаков:73.79
СДП авторского текста, знаков:91.3
СДП диалога, знаков:51.27
Доля диалогов в тексте:30.5%
Доля авторского текста в диалогах:6.73%

Активный словарный запас

Использовано уникальных слов:8605
Активный словарный запас (АСЗ):7997
Активный несловарный запас (АНСЗ):608
Удельный АСЗ на 3000 слов текста:1155.85
Удельный АСЗ на 10000 слов текста:2569.86 —> 9714-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:15220 (20.88% от СВП)
Определённых частей речи (ОЧР), слов:57675 (79.12% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное19793 (34.32%)
          Прилагательное5551 (9.62%)
          Глагол12133 (21.04%)
          Местоимение-существительное5016 (8.70%)
          Местоименное прилагательное3043 (5.28%)
          Местоимение-предикатив8 (0.01%)
          Числительное (количественное)789 (1.37%)
          Числительное (порядковое)162 (0.28%)
          Наречие2169 (3.76%)
          Предикатив480 (0.83%)
          Предлог6860 (11.89%)
          Союз7157 (12.41%)
          Междометие1317 (2.28%)
          Вводное слово166 (0.29%)
          Частица4067 (7.05%)
          Причастие929 (1.61%)
          Деепричастие120 (0.21%)
Служебных слов:27754 (48.12%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая140.39
          .    точка61.09
          -    тире23.73
          !    восклицательный знак10.77
          ?    вопросительный знак8.64
          ...    многоточие7.30
          !..    воскл. знак с многоточием0.34
          ?..    вопр. знак с многоточием1.66
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.01
          "    кавычка3.62
          ()    скобки1.07
          :    двоеточие6.93
          ;    точка с запятой2.41




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Михаил Ахманов
 44
2. Игорь Недозор
 37
3. Владимир Свержин
 37
4. Александр Зорич
 36
5. Борис Акунин
 36
6. Александр и Людмила Белаш
 36
7. Елена Хаецкая
 36
8. Кирилл Бенедиктов
 35
9. Олег Никитин
 35
10. Владимир Лещенко
 35
...смотреть весь список >>
⇑ Наверх