fantlab ru



  Лингвистический анализ произведения
Произведение: Лотос
Автор: Анатолий Ким
Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:229615
Слов в произведении (СВП):34941
Приблизительно страниц:121
Средняя длина слова, знаков:5.26
Средняя длина предложения (СДП), знаков:141.15
СДП авторского текста, знаков:159.01
СДП диалога, знаков:69.08
Доля диалогов в тексте:9.76%
Доля авторского текста в диалогах:11.64%

Активный словарный запас

Использовано уникальных слов:6631
Активный словарный запас (АСЗ):6432
Активный несловарный запас (АНСЗ):199
Удельный АСЗ на 3000 слов текста:1298.83
Удельный АСЗ на 10000 слов текста:3068.92 —> 2786-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:7322 (20.96% от СВП)
Определённых частей речи (ОЧР), слов:27619 (79.04% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное9249 (33.49%)
          Прилагательное4520 (16.37%)
          Глагол5326 (19.28%)
          Местоимение-существительное2280 (8.26%)
          Местоименное прилагательное1897 (6.87%)
          Местоимение-предикатив1 (0.00%)
          Числительное (количественное)263 (0.95%)
          Числительное (порядковое)38 (0.14%)
          Наречие1561 (5.65%)
          Предикатив203 (0.74%)
          Предлог3560 (12.89%)
          Союз2675 (9.69%)
          Междометие383 (1.39%)
          Вводное слово55 (0.20%)
          Частица1667 (6.04%)
          Причастие876 (3.17%)
          Деепричастие117 (0.42%)
Служебных слов:12635 (45.75%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая154.38
          .    точка36.58
          -    тире11.53
          !    восклицательный знак1.83
          ?    вопросительный знак5.64
          ...    многоточие5.47
          !..    воскл. знак с многоточием0.03
          ?..    вопр. знак с многоточием0.14
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.09
          "    кавычка1.60
          ()    скобки0.60
          :    двоеточие2.80
          ;    точка с запятой1.97




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Анатолий Ким
 43
2. Елена Хаецкая
 32
3. Сергей Волков
 32
4. Марина и Сергей Дяченко
 32
5. Василий Аксёнов
 32
6. Андрей Ерпылев
 32
7. Александр Варго
 32
8. Александр Зорич
 32
9. Михаил Савеличев
 31
10. Юлия Набокова
 31
...смотреть весь список >>
⇑ Наверх