fantlab ru



  Лингвистический анализ произведения
Произведение: Мушкетёр
Автор: Валерий Большаков
Дата проведения анализа: 19 сентября 2022 года

Общая статистика

Длина текста, знаков:444228
Слов в произведении (СВП):62737
Приблизительно страниц:227
Средняя длина слова, знаков:5.46
Средняя длина предложения (СДП), знаков:61.1
СДП авторского текста, знаков:84.71
СДП диалога, знаков:40.67
Доля диалогов в тексте:35.86%
Доля авторского текста в диалогах:9.64%

Активный словарный запас

Использовано уникальных слов:11616
Активный словарный запас (АСЗ):10554
Активный несловарный запас (АНСЗ):1062
Удельный АСЗ на 3000 слов текста:1467.39
Удельный АСЗ на 10000 слов текста:3574.09 —> 202-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:12503 (19.93% от СВП)
Определённых частей речи (ОЧР), слов:50234 (80.07% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное17575 (34.99%)
          Прилагательное5388 (10.73%)
          Глагол11734 (23.36%)
          Местоимение-существительное3392 (6.75%)
          Местоименное прилагательное2321 (4.62%)
          Местоимение-предикатив10 (0.02%)
          Числительное (количественное)633 (1.26%)
          Числительное (порядковое)106 (0.21%)
          Наречие2401 (4.78%)
          Предикатив394 (0.78%)
          Предлог5956 (11.86%)
          Союз4813 (9.58%)
          Междометие884 (1.76%)
          Вводное слово103 (0.21%)
          Частица3201 (6.37%)
          Причастие1122 (2.23%)
          Деепричастие231 (0.46%)
Служебных слов:20911 (41.63%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая132.82
          .    точка73.74
          -    тире40.36
          !    восклицательный знак19.92
          ?    вопросительный знак10.66
          ...    многоточие10.22
          !..    воскл. знак с многоточием0.45
          ?..    вопр. знак с многоточием0.14
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.49
          "    кавычка11.92
          ()    скобки0.29
          :    двоеточие4.65
          ;    точка с запятой0.05




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Валерий Большаков
 49
2. Сергей Волков
 41
3. Владислав Русанов
 41
4. Александр и Людмила Белаш
 41
5. Сергей Панарин
 41
6. Владимир Свержин
 41
7. Александр Сивинских
 40
8. Андрей Ерпылев
 40
9. Дмитрий Беразинский
 40
10. Борис Акунин
 40
...смотреть весь список >>
⇑ Наверх