FantLab ru



  Лингвистический анализ произведения
Произведение: Боевая машина любви
Автор: Александр Зорич
Дата проведения анализа: 23 июля 2018 года

Общая статистика

Длина текста, знаков:795071
Слов в произведении (СВП):116075
Приблизительно страниц:414
Средняя длина слова, знаков:5.38
Средняя длина предложения (СДП), знаков:62.41
СДП авторского текста, знаков:74.44
СДП диалога, знаков:44.7
Доля диалогов в тексте:29.08%
Доля авторского текста в диалогах:9.52%

Активный словарный запас

Использовано уникальных слов:13747
Активный словарный запас (АСЗ):12256
Активный несловарный запас (АНСЗ):1491
Удельный АСЗ на 3000 слов текста:1282.60
Удельный АСЗ на 10000 слов текста:3099.61 —> 2109-е место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста:12688.30

Части речи

Неопределённых частей речи (НОЧР), слов:24443 (21.06% от СВП)
Определённых частей речи (ОЧР), слов:91632 (78.94% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное24427 (26.66%)
          Прилагательное8826 (9.63%)
          Глагол17472 (19.07%)
          Местоимение-существительное5819 (6.35%)
          Местоименное прилагательное4077 (4.45%)
          Местоимение-предикатив26 (0.03%)
          Числительное (количественное)786 (0.86%)
          Числительное (порядковое)169 (0.18%)
          Наречие2829 (3.09%)
          Предикатив162 (0.18%)
          Предлог9853 (10.75%)
          Союз3888 (4.24%)
          Междометие46 (0.05%)
          Вводное слово38 (0.04%)
          Частица3312 (3.61%)
          Причастие1611 (1.76%)
          Деепричастие67 (0.07%)
Служебных слов:27059 (29.53%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая102.79
          .    точка86.36
          -    тире23.12
          !    восклицательный знак8.27
          ?    вопросительный знак9.68
          ...    многоточие4.82
          !..    воскл. знак с многоточием0.03
          ?..    вопр. знак с многоточием0.05
          !!!    тройной воскл. знак0.04
          ?!    вопр. знак с восклицанием0.03
          "    кавычка20.15
          ()    скобки0.43
          :    двоеточие2.33
          ;    точка с запятой0.21




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Александр Зорич
 54
2. Елена Хаецкая
 46
3. Ольга Ларионова
 45  – ожидает пересчёта
4. Александр Бушков
 45
5. Борис Акунин
 45  – ожидает пересчёта
6. Наталия Ипатова
 45
7. Кирилл Бенедиктов
 44
8. Сергей Сухинов
 44
9. Сергей Шведов
 43
10. Владислав Выставной
 43
...смотреть весь список >>
⇑ Наверх