FantLab ru



  Лингвистический анализ произведения
Произведение: Ведьма княгини
Автор: Наталья Образцова
Дата проведения анализа: 24 июля 2018 года

Общая статистика

Длина текста, знаков:793802
Слов в произведении (СВП):122689
Приблизительно страниц:418
Средняя длина слова, знаков:5.14
Средняя длина предложения (СДП), знаков:73.18
СДП авторского текста, знаков:82.95
СДП диалога, знаков:48.92
Доля диалогов в тексте:19.26%
Доля авторского текста в диалогах:6.29%

Активный словарный запас

Использовано уникальных слов:10900
Активный словарный запас (АСЗ):9973
Активный несловарный запас (АНСЗ):927
Удельный АСЗ на 3000 слов текста:1154.60
Удельный АСЗ на 10000 слов текста:2659.48 —> 7191-е место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста:9800.55

Части речи

Неопределённых частей речи (НОЧР), слов:29132 (23.74% от СВП)
Определённых частей речи (ОЧР), слов:93557 (76.26% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное23037 (24.62%)
          Прилагательное8051 (8.61%)
          Глагол21810 (23.31%)
          Местоимение-существительное7398 (7.91%)
          Местоименное прилагательное4204 (4.49%)
          Местоимение-предикатив14 (0.01%)
          Числительное (количественное)152 (0.16%)
          Числительное (порядковое)83 (0.09%)
          Наречие3102 (3.32%)
          Предикатив101 (0.11%)
          Предлог9227 (9.86%)
          Союз5312 (5.68%)
          Междометие61 (0.07%)
          Вводное слово10 (0.01%)
          Частица3114 (3.33%)
          Причастие1898 (2.03%)
          Деепричастие58 (0.06%)
Служебных слов:29340 (31.36%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая128.19
          .    точка70.06
          -    тире11.71
          !    восклицательный знак3.90
          ?    вопросительный знак6.63
          ...    многоточие6.24
          !..    воскл. знак с многоточием0.56
          ?..    вопр. знак с многоточием0.07
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.04
          "    кавычка1.37
          ()    скобки0.11
          :    двоеточие5.05
          ;    точка с запятой0.17




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Наталья Образцова
 60
2. Елизавета Дворецкая
 40
3. Елена Хаецкая
 40
4. Далия Трускиновская
 39
5. Кир Булычев
 38  – ожидает пересчёта
6. Мария Семёнова
 38  – ожидает пересчёта
7. Галина Романова
 38
8. Мария Галина
 38
9. Марина и Сергей Дяченко
 38
10. Дмитрий Емец
 38
...смотреть весь список >>
⇑ Наверх