Лингвистический анализ: Роман Злотников «Виват император!»

Лингвистический анализ произведения

Произведение: Виват император!

Дата проведения анализа: 19 сентября 2022 года

Общая статистика

Длина текста, знаков:	615509
Слов в произведении (СВП):	88935
Приблизительно страниц:	329
Средняя длина слова, знаков:	5.58
Средняя длина предложения (СДП), знаков:	84.59
СДП авторского текста, знаков:	102.64
СДП диалога, знаков:	65.88
Доля диалогов в тексте:	38.31%
Доля авторского текста в диалогах:	2.9%

Активный словарный запас
Использовано уникальных слов:	11494
Активный словарный запас (АСЗ):	10763
Активный несловарный запас (АНСЗ):	731
Удельный АСЗ на 3000 слов текста:	1247.64
Удельный АСЗ на 10000 слов текста:	2970.32	—> 3967-е место в рейтинге УАСЗ-10000

Части речи
Неопределённых частей речи (НОЧР), слов:	21568 (24.25% от СВП)
Определённых частей речи (ОЧР), слов:	67367 (75.75% от СВП)
Из них (принимая ОЧР за 100%):
Существительное	22006 (32.67%)
Прилагательное	8846 (13.13%)
Глагол	14262 (21.17%)
Местоимение-существительное	5865 (8.71%)
Местоименное прилагательное	4849 (7.20%)
Местоимение-предикатив	10 (0.01%)
Числительное (количественное)	1374 (2.04%)
Числительное (порядковое)	262 (0.39%)
Наречие	4467 (6.63%)
Предикатив	603 (0.90%)
Предлог	8632 (12.81%)
Союз	7232 (10.74%)
Междометие	1404 (2.08%)
Вводное слово	240 (0.36%)
Частица	5098 (7.57%)
Причастие	1585 (2.35%)
Деепричастие	302 (0.45%)
Служебных слов:	33632 (49.92%)

Знаки препинания
Частоты знаков препинания (среднее количество на 1000 слов):
, запятая	117.46
. точка	59.67
- тире	12.68
! восклицательный знак	1.56
? вопросительный знак	7.17
... многоточие	6.88
!.. воскл. знак с многоточием	0.06
?.. вопр. знак с многоточием	0.15
!!! тройной воскл. знак	0.01
?! вопр. знак с восклицанием	0.18
" кавычка	11.63
() скобки	1.64
: двоеточие	11.27
; точка с запятой	0.04

Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».

Автор

Совпадение с лингвопрофилем автора (в условных единицах)

1. Роман Злотников

2. Александр Авраменко

5. Мария Симонова