Лингвистический анализ: Алексей Вязовский «Узники игры»

Лингвистический анализ произведения

Произведение: Узники игры

Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:	504758
Слов в произведении (СВП):	71990
Приблизительно страниц:	263
Средняя длина слова, знаков:	5.51
Средняя длина предложения (СДП), знаков:	64.4
СДП авторского текста, знаков:	74.98
СДП диалога, знаков:	47.48
Доля диалогов в тексте:	28.43%
Доля авторского текста в диалогах:	9.17%

Активный словарный запас
Использовано уникальных слов:	11078
Активный словарный запас (АСЗ):	10077
Активный несловарный запас (АНСЗ):	1001
Удельный АСЗ на 3000 слов текста:	1315.26
Удельный АСЗ на 10000 слов текста:	3136.76	—> 2096-е место в рейтинге УАСЗ-10000

Части речи
Неопределённых частей речи (НОЧР), слов:	14805 (20.57% от СВП)
Определённых частей речи (ОЧР), слов:	57185 (79.43% от СВП)
Из них (принимая ОЧР за 100%):
Существительное	21685 (37.92%)
Прилагательное	7005 (12.25%)
Глагол	11558 (20.21%)
Местоимение-существительное	4231 (7.40%)
Местоименное прилагательное	2794 (4.89%)
Местоимение-предикатив	8 (0.01%)
Числительное (количественное)	937 (1.64%)
Числительное (порядковое)	249 (0.44%)
Наречие	2489 (4.35%)
Предикатив	460 (0.80%)
Предлог	7555 (13.21%)
Союз	5024 (8.79%)
Междометие	887 (1.55%)
Вводное слово	207 (0.36%)
Частица	3243 (5.67%)
Причастие	1299 (2.27%)
Деепричастие	122 (0.21%)
Служебных слов:	24071 (42.09%)

Знаки препинания
Частоты знаков препинания (среднее количество на 1000 слов):
, запятая	108.85
. точка	90.61
- тире	29.03
! восклицательный знак	6.49
? вопросительный знак	7.75
... многоточие	3.92
!.. воскл. знак с многоточием	0.01
?.. вопр. знак с многоточием	0.01
!!! тройной воскл. знак	0.06
?! вопр. знак с восклицанием	1.00
" кавычка	7.08
() скобки	2.58
: двоеточие	2.24
; точка с запятой	0.14

Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».

Автор

Совпадение с лингвопрофилем автора (в условных единицах)

1. Алексей Вязовский

2. Сергей Волков

3. Владислав Жеребьёв

4. Фёдор Вихрев