Лингвистический анализ: Юлия Фирсанова «Загадка Либастьяна, или Поиски богов»

Лингвистический анализ произведения

Произведение: Загадка Либастьяна, или Поиски богов

Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:	859559
Слов в произведении (СВП):	107835
Приблизительно страниц:	404
Средняя длина слова, знаков:	5.66
Средняя длина предложения (СДП), знаков:	97.3
СДП авторского текста, знаков:	118.53
СДП диалога, знаков:	83.88
Доля диалогов в тексте:	52.87%
Доля авторского текста в диалогах:	24.14%

Активный словарный запас
Использовано уникальных слов:	13230
Активный словарный запас (АСЗ):	12259
Активный несловарный запас (АНСЗ):	971
Удельный АСЗ на 3000 слов текста:	1377.70
Удельный АСЗ на 10000 слов текста:	3276.06	—> 1144-е место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста:	12772.30

Части речи
Неопределённых частей речи (НОЧР), слов:	22033 (20.43% от СВП)
Определённых частей речи (ОЧР), слов:	85802 (79.57% от СВП)
Из них (принимая ОЧР за 100%):
Существительное	29818 (34.75%)
Прилагательное	11321 (13.19%)
Глагол	17797 (20.74%)
Местоимение-существительное	5298 (6.17%)
Местоименное прилагательное	4355 (5.08%)
Местоимение-предикатив	8 (0.01%)
Числительное (количественное)	937 (1.09%)
Числительное (порядковое)	155 (0.18%)
Наречие	4487 (5.23%)
Предикатив	728 (0.85%)
Предлог	10267 (11.97%)
Союз	8336 (9.72%)
Междометие	1596 (1.86%)
Вводное слово	256 (0.30%)
Частица	5808 (6.77%)
Причастие	2408 (2.81%)
Деепричастие	265 (0.31%)
Служебных слов:	36189 (42.18%)

Знаки препинания
Частоты знаков препинания (среднее количество на 1000 слов):
, запятая	157.37
. точка	61.14
- тире	29.75
! восклицательный знак	6.03
? вопросительный знак	9.09
... многоточие	1.52
!.. воскл. знак с многоточием	0.06
?.. вопр. знак с многоточием	0.02
!!! тройной воскл. знак	0.08
?! вопр. знак с восклицанием	0.08
" кавычка	6.69
() скобки	0.93
: двоеточие	5.15
; точка с запятой	0.10

Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Общая статистика

Активный словарный запас

Части речи

Знаки препинания

Распознавание автора текста