FantLab ru



  Лингвистический анализ произведения
Произведение: 2024-й
Автор: Юрий Никитин
Дата проведения анализа: 19 сентября 2022 года

Общая статистика

Длина текста, знаков:815531
Слов в произведении (СВП):117950
Приблизительно страниц:406
Средняя длина слова, знаков:5.2
Средняя длина предложения (СДП), знаков:64.79
СДП авторского текста, знаков:95.03
СДП диалога, знаков:47.03
Доля диалогов в тексте:45.95%
Доля авторского текста в диалогах:10.21%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: знаков, шаг: 1000 знаков)

Активный словарный запас

Использовано уникальных слов:13388
Активный словарный запас (АСЗ):12098
Активный несловарный запас (АНСЗ):1290
Удельный АСЗ на 3000 слов текста:1235.64
Удельный АСЗ на 10000 слов текста:2982.74 —> 3732-е место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста:12271.50
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (0) приходится приблизительно на 0-ю страницу текста.
Миниимальное значение УАСЗ-3000 (10000000) приходится приблизительно на 0-ю страницу текста.

Части речи

Неопределённых частей речи (НОЧР), слов:30886 (26.19% от СВП)
Определённых частей речи (ОЧР), слов:87064 (73.81% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное27053 (31.07%)
          Прилагательное10350 (11.89%)
          Глагол20290 (23.30%)
          Местоимение-существительное9567 (10.99%)
          Местоименное прилагательное4972 (5.71%)
          Местоимение-предикатив7 (0.01%)
          Числительное (количественное)1292 (1.48%)
          Числительное (порядковое)257 (0.30%)
          Наречие5697 (6.54%)
          Предикатив906 (1.04%)
          Предлог10908 (12.53%)
          Союз11383 (13.07%)
          Междометие2162 (2.48%)
          Вводное слово451 (0.52%)
          Частица8601 (9.88%)
          Причастие1223 (1.40%)
          Деепричастие361 (0.41%)
Служебных слов:48412 (55.61%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное3617449.47.3.011.7.43111.327295.6.91152.7.75
Прилагательное425.9132.41.2.00.43.072.504.29.11.4.123.61.1.20
Глагол341719127.2.062.1.359.1132173.4.32121.6.47
Местоимение-существительное9.38.73153.00.93.086.1.6974.9.66.6311.79.17
Местоименное прилагательное216.45.81.91.1.00.30.171.2.481.92.2.20.102.7.69.02
Местоимение-предикатив.01.00.00.00.00.00.00.00.00.00.00.04.00.00.00.00.00
Числительное (колич-ое)5.1.951.3.28.30.00.55.14.21.02.831.2.12.04.42.13.00
Числительное (порядковое)1.3.10.29.05.02.00.00.02.04.02.08.21.01.00.12.00.00
Наречие5.35.9144.11.5.00.64.053.563.84.3.85.174.7.82.19
Предикатив.68.381.9.65.21.00.05.01.44.08.55.70.19.05.67.02.02
Предлог551439.114.002.5.75.56.12.121.2.09.01.681.6.05
Союз171121114.8.001.2.238.1.89107.51.6.78111.2.50
Междометие5.21.11.35.91.4.00.14.011.1.10.911.9.28.071.2.04.04
Вводное слово.58.35.89.53.20.00.01.00.27.07.28.36.08.00.49.03.01
Частица9.35.6265.82.5.001.2.054.5.856.39.5.77.247.9.84.32
Причастие5.3.92.47.29.17.00.05.00.29.031.6.70.17.06.42.10.03
Деепричастие.50.29.34.40.11.00.04.00.08.01.82.20.07.00.54.02.02

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 12345678910
Существительное15152024262526262727
Прилагательное4.57.49.98.69.19.69.79.69.19.5
Глагол9.7272121191817181716
Местоимение-существительное21128.386.46.66.35.45.55.5
Местоименное прилагательное2.54.44.54.64.84.24.74.53.84.4
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое).70.801.11.31.21.31.311.31.3
Числительное (порядковое).10.20.20.10.20.20.20.30.20.30
Наречие6.365.74.24.94.54.34.84.64.1
Предикатив1.71.90.70.70.80.70.70.70.50
Предлог6.96.2109.69.5109.6101010
Союз168.67.47.88.58.79.59.29.39.9
Междометие4.61.11.21.41.51.51.81.71.82
Вводное слово.80.50.40.20.30.40.30.20.40.20
Частица99.38.376.976.76.576.6
Причастие.20.50.701.111.11.11.31.31.5
Деепричастие.60.30.20.20.20.30.30.30.20.40

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая143.68
          .    точка63.34
          -    тире30.21
          !    восклицательный знак9.43
          ?    вопросительный знак14.10
          ...    многоточие14.08
          !..    воскл. знак с многоточием2.04
          ?..    вопр. знак с многоточием1.09
          !!!    тройной воскл. знак0.01
          ?!    вопр. знак с восклицанием0.00
          "    кавычка5.86
          ()    скобки0.10
          :    двоеточие12.86
          ;    точка с запятой0.07




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Юрий Никитин
 46  – ожидает пересчёта
2. Сергей Лукьяненко
 42  – ожидает пересчёта
3. Олег Дивов
 40  – ожидает пересчёта
4. Александр Рудазов
 40  – ожидает пересчёта
5. Ксения Букша
 40  – ожидает пересчёта
6. Эдуард Николаевич Веркин
 39  – ожидает пересчёта
7. Александр Громов
 39  – ожидает пересчёта
8. Алексей Лукьянов
 39  – ожидает пересчёта
9. Олег Рой
 39  – ожидает пересчёта
10. Евгений Щепетнов
 39  – ожидает пересчёта
...смотреть весь список >>
⇑ Наверх