FantLab ru



  Лингвистический анализ произведения
Произведение: Гнев терпеливого человека
Автор: Сергей Анисимов
Дата проведения анализа: 25 июля 2018 года

Общая статистика

Длина текста, знаков:1026312
Слов в произведении (СВП):150095
Приблизительно страниц:543
Средняя длина слова, знаков:5.46
Средняя длина предложения (СДП), знаков:66.73
СДП авторского текста, знаков:84.73
СДП диалога, знаков:34.44
Доля диалогов в тексте:18.61%
Доля авторского текста в диалогах:5.12%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 36673 (в страницах — примерно 19; начинается где-то на 51-й)

Активный словарный запас

Использовано уникальных слов:14361
Активный словарный запас (АСЗ):12903
Активный несловарный запас (АНСЗ):1458
Удельный АСЗ на 3000 слов текста:1219.28
Удельный АСЗ на 10000 слов текста:2839.31 —> 4708-е место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста:11369.70
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1365) приходится приблизительно на 411-ю страницу текста.
Миниимальное значение УАСЗ-3000 (1003) приходится приблизительно на 242-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:36859 (24.56% от СВП)
Определённых частей речи (ОЧР), слов:113236 (75.44% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное34360 (30.34%)
          Прилагательное12182 (10.76%)
          Глагол19475 (17.20%)
          Местоимение-существительное5991 (5.29%)
          Местоименное прилагательное5400 (4.77%)
          Местоимение-предикатив6 (0.01%)
          Числительное (количественное)1086 (0.96%)
          Числительное (порядковое)252 (0.22%)
          Наречие4236 (3.74%)
          Предикатив193 (0.17%)
          Предлог12606 (11.13%)
          Союз6680 (5.90%)
          Междометие98 (0.09%)
          Вводное слово19 (0.02%)
          Частица4172 (3.68%)
          Причастие3047 (2.69%)
          Деепричастие42 (0.04%)
Служебных слов:34972 (30.88%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное7027567.811.002.1.3410.425234.05.118.710.05
Прилагательное8012121.61.2.00.43.031.034.87.1.00.01.852.4.01
Глагол3418198.87.9.011.4.359.2.193310.04.0374.6.08
Местоимение-существительное5.64.1231.62.2.00.43.053.2.154.62.00.006.8.35.00
Местоименное прилагательное248.47.22.71.8.00.35.201.1.162.92.00.001.4.78.00
Местоимение-предикатив.00.00.05.00.00.00.00.00.00.00.01.00.00.00.00.00.00
Числительное (колич-ое)5.611.4.36.28.00.19.07.24.00.70.23.00.01.16.23.00
Числительное (порядковое)1.2.23.13.01.08.00.03.00.04.00.18.13.00.00.00.04.00
Наречие3.45.9112.3.85.01.31.041.6.134.12.1.00.002.41.6.01
Предикатив.01.091.8.03.01.00.00.00.03.00.08.08.00.00.03.00.00
Предлог79211.28.718.012.71.1.58.00.19.16.04.00.154.00
Союз189.4133.53.1.01.66.093.5.196.2.30.01.004.52.2.09
Междометие.15.03.09.13.01.00.00.00.01.00.04.01.01.00.05.00.00
Вводное слово.05.00.01.00.00.00.00.00.00.00.01.01.00.00.00.01.00
Частица2.53.628.581.4.00.07.151.7.012.4.23.00.00.431.6.08
Причастие113.71.51.5.94.00.09.041.1.009.21.00.00.00.26.54.00
Деепричастие.08.03.00.03.03.00.00.00.00.00.19.00.00.00.00.04.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное2426293031323132333333343534343436353636
Прилагательное8.49.89.91010111112121212121212131312131214
Глагол1522232220181717171616151516151514141414
Местоимение-существительное118.76.95.35.24.74.93.84.63.93.943.23.22.94.73.633.52.7
Местоименное прилагательное4.45.94.64.84.84.85.35.24.74.94.64.56.14.944.15.35.65.44.6
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)1.91.11.2.901.901.80.801.90.901.60.80.60.70.60.70.90
Числительное (порядковое).30.30.20.20.20.10.30.20.30.30.30.20.20.20.10.10.10.00.20.10
Наречие6.14.63.93.63.33.73.83.53.443.54.23.13.54.12.83.23.53.42.4
Предикатив.20.20.20.20.20.20.20.10.10.20.20.10.20.20.10.10.20.20.00.00
Предлог1310101111111211121213121112121211121111
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз103.83.855.76.3666.45.86.46.766.56.56.86.86.977.8
Междометие.80.00.00.00.00.10.00.00.00.00.00.00.00.00.00.00.00.10.00.00
Вводное слово.00.00.00.00.00.00.00.10.00.00.00.00.00.00.00.00.00.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица2.75.24.84.23.84.44.14.13.43.53.43.13.43.73.22.92.933.73.2
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие2.422.32.32.72.52.92.83.32.82.93.63.33.53.82.83.13.32.84
Деепричастие.10.00.00.00.10.10.00.00.00.10.00.00.00.10.00.00.00.00.00.00

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая106.65
          .    точка82.10
          -    тире13.88
          !    восклицательный знак2.85
          ?    вопросительный знак8.43
          ...    многоточие7.59
          !..    воскл. знак с многоточием0.06
          ?..    вопр. знак с многоточием0.21
          !!!    тройной воскл. знак0.02
          ?!    вопр. знак с восклицанием0.05
          "    кавычка19.79
          ()    скобки0.15
          :    двоеточие6.59
          ;    точка с запятой0.87




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Сергей Анисимов
 51  – ожидает пересчёта
2. Владимир Контровский
 41  – ожидает пересчёта
3. Михаил Ланцов
 41  – ожидает пересчёта
4. Антон Антонов
 41
5. Сергей Вольнов
 40
6. Фёдор Березин
 40
7. Владимир Савченко
 40  – ожидает пересчёта
8. Олег Таругин
 40
9. Роман Злотников
 40
10. Александр Зорич
 40  – ожидает пересчёта
...смотреть весь список >>
⇑ Наверх