FantLab ru



  Лингвистический анализ произведения
Произведение: Ипостась
Автор: Виталий Абоян
Дата проведения анализа: 25 июля 2018 года

Общая статистика

Длина текста, знаков:680643
Слов в произведении (СВП):97812
Приблизительно страниц:358
Средняя длина слова, знаков:5.53
Средняя длина предложения (СДП), знаков:66.81
СДП авторского текста, знаков:73.49
СДП диалога, знаков:44.39
Доля диалогов в тексте:15.27%
Доля авторского текста в диалогах:14.38%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 20464 (в страницах — примерно 11; начинается где-то на 184-й)

Активный словарный запас

Использовано уникальных слов:10245
Активный словарный запас (АСЗ):9689
Активный несловарный запас (АНСЗ):556
Удельный АСЗ на 3000 слов текста:1219.55
Удельный АСЗ на 10000 слов текста:2817.56 —> 5204-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1327) приходится приблизительно на 61-ю страницу текста.
Миниимальное значение УАСЗ-3000 (1100) приходится приблизительно на 281-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:22109 (22.60% от СВП)
Определённых частей речи (ОЧР), слов:75703 (77.40% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное22759 (30.06%)
          Прилагательное7034 (9.29%)
          Глагол15647 (20.67%)
          Местоимение-существительное4392 (5.80%)
          Местоименное прилагательное3585 (4.74%)
          Местоимение-предикатив16 (0.02%)
          Числительное (количественное)361 (0.48%)
          Числительное (порядковое)379 (0.50%)
          Наречие2543 (3.36%)
          Предикатив232 (0.31%)
          Предлог7603 (10.04%)
          Союз2666 (3.52%)
          Междометие18 (0.02%)
          Вводное слово7 (0.01%)
          Частица3187 (4.21%)
          Причастие2001 (2.64%)
          Деепричастие37 (0.05%)
Служебных слов:21474 (28.37%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное6425668.513.00.96111.903817.00.041216.18
Прилагательное749.3151.8.90.02.24.12.90.103.64.1.00.001.22.9.02
Глагол5622251111.1211.29.1.58455.9.00.006.74.4.18
Местоимение-существительное5.64.6311.71.9.00.02.143.3.263.21.4.00.009.1.54.00
Местоименное прилагательное296.37.43.91.8.00.22.26.84.181.4.54.00.001.7.50.00
Местоимение-предикатив.00.00.06.02.00.00.00.00.00.00.00.02.00.00.00.00.00
Числительное (колич-ое)3.36.82.10.02.00.34.00.12.00.28.06.00.00.06.12.00
Числительное (порядковое)1.4.182.1.14.12.00.00.12.10.00.34.16.00.00.36.08.02
Наречие3.34.6112.7.92.02.00.141.4.383.51.00.002.8.82.06
Предикатив.10.043.2.06.00.00.00.00.04.00.06.10.00.00.06.00.00
Предлог7519.947.118.001.11.1.52.00.02.02.00.00.063.9.00
Союз8.46.2122.31.8.00.12.241.8.142.8.20.00.004.41.2.04
Междометие.02.00.04.04.00.00.00.04.00.00.00.02.04.00.00.00.00
Вводное слово.08.04.00.00.02.00.00.00.00.00.00.00.00.00.00.00.00
Частица2.22.338.54.72.00.02.161.5.022.4.14.00.00.241.3.02
Причастие1431.92.58.00.12.021.1.009.3.72.00.00.16.64.00
Деепричастие.28.02.06.00.00.00.00.00.00.00.16.00.00.00.00.00.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное2725262831333332353433353536363934373836
Прилагательное8.38.58.499.29.69.31011111011111112101112129.1
Глагол1128292724212222202020181818181619181620
Местоимение-существительное168.56.95.75.55.14.74.33.84.444.74.63.53.33.93.53.33.33.7
Местоименное прилагательное4.45.3555.34.85.15.15.34.84.74.83.95.24.95.84.84.93.86.2
Местоимение-предикатив.00.00.00.00.00.10.00.10.00.00.10.00.00.00.00.00.00.00.00.00
Числительное (колич-ое).90.50.50.40.40.60.40.30.30.50.50.40.70.60.40.70.40.90.50.60
Числительное (порядковое)1.4.80.70.30.40.30.40.60.60.40.40.30.50.50.10.30.20.10.40.70
Наречие64.23.83.42.73.433.23.333.43.13.22.72.42.72.922.52.7
Предикатив.60.40.30.30.40.20.20.20.30.40.20.20.20.40.30.10.40.40.50.10
Предлог117.19.21011111111101111121211121112121212
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз8.23.52.83.13.533.43.833.43.63.53.93.93.32.93.91.93.23.1
Междометие.30.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Вводное слово.10.00.00.00.00.00.00.00.00.00.00.00.00.00.10.00.00.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица3.16.65.74.94.24.14.34.34.53.94.53.33.52.73.73.63.64.54.12.8
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие.901.72.32.22.53.12.73.333.643.243.93.44.24.32.33.53.5
Деепричастие.10.00.00.10.00.10.00.00.10.00.00.00.10.00.10.10.00.10.10.00

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая119.26
          .    точка88.22
          -    тире21.33
          !    восклицательный знак2.20
          ?    вопросительный знак8.88
          ...    многоточие3.24
          !..    воскл. знак с многоточием0.01
          ?..    вопр. знак с многоточием0.01
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.46
          "    кавычка14.17
          ()    скобки0.08
          :    двоеточие2.29
          ;    точка с запятой0.08




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Виталий Абоян
 57
2. Владислав Выставной
 42
3. Андрей Столяров
 42
4. [Для текстов по лингвоанализу]
 42
5. Алексей Калугин
 42
6. Александр Зорич
 42
7. Николай Романецкий
 41
8. Дмитрий Янковский
 41
9. Александр Бушков
 41
10. Святослав Логинов
 41
...смотреть весь список >>
⇑ Наверх