FantLab ru



  Лингвистический анализ произведения
Произведение: Переселение душ
Автор: Глеб Голубев
Дата проведения анализа: 13 сентября 2019 года

Общая статистика

Длина текста, знаков:88893
Слов в произведении (СВП):12547
Приблизительно страниц:45
Средняя длина слова, знаков:5.5
Средняя длина предложения (СДП), знаков:67.89
СДП авторского текста, знаков:88.3
СДП диалога, знаков:54.72
Доля диалогов в тексте:49.14%
Доля авторского текста в диалогах:7.88%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 9513 (в страницах — примерно 5; начинается где-то на 7-й)

Активный словарный запас

Использовано уникальных слов:3151
Активный словарный запас (АСЗ):3018
Активный несловарный запас (АНСЗ):133
Удельный АСЗ на 3000 слов текста:1177.70
Удельный АСЗ на 10000 слов текста:2674.08 —> 6971-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1337) приходится приблизительно на 3-ю страницу текста.
Миниимальное значение УАСЗ-3000 (1088) приходится приблизительно на 17-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:2710 (21.60% от СВП)
Определённых частей речи (ОЧР), слов:9837 (78.40% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное2805 (28.51%)
          Прилагательное980 (9.96%)
          Глагол1943 (19.75%)
          Местоимение-существительное897 (9.12%)
          Местоименное прилагательное529 (5.38%)
          Местоимение-предикатив1 (0.01%)
          Числительное (количественное)62 (0.63%)
          Числительное (порядковое)26 (0.26%)
          Наречие334 (3.40%)
          Предикатив15 (0.15%)
          Предлог942 (9.58%)
          Союз459 (4.67%)
          Междометие3 (0.03%)
          Вводное слово2 (0.02%)
          Частица276 (2.81%)
          Причастие159 (1.62%)
          Деепричастие5 (0.05%)
Служебных слов:3109 (31.61%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное5622481013.00.92.617.5.003631.00.156.37.8.15
Прилагательное8312162.9.92.00.00.00.92.002.64.4.00.00.152.3.00
Глагол4622202113.15.92.467.5.154511.00.0042.5.00
Местоимение-существительное8.36.1485.73.1.00.61.006.7.157.82.3.00.008.61.00
Местоименное прилагательное35136.63.1.15.00.15.001.7.31.31.00.00.00.61.15.00
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)3.2.92.46.00.00.001.51.1.15.00.00.00.00.00.00.00.00
Числительное (порядковое)2.5.00.31.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Наречие1.85.5124.61.1.00.00.31.61.155.21.2.00.002.3.61.00
Предикатив.00.151.7.00.00.00.00.00.15.00.00.00.00.00.00.00.00
Предлог7117.461023.001.1.92.15.00.00.00.00.00.00.77.00
Союз147.7173.83.4.00.15.002.6.003.1.31.00.002.81.4.15
Междометие.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Вводное слово.00.00.15.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица1.5.7726.77.31.00.00.001.5.00.92.15.00.00.15.61.00
Причастие6.61.8.92.77.31.00.00.001.2.005.8.61.00.00.00.15.00
Деепричастие.15.00.00.15.00.00.00.00.00.00.15.00.00.00.00.00.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное1621223028293532333632413032414434363536
Прилагательное6.47.69.88.310139111310119.41413128.612141713
Глагол212728262520211818181517201614171513219.4
Местоимение-существительное25191296.86.66.76.24.93.884.74.965.85.47.16.21.66
Местоименное прилагательное4.74.94.55.85.37.356.43.66.45.66.36.17.28.53.25.17.685.1
Местоимение-предикатив.00.00.00.00.00.00.00.00.20.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое).60.701.80.70.80.70.00.40.70.30.301.9.90.40.50.00.00.80.00
Числительное (порядковое).30.50.40.10.50.20.20.40.20.00.30.30.00.001.3.00.00.00.00.00
Наречие6.85.13.32.72.94.12.12.83.61.93.22.53.44.7.902.73.23.55.66
Предикатив.10.50.10.40.10.60.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Предлог8.96.89.97.9101010111212141010138.5109.6106.411
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз62.63.53.84.14.15.75.86.46.26.16.65.333.64.3124.246.8
Междометие.40.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Вводное слово.00.10.00.00.00.00.00.20.00.00.00.00.00.00.00.00.00.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица23.24.13.94.43.23.43.83.32.41.6.901.52.13.11.6.002.1.005.1
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие.50.901.42.11.91.11.62.41.62.13.7.601.92.11.31.61.92.8.801.7
Деепричастие.30.00.00.10.00.00.00.00.00.00.00.00.00.00.00.50.60.00.00.00

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая122.02
          .    точка77.47
          -    тире27.97
          !    восклицательный знак7.41
          ?    вопросительный знак10.76
          ...    многоточие5.18
          !..    воскл. знак с многоточием0.00
          ?..    вопр. знак с многоточием0.24
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.48
          "    кавычка11.88
          ()    скобки0.24
          :    двоеточие5.34
          ;    точка с запятой0.00




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Глеб Голубев
 37
2. Сергей Сухинов
 34
3. Андрей Столяров
 34
4. Сергей Абрамов
 34
5. Александр Житинский
 34
6. Аркадий и Борис Стругацкие
 33
7. Геннадий Прашкевич
 33
8. Геннадий Гор
 33
9. Сергей Синякин
 33
10. [Для текстов по лингвоанализу]
 33
...смотреть весь список >>
⇑ Наверх