fantlab ru



  Лингвистический анализ произведения
Произведение: Люди с солнечными поводьями
Автор: Ариадна Борисова
Дата проведения анализа: 19 сентября 2022 года

Общая статистика

Длина текста, знаков:675695
Слов в произведении (СВП):97975
Приблизительно страниц:357
Средняя длина слова, знаков:5.5
Средняя длина предложения (СДП), знаков:64.07
СДП авторского текста, знаков:70.93
СДП диалога, знаков:48.74
Доля диалогов в тексте:23.55%
Доля авторского текста в диалогах:7.1%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: знаков, шаг: 1000 знаков)

Активный словарный запас

Использовано уникальных слов:13605
Активный словарный запас (АСЗ):12169
Активный несловарный запас (АНСЗ):1436
Удельный АСЗ на 3000 слов текста:1502.63
Удельный АСЗ на 10000 слов текста:3594.48 отсутствует в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (0) приходится приблизительно на 0-ю страницу текста.
Миниимальное значение УАСЗ-3000 (10000000) приходится приблизительно на 0-ю страницу текста.

Части речи

Неопределённых частей речи (НОЧР), слов:18637 (19.02% от СВП)
Определённых частей речи (ОЧР), слов:79338 (80.98% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное27145 (34.21%)
          Прилагательное10953 (13.81%)
          Глагол17535 (22.10%)
          Местоимение-существительное4159 (5.24%)
          Местоименное прилагательное2995 (3.77%)
          Местоимение-предикатив20 (0.03%)
          Числительное (количественное)814 (1.03%)
          Числительное (порядковое)179 (0.23%)
          Наречие3786 (4.77%)
          Предикатив579 (0.73%)
          Предлог9854 (12.42%)
          Союз6375 (8.04%)
          Междометие1292 (1.63%)
          Вводное слово213 (0.27%)
          Частица5079 (6.40%)
          Причастие2327 (2.93%)
          Деепричастие279 (0.35%)
Служебных слов:30266 (38.15%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное5229565.16.8.051.6.329.71.134263.9.33149.6.67
Прилагательное7411151.1.89.00.21.091.6.415.26.5.59.102.92.5.41
Глагол4222228.47.3.071.8.429.31.239133.7.329.74.1.38
Местоимение-существительное6.75.6151.91.4.00.37.052.6.273.72.7.38.125.5.64.09
Местоименное прилагательное145.74.81.3.72.00.32.061.411.71.7.17.072.2.58.02
Местоимение-предикатив.00.00.15.02.00.00.00.00.02.00.01.02.00.00.00.00.00
Числительное (колич-ое)3.81.41.2.25.31.01.05.00.07.05.81.56.04.00.54.17.01
Числительное (порядковое)1.1.21.24.00.06.00.00.00.07.01.15.07.02.00.05.05.00
Наречие4.54152.5.94.00.26.051.8.484.32.7.27.123.61.1.17
Предикатив.76.481.7.35.26.01.07.00.19.09.40.51.12.04.67.10.02
Предлог65223.38.38.7.011.8.57.99.36.21.94.02.00.484.1.14
Союз1711175.12.8.02.72.125.665.23.4.59.225.51.4.21
Междометие51.812.1.98.01.16.02.58.07.471.2.02.06.92.30.01
Вводное слово.32.20.63.12.10.01.01.00.16.04.14.22.04.01.35.02.00
Частица7.74.8262.91.2.00.95.022.3.413.64.1.52.174.91.3.26
Причастие132.51.3.37.40.00.10.041.056.4.50.28.00.28.25.06
Деепричастие.62.26.61.09.11.00.01.01.11.00.92.12.05.00.17.06.01

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 12345678910
Существительное18232628303032323233
Прилагательное9.19.21011111213131413
Глагол19252522191816151616
Местоимение-существительное8.665.14.33.643.43.23.52.8
Местоименное прилагательное2.53.83.52.93.13.13.13.13.83
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)1.1.90.70.80.80.901.90.90.80
Числительное (порядковое).20.40.10.10.20.20.10.30.20.20
Наречие75443.83.63.53.63.33.4
Предикатив1.2.60.80.50.50.70.60.50.30.50
Предлог9.18.79.611121112121011
Союз9.26.35.56.26.66.16.37.66.96.9
Междометие4.1.80.901.21.31.41.31.111
Вводное слово.80.40.20.20.20.10.10.10.10.10
Частица7.47.765.554.954.44.44.9
Причастие1.41.52.12.12.6333.22.93
Деепричастие.70.40.30.20.20.20.30.20.20.30

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая108.30
          .    точка84.02
          -    тире18.96
          !    восклицательный знак9.12
          ?    вопросительный знак6.07
          ...    многоточие7.81
          !..    воскл. знак с многоточием0.35
          ?..    вопр. знак с многоточием0.17
          !!!    тройной воскл. знак0.05
          ?!    вопр. знак с восклицанием0.66
          "    кавычка3.93
          ()    скобки0.33
          :    двоеточие6.23
          ;    точка с запятой0.08




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Ариадна Борисова
 56
2. Генри Лайон Олди
 39
3. Владислав Русанов
 39
4. Лев Вершинин
 38
5. Александр и Людмила Белаш
 38
6. Сергей Волков
 38
7. Диана Удовиченко
 37
8. Юлия Фирсанова
 37
9. Мария Семёнова
 37
10. Ольга Елисеева
 37
...смотреть весь список >>
⇑ Наверх