fantlab ru



  Лингвистический анализ произведения
Произведение: Паутина
Автор: Сергей Федотов
Дата проведения анализа: 17 сентября 2022 года

Общая статистика

Длина текста, знаков:662518
Слов в произведении (СВП):99169
Приблизительно страниц:340
Средняя длина слова, знаков:5.17
Средняя длина предложения (СДП), знаков:59.86
СДП авторского текста, знаков:72.26
СДП диалога, знаков:44.76
Доля диалогов в тексте:33.8%
Доля авторского текста в диалогах:8.29%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: знаков, шаг: 1000 знаков)

Активный словарный запас

Использовано уникальных слов:13423
Активный словарный запас (АСЗ):11572
Активный несловарный запас (АНСЗ):1851
Удельный АСЗ на 3000 слов текста:1281.53
Удельный АСЗ на 10000 слов текста:3119.09 —> 2228-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (0) приходится приблизительно на 0-ю страницу текста.
Миниимальное значение УАСЗ-3000 (10000000) приходится приблизительно на 0-ю страницу текста.

Части речи

Неопределённых частей речи (НОЧР), слов:21951 (22.13% от СВП)
Определённых частей речи (ОЧР), слов:77218 (77.87% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное26048 (33.73%)
          Прилагательное7710 (9.98%)
          Глагол18351 (23.77%)
          Местоимение-существительное5768 (7.47%)
          Местоименное прилагательное3513 (4.55%)
          Местоимение-предикатив29 (0.04%)
          Числительное (количественное)970 (1.26%)
          Числительное (порядковое)310 (0.40%)
          Наречие3994 (5.17%)
          Предикатив649 (0.84%)
          Предлог9945 (12.88%)
          Союз8900 (11.53%)
          Междометие1524 (1.97%)
          Вводное слово223 (0.29%)
          Частица6296 (8.15%)
          Причастие1024 (1.33%)
          Деепричастие251 (0.33%)
Служебных слов:36449 (47.20%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное4818597.97.2.011.6.758.91.133335.4.40164.4.72
Прилагательное474.8121.51.1.00.29.051.5.213.74.9.73.072.7.68.39
Глагол4315219.87.171.9.528.9134192.9.32112.2.36
Местоимение-существительное114.3164.42.9.02.76.074.2.577.84.2.55.357.9.21.16
Местоименное прилагательное174.76.21.7.79.00.38.111.2.422.11.8.22.073.1.25.05
Местоимение-предикатив.01.00.11.01.00.00.01.00.02.00.01.04.01.00.00.00.02
Числительное (колич-ое)4.911.18.19.00.34.15.17.07.96.89.07.04.39.07.01
Числительное (порядковое)1.8.16.44.02.07.00.00.02.02.01.13.23.00.00.10.10.00
Наречие63.7123.31.2.00.40.062.2.504.74.5.58.164.4.44.12
Предикатив.81.331.8.65.24.00.11.01.18.08.42.92.10.04.62.04.01
Предлог68172.49.79.8.012.3.98.89.15.191.2.00.06.581.4.15
Союз217.9258.24.2.081.427.1.869.54.81.2.349.7.68.18
Междометие5.41.21.34.21.2.01.10.11.70.06.811.1.06.02.89.06.01
Вводное слово.44.11.63.21.10.00.02.00.13.02.15.34.00.00.21.02.00
Частица9.94.5295.21.8.001.1.043.625.25.6.57.285.8.75.22
Причастие4.51.1.59.33.16.00.05.01.33.023.1.59.12.01.30.04.04
Деепричастие.44.15.32.12.16.00.01.00.02.04.57.50.02.00.32.04.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 12345678910
Существительное16222527302929302930
Прилагательное6.15.77.18.48.18.889.28.68.7
Глагол18222121202020181919
Местоимение-существительное8.8118.76.74.94.84.644.14.1
Местоименное прилагательное2.94.44.43.83.43.43.93.83.33.6
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.10
Числительное (колич-ое).90111.11.11.11.901.11.1
Числительное (порядковое).30.70.30.20.20.30.40.20.30.10
Наречие6.15.44.13.93.943.44.143
Предикатив1.5.80.70.70.50.60.40.70.60.60
Предлог8.47.91111111011111111
Союз177.77.67.68.48.7998.99.1
Междометие4.11.31.11.31.41.41.51.41.41.4
Вводное слово.40.30.30.20.20.30.20.20.20.10
Частица7.98.87.25.85.95.75.95.76.66.5
Причастие.50.60.901111.11.41.21.2
Деепричастие.30.30.30.30.20.30.20.20.20.30

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая115.29
          .    точка83.35
          -    тире32.88
          !    восклицательный знак8.42
          ?    вопросительный знак13.81
          ...    многоточие5.10
          !..    воскл. знак с многоточием0.20
          ?..    вопр. знак с многоточием0.18
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.02
          "    кавычка8.56
          ()    скобки1.54
          :    двоеточие6.99
          ;    точка с запятой0.33




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


Внимание! У Сергея Федотова пока не сформирован лингвистический паспорт, а значит этого автора в списке результатов не будет в любом случае. Проверка авторства для данного произведения не может претендовать на верный результат.

АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Борис Акунин
 40
2. Михаил Успенский
 40
3. Александр Зорич
 40
4. Сергей Волков
 39
5. Александр и Людмила Белаш
 39
6. Александр Бушков
 39
7. Юрий Гаврюченков
 39
8. Андрей Ерпылев
 39
9. Виталий Сертаков
 39
10. Владислав Русанов
 39
...смотреть весь список >>
⇑ Наверх