fantlab ru



  Лингвистический анализ произведения
Произведение: Осенний лис
Автор: Дмитрий Скирюк
Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:1018883
Слов в произведении (СВП):152574
Приблизительно страниц:510
Средняя длина слова, знаков:5.04
Средняя длина предложения (СДП), знаков:43.12
СДП авторского текста, знаков:60.25
СДП диалога, знаков:30.75
Доля диалогов в тексте:41.64%
Доля авторского текста в диалогах:7.55%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: знаков, шаг: 1000 знаков)

Активный словарный запас

Использовано уникальных слов:13271
Активный словарный запас (АСЗ):12103
Активный несловарный запас (АНСЗ):1168
Удельный АСЗ на 3000 слов текста:1249.16
Удельный АСЗ на 10000 слов текста:2852.17 —> 5565-е место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста:10570.40
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (0) приходится приблизительно на 0-ю страницу текста.
Миниимальное значение УАСЗ-3000 (10000000) приходится приблизительно на 0-ю страницу текста.

Части речи

Неопределённых частей речи (НОЧР), слов:32871 (21.54% от СВП)
Определённых частей речи (ОЧР), слов:119703 (78.46% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное36269 (30.30%)
          Прилагательное11076 (9.25%)
          Глагол33283 (27.80%)
          Местоимение-существительное10691 (8.93%)
          Местоименное прилагательное4815 (4.02%)
          Местоимение-предикатив33 (0.03%)
          Числительное (количественное)1668 (1.39%)
          Числительное (порядковое)269 (0.22%)
          Наречие7382 (6.17%)
          Предикатив1280 (1.07%)
          Предлог13447 (11.23%)
          Союз12898 (10.78%)
          Междометие1906 (1.59%)
          Вводное слово413 (0.35%)
          Частица8779 (7.33%)
          Причастие1810 (1.51%)
          Деепричастие597 (0.50%)
Служебных слов:53579 (44.76%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное3417637.56.7.022.1.249.71.224294.1.47113.6.98
Прилагательное408.6131.3.80.00.28.031.6.533.55.5.73.052.11.4.36
Глагол521825147.9.142.4.39131.641203.1.48123.41.2
Местоимение-существительное7.84.3276.32.5.03.95.116.8955.53.489.1.30.20
Местоименное прилагательное1437.41.2.85.00.42.071.5.352.21.9.23.062.2.24.09
Местоимение-предикатив.02.00.09.00.01.00.01.00.00.00.01.03.00.00.01.00.00
Числительное (колич-ое)4.81.11.9.59.30.01.27.03.28.13.82.96.03.01.59.14.02
Числительное (порядковое).90.07.39.07.02.00.02.04.03.02.09.16.02.00.06.02.00
Наречие4.84.1194.41.1.01.40.072.9.504.63.6.57.163.7.57.28
Предикатив.78.342.3.71.16.00.11.01.42.15.40.89.20.02.80.08.01
Предлог67113.19.78.4.011.8.43.59.39.211.4.07.01.482.1.11
Союз157.1279.52.9.051.2.248.31.16.97.8.67.348.2.78.44
Междометие4.8.8013.76.00.18.02.66.13.541.1.10.02.50.16.02
Вводное слово.36.13.56.41.07.00.03.00.22.02.16.38.03.01.45.01.02
Частица8.43.3275.11.6.001.1.083.4.783.95.6.42.445.6.48.26
Причастие7.61.2.70.21.16.00.04.02.34.042.3.49.11.01.15.07.01
Деепричастие.92.26.85.25.08.00.02.01.19.031.1.34.04.00.35.06.07

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 12345678910
Существительное19192326262627272929
Прилагательное5.75.76.36.87.87.88.698.98.5
Глагол20312524232321212120
Местоимение-существительное14108.26.96.25.554.34.33.8
Местоименное прилагательное2.83.43.43.13.13.43.73.73.43.1
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)1.2.901.11.21.11.21.31.21.21.2
Числительное (порядковое).20.20.20.10.10.10.20.20.20.20
Наречие65.254.74.94.94.85.14.84.7
Предикатив1.5.9011.60.80.70.40.50.80
Предлог6.76.69.89.49.79.810101011
Союз116.97.98.28.39.19.48.98.79.2
Междометие2.6.801.211.11.3.901.51.11.3
Вводное слово.40.40.30.20.20.30.20.20.30.10
Частица7.87.26.65.95.45.15.24.85.35.3
Причастие.70.60.901.11.41.41.31.61.32.1
Деепричастие.40.30.50.50.50.40.40.40.50.30

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая124.05
          .    точка110.42
          -    тире45.22
          !    восклицательный знак10.46
          ?    вопросительный знак20.19
          ...    многоточие14.86
          !..    воскл. знак с многоточием0.17
          ?..    вопр. знак с многоточием0.13
          !!!    тройной воскл. знак0.20
          ?!    вопр. знак с восклицанием0.96
          "    кавычка5.91
          ()    скобки0.41
          :    двоеточие5.33
          ;    точка с запятой0.29




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Дмитрий Скирюк
 52
2. Олег Верещагин
 39
3. Анна Гурова
 39
4. Сергей Волков
 38
5. Владислав Русанов
 38
6. Марина и Сергей Дяченко
 37
7. Михаил Кликин
 37
8. Иван Сербин
 37
9. Надежда Федотова
 37
10. Ольга Громыко
 37
...смотреть весь список >>
⇑ Наверх