FantLab ru



  Лингвистический анализ произведения
Произведение: Прогулка Лимы
Автор: Роман Куликов
Дата проведения анализа: 23 июля 2018 года

Общая статистика

Длина текста, знаков:548869
Слов в произведении (СВП):80710
Приблизительно страниц:283
Средняя длина слова, знаков:5.3
Средняя длина предложения (СДП), знаков:59.71
СДП авторского текста, знаков:78.78
СДП диалога, знаков:38.85
Доля диалогов в тексте:31.21%
Доля авторского текста в диалогах:9.39%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)

Активный словарный запас

Использовано уникальных слов:8262
Активный словарный запас (АСЗ):7906
Активный несловарный запас (АНСЗ):356
Удельный АСЗ на 3000 слов текста:1149.50
Удельный АСЗ на 10000 слов текста:2601.42 —> 7264-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1371) приходится приблизительно на 41-ю страницу текста.
Миниимальное значение УАСЗ-3000 (989) приходится приблизительно на 160-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:16148 (20.01% от СВП)
Определённых частей речи (ОЧР), слов:64562 (79.99% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное18223 (28.23%)
          Прилагательное4329 (6.71%)
          Глагол16395 (25.39%)
          Местоимение-существительное5816 (9.01%)
          Местоименное прилагательное2145 (3.32%)
          Местоимение-предикатив7 (0.01%)
          Числительное (количественное)275 (0.43%)
          Числительное (порядковое)107 (0.17%)
          Наречие2164 (3.35%)
          Предикатив105 (0.16%)
          Предлог6691 (10.36%)
          Союз3210 (4.97%)
          Междометие46 (0.07%)
          Вводное слово6 (0.01%)
          Частица1832 (2.84%)
          Причастие1426 (2.21%)
          Деепричастие92 (0.14%)
Служебных слов:19753 (30.60%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное441493106.6.00.72.238.5.323132.00.056.67.9.59
Прилагательное494.4141.4.68.00.09.00.68.003.12.9.00.00.591.4.07
Глагол661931188.7.051.4511.326214.00.004.27.41
Местоимение-существительное9.85.1493.12.02.14.114.7.236.53.00.028.4.54.07
Местоименное прилагательное213.86.42.9.61.00.07.09.32.05.77.45.02.00.81.34.00
Местоимение-предикатив.02.00.07.00.00.00.00.00.00.00.02.00.00.00.00.00.00
Числительное (колич-ое)2.8.25.65.29.16.00.11.00.00.00.20.05.00.00.02.14.00
Числительное (порядковое)1.2.05.34.00.00.00.02.00.00.00.02.09.00.00.05.11.00
Наречие3.23.1143.7.59.00.09.00.97.233.21.7.00.001.6.95.00
Предикатив.05.051.2.07.05.00.00.00.02.02.00.11.00.00.02.00.00
Предлог7614.811813.001.1.61.07.00.00.00.00.00.005.00
Союз94.6294.41.7.00.09.073.2.162.7.36.00.002.71.5.23
Междометие.07.09.07.18.02.00.00.00.02.00.00.02.00.00.00.00.00
Вводное слово.00.02.00.02.00.00.00.00.02.00.02.00.00.00.00.00.00
Частица.93.9327.86.34.00.00.00.95.00.63.05.00.00.50.52.09
Причастие122.21.61.2.41.00.02.02.95.006.2.72.00.00.09.50.00
Деепричастие.70.14.11.11.05.00.02.02.05.00.45.05.00.02.00.02.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное3220252830303029313131293231293435313133
Прилагательное5.25.35.46.17.575.87.57.48.38.27.98.76.48.48.89.297.68.5
Глагол1842322825262625242224222224212120242122
Местоимение-существительное21129.59.58.37.16.67.26.48.16.66.76.77.16.16.66.96.45.95.6
Местоименное прилагательное2.83.1333.34.13.83.63.23.544.53.83.24.53.12.92.34.14.4
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое).60.40.30.50.40.30.50.70.40.40.30.40.50.40.40.40.50.60.90.30
Числительное (порядковое).30.10.20.20.20.00.20.10.10.10.10.20.10.10.00.20.20.10.30.00
Наречие5.14.33.42.82.93.5333.42.63.233.12.54.43.43.133.12.4
Предикатив.20.20.10.30.10.10.10.20.10.20.30.10.30.30.20.20.10.10.10.00
Предлог7.96.1121211111212131211121013141210111113
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз3.12.13.94.75.86.46.46.16.16.66.46.45.86.27.45.75.46.57.44.8
Междометие.70.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Вводное слово.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица23.84.13.32.92.62.82.72.52.52.432.822.62.83.82.32.93.7
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие1.11.31.41.72.22.62.42.62.92.73.23.83.53.331.9244.11.4
Деепричастие.20.10.10.10.20.20.20.20.20.10.30.20.10.10.10.10.20.10.00.30

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая125.01
          .    точка89.16
          -    тире27.37
          !    восклицательный знак7.48
          ?    вопросительный знак9.83
          ...    многоточие3.32
          !..    воскл. знак с многоточием0.01
          ?..    вопр. знак с многоточием0.05
          !!!    тройной воскл. знак0.05
          ?!    вопр. знак с восклицанием0.87
          "    кавычка2.82
          ()    скобки0.17
          :    двоеточие2.64
          ;    точка с запятой0.41




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Роман Куликов
 49
2. Андрей Левицкий
 40
3. Галина Романова
 39
4. Михаил Кликин
 39
5. Виктор Ночкин
 39
6. Марина и Сергей Дяченко
 39
7. Роман Афанасьев
 39
8. Дмитрий Емец
 38
9. Елена Хаецкая
 38
10. Андрей Тепляков
 38
...смотреть весь список >>
⇑ Наверх