FantLab ru



  Лингвистический анализ произведения
Произведение: Сердце Проклятого
Автор: Ян Валетов
Дата проведения анализа: 13 сентября 2019 года

Общая статистика

Длина текста, знаков:904167
Слов в произведении (СВП):134393
Приблизительно страниц:469
Средняя длина слова, знаков:5.26
Средняя длина предложения (СДП), знаков:68.67
СДП авторского текста, знаков:92.62
СДП диалога, знаков:43.56
Доля диалогов в тексте:31.16%
Доля авторского текста в диалогах:8.14%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 29917 (в страницах — примерно 16; начинается где-то на 80-й)

Активный словарный запас

Использовано уникальных слов:13421
Активный словарный запас (АСЗ):12380
Активный несловарный запас (АНСЗ):1041
Удельный АСЗ на 3000 слов текста:1242.81
Удельный АСЗ на 10000 слов текста:2932.46 —> 3777-е место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста:11563.60
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1439) приходится приблизительно на 171-ю страницу текста.
Миниимальное значение УАСЗ-3000 (970) приходится приблизительно на 336-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:28460 (21.18% от СВП)
Определённых частей речи (ОЧР), слов:105933 (78.82% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное31584 (29.82%)
          Прилагательное9058 (8.55%)
          Глагол22226 (20.98%)
          Местоимение-существительное7580 (7.16%)
          Местоименное прилагательное3714 (3.51%)
          Местоимение-предикатив15 (0.01%)
          Числительное (количественное)588 (0.56%)
          Числительное (порядковое)139 (0.13%)
          Наречие2763 (2.61%)
          Предикатив241 (0.23%)
          Предлог11599 (10.95%)
          Союз5263 (4.97%)
          Междометие20 (0.02%)
          Вводное слово14 (0.01%)
          Частица4121 (3.89%)
          Причастие2335 (2.20%)
          Деепричастие60 (0.06%)
Служебных слов:32326 (30.52%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное5922707.49.1.06.77.238.2.824433.03.061011.23
Прилагательное649.2111.4.82.00.14.07.75.034.44.8.00.00.691.7.07
Глагол562025157.5.041.266.4.40498.9.00.007.65.2.18
Местоимение-существительное8.94.4382.61.8.03.33.043.3.285.92.2.00.0310.48.01
Местоименное прилагательное214.95.54.3.62.00.30.06.33.211.1.35.00.001.1.35.01
Местоимение-предикатив.01.00.10.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)3.8.44.77.09.10.00.33.00.03.00.31.13.00.00.04.06.00
Числительное (порядковое).82.04.11.03.01.00.04.01.03.00.09.14.00.00.01.00.00
Наречие2.23.492.2.57.01.04.01.82.133.11.2.00.002.9.82.04
Предикатив.01.032.4.01.00.00.00.00.04.00.06.04.00.00.10.00.00
Предлог85191.61114.001.7.77.17.01.01.04.00.00.043.9.00
Союз146.8164.42.2.00.31.032.8.064.8.57.00.003.61.2.04
Междометие.04.00.00.01.00.00.00.00.00.00.00.01.00.00.00.00.00
Вводное слово.03.03.03.00.00.00.00.00.00.00.01.00.00.00.00.00.00
Частица2.62.5341.2.72.00.10.091.1.002.3.14.00.00.60.69.04
Причастие122.81.3.48.16.00.04.03.68.047.4.52.00.00.23.26.01
Деепричастие.38.04.01.03.01.00.00.00.00.00.14.03.00.00.00.00.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное2423263030333233333234343533353634373637
Прилагательное5.25.97.67.99.28.79.299.71010119.610119.911109.411
Глагол1732292624222121212119192020182017172016
Местоимение-существительное23128.886.26.9655.454.44.454.14.34.143.92.92.8
Местоименное прилагательное3.34.23.63.843.94.13.44.33.23.73.73.83.52.92.93.54.12.63.5
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.10.00
Числительное (колич-ое)1.70.60.50.60.50.60.40.40.50.40.50.40.60.40.201.1.60.40.20
Числительное (порядковое).20.20.10.10.10.10.20.20.10.20.10.10.10.10.20.20.10.10.20.10
Наречие4.23.52.72.22.52.62.52.42.62.72.32.72.32.62.62.72.32.72.42.5
Предикатив.30.40.30.20.30.20.10.20.30.20.30.20.20.30.10.00.10.30.10.00
Предлог9.57.8111112121212121213121212121213111313
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз82.53.63.54.34.95.95.95.75.95.66.35.45.865.56.55.65.96.7
Междометие.20.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Вводное слово.10.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица2.66.45.64.84.23.54.14.13.743.53.63.53.73.53.63.53.83.33.8
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие1.11.51.42.12.22.12.52.42.22.832.42.73.23.13.13.13.13.13
Деепричастие.10.00.10.10.00.00.10.00.10.10.10.10.00.10.00.00.20.20.10.00

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая125.93
          .    точка68.09
          -    тире25.94
          !    восклицательный знак10.09
          ?    вопросительный знак10.40
          ...    многоточие8.11
          !..    воскл. знак с многоточием0.01
          ?..    вопр. знак с многоточием0.04
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.07
          "    кавычка6.66
          ()    скобки0.79
          :    двоеточие1.50
          ;    точка с запятой0.06




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Ян Валетов
 61
2. Александр Мазин
 48
3. Святослав Логинов
 48
4. Елена Хаецкая
 47
5. Сергей Лукьяненко
 46
6. Марина и Сергей Дяченко
 46
7. Сергей Синякин
 46
8. Александр Громов
 45
9. Андрей Валентинов
 45
10. Дмитрий Янковский
 45
...смотреть весь список >>
⇑ Наверх