FantLab ru



  Лингвистический анализ произведения
Произведение: Хроники Проклятого
Автор: Ян Валетов
Дата проведения анализа: 24 июля 2018 года

Общая статистика

Длина текста, знаков:452369
Слов в произведении (СВП):66279
Приблизительно страниц:235
Средняя длина слова, знаков:5.35
Средняя длина предложения (СДП), знаков:76.2
СДП авторского текста, знаков:102.66
СДП диалога, знаков:47.32
Доля диалогов в тексте:29.88%
Доля авторского текста в диалогах:9.27%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 26229 (в страницах — примерно 14; начинается где-то на 72-й)

Активный словарный запас

Использовано уникальных слов:9811
Активный словарный запас (АСЗ):9267
Активный несловарный запас (АНСЗ):544
Удельный АСЗ на 3000 слов текста:1272.19
Удельный АСЗ на 10000 слов текста:3046.55 —> 2567-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1437) приходится приблизительно на 67-ю страницу текста.
Миниимальное значение УАСЗ-3000 (1100) приходится приблизительно на 197-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:14237 (21.48% от СВП)
Определённых частей речи (ОЧР), слов:52042 (78.52% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное16332 (31.38%)
          Прилагательное4744 (9.12%)
          Глагол10025 (19.26%)
          Местоимение-существительное3293 (6.33%)
          Местоименное прилагательное1866 (3.59%)
          Местоимение-предикатив11 (0.02%)
          Числительное (количественное)386 (0.74%)
          Числительное (порядковое)91 (0.17%)
          Наречие1541 (2.96%)
          Предикатив115 (0.22%)
          Предлог5720 (10.99%)
          Союз2582 (4.96%)
          Междометие7 (0.01%)
          Вводное слово16 (0.03%)
          Частица1934 (3.72%)
          Причастие1432 (2.75%)
          Деепричастие45 (0.09%)
Служебных слов:15429 (29.65%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное6923667.510.031.5.408.814432.00.179.515.34
Прилагательное729.491.1.48.00.14.06.94.064.94.4.00.00.572.8.03
Глагол522121126.9.031.317.9.23477.7.00.036.94.1.17
Местоимение-существительное74.5331.91.5.09.23.063.6.205.42.1.00.008.5.96.03
Местоименное прилагательное2255.24.79.00.43.09.48.231.40.00.001.4.31.00
Местоимение-предикатив.00.00.17.00.00.03.00.00.00.00.00.03.00.00.00.00.00
Числительное (колич-ое)4.8.60.88.26.11.00.51.06.06.00.26.26.00.00.11.00.00
Числительное (порядковое)1.1.00.14.03.00.00.00.00.03.00.06.11.00.00.03.00.00
Наречие3.14.18.32.3.43.00.11.06.68.204.11.1.00.002.7.82.17
Предикатив.00.092.7.00.00.00.03.00.00.00.03.03.00.00.06.00.00
Предлог84191.38.613.002.82.28.00.09.03.00.00.004.6.00
Союз147.6144.42.06.40.092.9.095.60.00.0341.5.11
Междометие.00.00.00.00.00.00.00.00.00.00.03.00.00.00.00.00.00
Вводное слово.09.00.11.03.00.00.00.00.00.00.00.03.00.00.03.03.00
Частица2.71.8311.94.00.23.001.2.031.7.11.00.06.74.88.00
Причастие143.51.4.74.48.00.06.061.009.1.57.00.00.26.51.00
Деепричастие.31.09.09.00.06.00.00.00.03.00.37.00.00.00.00.03.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное2425273132343335343436373634383337343737
Прилагательное5.26.488.38.78.5119.39.912109.29.812111212121211
Глагол1629272322212019181918181717181916161716
Местоимение-существительное21107.77.56.96.253.94.44.24.93.73.953.33.64.13.13.83.6
Местоименное прилагательное3.34.34.14.13.13.63.83.73.743.63.63.14.14.33.52.34.14.33.3
Местоимение-предикатив.00.10.00.00.00.00.00.00.10.00.00.00.00.00.00.10.00.00.00.00
Числительное (колич-ое)1.4.90.90.70.80.50.60.80.901.50.50.40.80.50.30.80.60.40.40
Числительное (порядковое).20.20.10.30.10.20.30.30.20.10.10.00.30.10.20.10.20.20.60.00
Наречие5.43.63.533.12.92.732.82.92.72.62.532.12.72.62.83.21.6
Предикатив.20.40.30.30.30.40.10.30.20.10.20.10.10.00.20.20.30.30.10.00
Предлог9.88.6111012111211121212121311121212131115
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз9.72.83.13.94.6555.95.95.15.75.26.26.44.165.45.64.64.7
Междометие.20.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Вводное слово.10.10.00.00.00.10.00.00.00.00.00.00.00.00.00.00.10.10.00.10
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица2.45.65.44.83.63.943.54.43.13.63.93.23.42.73.13.13.92.23.8
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие1.321.82.62.12.82.73.332.53.33.44.43.23.74.83.93.93.43.9
Деепричастие.00.00.10.10.10.10.20.10.10.20.10.20.10.00.20.00.00.00.00.00

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая130.83
          .    точка63.64
          -    тире23.58
          !    восклицательный знак6.62
          ?    вопросительный знак9.54
          ...    многоточие8.86
          !..    воскл. знак с многоточием0.00
          ?..    вопр. знак с многоточием0.00
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.05
          "    кавычка5.54
          ()    скобки0.77
          :    двоеточие1.99
          ;    точка с запятой0.06




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Ян Валетов
 52
2. Александр Зорич
 46
3. Александр Бушков
 46
4. Святослав Логинов
 45
5. Сергей Синякин
 45
6. Дмитрий Силлов
 45
7. [Для текстов по лингвоанализу]
 44
8. Александр Тюрин
 44
9. Андрей Столяров
 43
10. Александр Громов
 43
...смотреть весь список >>
⇑ Наверх