FantLab ru



  Лингвистический анализ произведения
Произведение: Последняя битва
Автор: Роман Злотников
Дата проведения анализа: 23 июля 2018 года

Общая статистика

Длина текста, знаков:591694
Слов в произведении (СВП):89406
Приблизительно страниц:316
Средняя длина слова, знаков:5.34
Средняя длина предложения (СДП), знаков:83.58
СДП авторского текста, знаков:99.26
СДП диалога, знаков:63.78
Доля диалогов в тексте:33.79%
Доля авторского текста в диалогах:1.27%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 16709 (в страницах — примерно 9; начинается где-то на 303-й)

Активный словарный запас

Использовано уникальных слов:10064
Активный словарный запас (АСЗ):9384
Активный несловарный запас (АНСЗ):680
Удельный АСЗ на 3000 слов текста:1199.82
Удельный АСЗ на 10000 слов текста:2781.21 —> 5606-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1348) приходится приблизительно на 0-ю страницу текста.
Миниимальное значение УАСЗ-3000 (1046) приходится приблизительно на 287-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:19919 (22.28% от СВП)
Определённых частей речи (ОЧР), слов:69487 (77.72% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное18812 (27.07%)
          Прилагательное6180 (8.89%)
          Глагол14593 (21.00%)
          Местоимение-существительное4768 (6.86%)
          Местоименное прилагательное3714 (5.34%)
          Местоимение-предикатив9 (0.01%)
          Числительное (количественное)447 (0.64%)
          Числительное (порядковое)95 (0.14%)
          Наречие2342 (3.37%)
          Предикатив114 (0.16%)
          Предлог7190 (10.35%)
          Союз3755 (5.40%)
          Междометие28 (0.04%)
          Вводное слово24 (0.03%)
          Частица1972 (2.84%)
          Причастие1535 (2.21%)
          Деепричастие50 (0.07%)
Служебных слов:21460 (30.88%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное4522638.514.021.1.309.7.413532.07.075.110.28
Прилагательное717.219.96.65.00.50.00.39.0033.6.00.02.522.2.07
Глагол5320241412.091.1.118.4.135312.00.076.74.9.09
Местоимение-существительное7.35.83622.7.00.30.024.7.1562.2.00.006.4.57.04
Местоименное прилагательное349.68.44.51.4.02.46.04.96.151.8.63.00.021.2.83.02
Местоимение-предикатив.00.00.11.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)5.70.70.22.17.00.11.00.11.04.17.00.00.00.04.13.00
Числительное (порядковое)1.1.09.15.02.02.00.02.00.00.00.04.04.00.00.00.00.00
Наречие1.96.1154.65.00.07.02.93.223.91.00.002.85.04
Предикатив.00.281.6.02.00.00.00.00.02.00.04.07.00.00.04.00.00
Предлог70171.11020.002.5.72.46.00.02.02.00.00.093.4.00
Союз107.62342.9.00.48.174.2.134.3.76.02.023.51.00.28
Междометие.04.02.02.20.00.00.00.00.00.00.00.00.00.00.00.00.00
Вводное слово.02.00.09.07.07.00.00.00.02.00.07.04.00.00.00.02.00
Частица1.21.424.89.67.00.07.021.8.021.5.15.00.00.43.54.02
Причастие9.82.62.9.831.1.00.11.04.74.005.8.74.00.00.20.43.00
Деепричастие.37.04.15.04.07.00.00.00.02.00.15.00.00.00.00.00.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное2419252526282931313030313232323133323429
Прилагательное3.97.36.38.48.89.59.99.98.81011101110101211111214
Глагол7.633302826242221202022211820211919182318
Местоимение-существительное18119.48.17.36.36.35.95.96.36.55.85.15.56.15.76.54.74.24.4
Местоименное прилагательное5.16.454.65.56.25.765.96.26.15.75.65.65.45.55.36.45.95.7
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.10.00.00.00.00
Числительное (колич-ое).601.60.70.80.80.80.50.70.60.50.80.80.60.40.50.50.70.40.50
Числительное (порядковое).20.20.10.10.10.20.30.20.10.10.20.10.30.00.10.20.00.10.10.10
Наречие6.15.83.23.43.63.13.63.33.73.33.52.833343.33.51.93.5
Предикатив.10.20.20.20.20.20.10.20.20.10.10.00.20.20.20.10.10.10.20.30
Предлог137.7109.611111111111111121212111211119.913
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз163.3455.355.45.65.95.84.15.86.35.9555.75.54.66.2
Междометие.60.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Вводное слово.30.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица1.92.94.44.13.43.12.42.72.53.32.92.42.83.62.32.62.23.62.62.6
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие1.31.91.21.91.92.42.62.73.22.522.52.82.13.42.22.33.82.13.6
Деепричастие.10.00.10.10.00.20.10.10.10.00.00.00.00.00.10.10.10.10.10.00

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая120.69
          .    точка57.60
          -    тире9.57
          !    восклицательный знак2.55
          ?    вопросительный знак5.44
          ...    многоточие8.98
          !..    воскл. знак с многоточием0.00
          ?..    вопр. знак с многоточием0.03
          !!!    тройной воскл. знак0.07
          ?!    вопр. знак с восклицанием0.28
          "    кавычка4.28
          ()    скобки1.89
          :    двоеточие8.31
          ;    точка с запятой0.03




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Роман Злотников
 52
2. Елена Хаецкая
 45
3. Ольга Ларионова
 42
4. [Для текстов по лингвоанализу]
 42
5. Александр Мазин
 42
6. Сергей Сухинов
 42
7. Андрей Смирнов
 42
8. Алексей Калугин
 42
9. Александр Грин
 41
10. Александр Зорич
 41
...смотреть весь список >>
⇑ Наверх