FantLab ru



  Лингвистический анализ произведения
Произведение: Любовь сильнее меча
Автор: Андрей Легостаев
Дата проведения анализа: 23 июля 2018 года

Общая статистика

Длина текста, знаков:569341
Слов в произведении (СВП):84029
Приблизительно страниц:288
Средняя длина слова, знаков:5.18
Средняя длина предложения (СДП), знаков:60.9
СДП авторского текста, знаков:76.32
СДП диалога, знаков:45.3
Доля диалогов в тексте:37.14%
Доля авторского текста в диалогах:11.37%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 21634 (в страницах — примерно 11; начинается где-то на 3-й)

Активный словарный запас

Использовано уникальных слов:8206
Активный словарный запас (АСЗ):7496
Активный несловарный запас (АНСЗ):710
Удельный АСЗ на 3000 слов текста:1087.95
Удельный АСЗ на 10000 слов текста:2401.37 —> 8940-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1347) приходится приблизительно на 272-ю страницу текста.
Миниимальное значение УАСЗ-3000 (960) приходится приблизительно на 170-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:17598 (20.94% от СВП)
Определённых частей речи (ОЧР), слов:66431 (79.06% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное16443 (24.75%)
          Прилагательное5249 (7.90%)
          Глагол14640 (22.04%)
          Местоимение-существительное6115 (9.21%)
          Местоименное прилагательное2392 (3.60%)
          Местоимение-предикатив11 (0.02%)
          Числительное (количественное)453 (0.68%)
          Числительное (порядковое)101 (0.15%)
          Наречие1989 (2.99%)
          Предикатив98 (0.15%)
          Предлог6975 (10.50%)
          Союз3182 (4.79%)
          Междометие29 (0.04%)
          Вводное слово11 (0.02%)
          Частица2636 (3.97%)
          Причастие1065 (1.60%)
          Деепричастие34 (0.05%)
Служебных слов:21351 (32.14%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное431857127.4.001.366.8.193426.05.058.56.9.27
Прилагательное657171.6.73.00.12.02.56.022.94.3.00.00.631.6.02
Глагол542027219.3.101.4.368.8.46638.1.02.056.54.5.10
Местоимение-существительное9.26.7494.52.9.02.46.105.1.177.43.3.00.0013.90.07
Местоименное прилагательное236.15.82.3.97.02.49.12.58.10.87.49.00.021.5.44.02
Местоимение-предикатив.02.02.12.00.00.00.00.00.02.00.00.00.00.00.00.00.00
Числительное (колич-ое)4.92.90.17.34.00.32.00.07.00.34.15.00.00.15.24.00
Числительное (порядковое)1.3.19.15.10.02.00.02.00.00.00.00.00.00.00.00.02.00
Наречие2.43.8113.6.65.00.05.021.2741.2.02.002.8.70.00
Предикатив.05.321.1.02.02.00.00.00.02.00.05.05.00.00.02.00.00
Предлог76201.51516.001.8.44.34.00.07.00.00.00.053.00
Союз9.17.1235.62.02.44.022.9.173.5.32.00.004.8.85.05
Междометие.00.00.17.17.00.00.00.00.00.00.00.00.00.00.00.00.00
Вводное слово.00.02.02.00.00.00.00.00.00.00.02.00.00.00.00.00.00
Частица1.72.5391.3.51.00.05.021.1.052.3.24.00.02.32.97.10
Причастие7.92.21.82.32.00.07.02.53.005.6.63.02.00.17.19.00
Деепричастие.22.12.05.10.02.00.00.02.02.00.15.02.00.00.00.00.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное1617222628293130293131323133323431333331
Прилагательное56.678.27.98.98.78.6109.79.3109.3101110119.81111
Глагол1835312725232222202222212020181921202018
Местоимение-существительное2914109.28.67.96.67.47.96.77.24.866.76.45.94.17.13.96.7
Местоименное прилагательное3.13.84.13.33.84.34.24.13.53.84.13.84.44.443.55.64.14.25.4
Местоимение-предикатив.00.00.00.10.00.00.10.00.00.10.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)1.3.70.70.70.50.801.90.80.50.60.70.90.40.50.40.701.70.50
Числительное (порядковое).20.20.10.30.10.10.10.10.20.20.10.00.30.00.00.10.30.00.30.00
Наречие5.34.53.42.6332.83.13.22.432.63.12.52.92.92.12.12.82.2
Предикатив.10.10.20.10.20.20.20.30.30.20.00.00.20.10.20.10.10.20.30.00
Предлог8.97.4111212121213121312131312121112101414
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз9.63.53.54.24.85.45.35.25.65.34.85.65.74.25.85.16.16.63.84.7
Междометие.40.00.00.00.00.00.00.00.00.00.00.00.10.00.00.00.10.00.00.00
Вводное слово.00.00.00.00.00.00.00.00.00.00.00.00.00.10.00.00.10.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица2.56.664.64.13.73.73.53.93.543.64.13.94.34.744.24.34.1
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие.40.901.31.51.81.82.71.72.61.91.92.72.42.22.32.82.61.621.9
Деепричастие.00.00.00.10.00.10.10.10.10.10.00.10.00.10.10.20.00.00.00.00

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая112.72
          .    точка80.77
          -    тире37.84
          !    восклицательный знак7.12
          ?    вопросительный знак10.60
          ...    многоточие8.26
          !..    воскл. знак с многоточием0.13
          ?..    вопр. знак с многоточием0.12
          !!!    тройной воскл. знак0.20
          ?!    вопр. знак с восклицанием0.46
          "    кавычка2.70
          ()    скобки0.49
          :    двоеточие2.42
          ;    точка с запятой0.70




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Андрей Легостаев
 55
2. Елена Хаецкая
 44
3. Кир Булычев
 43
4. Марина и Сергей Дяченко
 42
5. Сергей Сухинов
 42
6. Александр Мазин
 42
7. Александр Грин
 42
8. Сергей Лукьяненко
 42
9. Галина Романова
 41
10. Игорь Пронин
 41
...смотреть весь список >>
⇑ Наверх