FantLab ru



  Лингвистический анализ произведения
Произведение: Эталон победы
Автор: Алексей Фомичёв
Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:592125
Слов в произведении (СВП):90244
Приблизительно страниц:312
Средняя длина слова, знаков:5.22
Средняя длина предложения (СДП), знаков:53.49
СДП авторского текста, знаков:65.31
СДП диалога, знаков:37.33
Доля диалогов в тексте:29.65%
Доля авторского текста в диалогах:4.04%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: знаков, шаг: 1000 знаков)

Активный словарный запас

Использовано уникальных слов:9374
Активный словарный запас (АСЗ):8586
Активный несловарный запас (АНСЗ):788
Удельный АСЗ на 3000 слов текста:1176.65
Удельный АСЗ на 10000 слов текста:2649.69 —> 8576-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (0) приходится приблизительно на 0-ю страницу текста.
Миниимальное значение УАСЗ-3000 (10000000) приходится приблизительно на 0-ю страницу текста.

Части речи

Неопределённых частей речи (НОЧР), слов:20285 (22.48% от СВП)
Определённых частей речи (ОЧР), слов:69959 (77.52% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное23742 (33.94%)
          Прилагательное6738 (9.63%)
          Глагол16429 (23.48%)
          Местоимение-существительное5254 (7.51%)
          Местоименное прилагательное3123 (4.46%)
          Местоимение-предикатив20 (0.03%)
          Числительное (количественное)1277 (1.83%)
          Числительное (порядковое)258 (0.37%)
          Наречие4172 (5.96%)
          Предикатив773 (1.10%)
          Предлог8426 (12.04%)
          Союз7902 (11.30%)
          Междометие1559 (2.23%)
          Вводное слово250 (0.36%)
          Частица5152 (7.36%)
          Причастие1220 (1.74%)
          Деепричастие250 (0.36%)
Служебных слов:31936 (45.65%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное5217518.65.9.032.6.58111.630354.8.42144.5.65
Прилагательное444.2141.1.83.01.41.041.4.383.851.3.082.31.1.15
Глагол501621118.2.113.459.71.435143.4.399.33.2.45
Местоимение-существительное8.75.4233.12.01.84.094.5.9143.7.39.238.4.42.05
Местоименное прилагательное203.45.51.4.49.00.26.111.3.3921.5.22.042.26.07
Местоимение-предикатив.00.00.08.07.00.00.00.00.01.00.01.00.00.00.00.00.00
Числительное (колич-ое)7.91.11.7.41.30.03.75.08.31.141.76.18.07.61.18.01
Числительное (порядковое)1.9.26.38.03.01.00.01.03.01.04.15.27.00.00.11.03.00
Наречие5.35.8163.21.1.03.66.082.5.814.13.3.68.054.2.92.12
Предикатив.98.611.9.46.30.00.08.00.31.12.651.15.01.56.05.01
Предлог64123.98.99.5.002.5.79.77.16.11.58.15.00.391.9.04
Союз218.2237.94.8.001.7.277.5.908.55.6.80.4191.2.24
Междометие5.41.51.64.11.2.00.20.051.3.141.21.6.14.01.99.19.00
Вводное слово.45.30.53.37.19.00.01.00.11.05.23.31.14.00.23.05.00
Частица7.23.9283.31.5.012.083.11.14.55.9.39.274.5.75.27
Причастие6.61.81.23.24.00.15.03.76.083.1.73.28.01.33.22.03
Деепричастие.37.14.47.20.12.00.04.00.14.03.91.23.03.03.42.03.03

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 12345678910
Существительное17232727282829313132
Прилагательное6.277.47.97.68.58.37.98.38.4
Глагол11232322212018191818
Местоимение-существительное119.56.96.34.94.44.54.343.8
Местоименное прилагательное3.643.53.53.63.63.73.53.53.4
Местоимение-предикатив.00.00.10.00.00.00.00.00.00.10
Числительное (колич-ое)1.31.51.61.51.71.51.61.41.31.5
Числительное (порядковое).50.30.40.30.30.20.30.20.20.20
Наречие6.96.24.84.14.14.254.444
Предикатив1.5.80111.90.80.90.80.70
Предлог97.58.99.7101010111010
Союз177.56.37.38.18.598.99.98.5
Междометие5.5111.41.71.81.41.51.71.2
Вводное слово.90.30.20.20.30.20.10.30.10.30
Частица7.37.36.75.95.75.95.54.75.66
Причастие.901.901.51.11.321.71.71.8
Деепричастие.80.30.20.10.20.30.30.10.30.20

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая97.69
          .    точка96.44
          -    тире17.74
          !    восклицательный знак8.79
          ?    вопросительный знак9.51
          ...    многоточие5.63
          !..    воскл. знак с многоточием0.32
          ?..    вопр. знак с многоточием0.32
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.35
          "    кавычка3.21
          ()    скобки0.19
          :    двоеточие2.78
          ;    точка с запятой0.01




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Алексей Фомичёв
 47  – ожидает пересчёта
2. Владимир Васильев
 39  – ожидает пересчёта
3. Юрий Корчевский
 38  – ожидает пересчёта
4. Сергей Т. Алексеев
 38  – ожидает пересчёта
5. Алексей Живой
 37  – ожидает пересчёта
6. Вячеслав Шалыгин
 37  – ожидает пересчёта
7. Виктор Ночкин
 37  – ожидает пересчёта
8. Руслан Мельников
 37  – ожидает пересчёта
9. Дмитрий Самохин
 37  – ожидает пересчёта
10. Андрей Валентинов
 36  – ожидает пересчёта
...смотреть весь список >>
⇑ Наверх