FantLab ru



  Лингвистический анализ произведения
Произведение: Адмиралъ из будущего. Царьград наш!
Автор: Вячеслав Коротин
Дата проведения анализа: 25 июля 2018 года

Общая статистика

Длина текста, знаков:447224
Слов в произведении (СВП):61339
Приблизительно страниц:234
Средняя длина слова, знаков:5.77
Средняя длина предложения (СДП), знаков:75.53
СДП авторского текста, знаков:98.67
СДП диалога, знаков:54.45
Доля диалогов в тексте:37.85%
Доля авторского текста в диалогах:7.05%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 16985 (в страницах — примерно 9; начинается где-то на 161-й)

Активный словарный запас

Использовано уникальных слов:8516
Активный словарный запас (АСЗ):7690
Активный несловарный запас (АНСЗ):826
Удельный АСЗ на 3000 слов текста:1242.88
Удельный АСЗ на 10000 слов текста:2842.98 —> 4872-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1375) приходится приблизительно на 223-ю страницу текста.
Миниимальное значение УАСЗ-3000 (1055) приходится приблизительно на 153-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:13445 (21.92% от СВП)
Определённых частей речи (ОЧР), слов:47894 (78.08% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное15525 (32.42%)
          Прилагательное4496 (9.39%)
          Глагол9175 (19.16%)
          Местоимение-существительное1741 (3.64%)
          Местоименное прилагательное2164 (4.52%)
          Местоимение-предикатив24 (0.05%)
          Числительное (количественное)529 (1.10%)
          Числительное (порядковое)186 (0.39%)
          Наречие1288 (2.69%)
          Предикатив133 (0.28%)
          Предлог5386 (11.25%)
          Союз2446 (5.11%)
          Междометие20 (0.04%)
          Вводное слово13 (0.03%)
          Частица1565 (3.27%)
          Причастие744 (1.55%)
          Деепричастие26 (0.05%)
Служебных слов:13359 (27.89%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное7626644.513.031.91.48.4.905228.10.13106.9.10
Прилагательное816.515.771.2.00.32.10.67.163.34.4.06.00.83.99.06
Глагол4919277.511.291.8.485.8.51497.2.06.036.24.4.13
Местоимение-существительное4.52.8161.21.5.00.19.102.3.103.71.6.00.004.1.38.03
Местоименное прилагательное338.45.91.91.2.00.35.10.61.131.1.67.00.031.5.42.03
Местоимение-предикатив.06.03.16.00.03.00.00.00.03.00.00.06.00.00.00.00.00
Числительное (колич-ое)7.41.2.93.10.26.001.2.32.03.00.70.16.00.00.03.19.00
Числительное (порядковое)3.5.45.22.03.03.00.03.00.03.00.00.19.00.00.00.03.00
Наречие2.46.29.81.2.67.00.22.06.74.223.91.3.00.001.9.80.03
Предикатив.03.292.6.03.03.00.03.00.06.00.03.16.00.00.22.00.00
Предлог85202.17.615.003.41.4.58.00.03.00.00.00.032.7.00
Союз167.5152.92.7.03.83.512.8.355.6.54.00.0641.1.13
Междометие.00.00.10.03.00.00.00.00.00.00.00.10.00.00.03.00.00
Вводное слово.10.06.03.03.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица1.82.729.61.64.00.13.061.4.002.2.13.00.00.35.32.06
Причастие8.71.6.74.48.45.00.10.03.35.004.6.51.00.00.19.16.00
Деепричастие.32.06.00.03.00.00.03.00.00.00.16.00.00.00.00.00.03

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное2328303334333836373937383738383837364038
Прилагательное7.38.28.699.610119.8119.910119.69.9111111121311
Глагол2323252422221818181817171816161920191617
Местоимение-существительное6.46.25.54.13.74.42.83.12.73.43.32.73.62.13.43.32.62.33.51.9
Местоименное прилагательное4.566.54.84.54.854.443.94.24.24.74.74.14.84.643.74.4
Местоимение-предикатив.10.10.10.10.10.10.00.00.10.00.10.00.10.00.00.00.00.00.10.00
Числительное (колич-ое)1.61.21.31.111.11.31.31.5.701.1.601.31.1.401.4.90.90.901.1
Числительное (порядковое).50.50.30.40.50.40.20.70.30.30.20.40.30.40.30.50.40.10.40.60
Наречие5.13.92.52.72.82.22.12.92.62.12.42.62.53.42.42.31.92.62.42.8
Предикатив.40.30.30.30.20.50.20.50.10.30.20.30.20.20.60.20.10.10.10.20
Предлог1211111112121112121312131312131211121212
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз124.73.23.34.35.45.15.75.54.85.95.15.75.54.64.364.64.35.6
Междометие.30.10.00.10.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Вводное слово.10.00.00.10.00.10.00.00.10.00.00.00.00.10.00.10.00.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица3.64.64.243.62.92.83.432.73.13.52.73.73.42.53.73.92.33.3
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие.601.41.11.71.31.51.81.81.92.12.11.72.12.72.51.71.61.921.7
Деепричастие.10.00.10.00.00.00.10.00.00.10.20.00.10.10.20.00.00.10.00.20

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая98.68
          .    точка65.34
          -    тире25.29
          !    восклицательный знак7.53
          ?    вопросительный знак7.65
          ...    многоточие14.10
          !..    воскл. знак с многоточием0.34
          ?..    вопр. знак с многоточием0.31
          !!!    тройной воскл. знак0.08
          ?!    вопр. знак с восклицанием0.11
          "    кавычка45.29
          ()    скобки1.04
          :    двоеточие6.08
          ;    точка с запятой0.16




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Вячеслав Коротин
 51
2. Михаил Ланцов
 40
3. Антон Первушин
 39
4. [Для текстов по лингвоанализу]
 39
5. Сергей Лысак
 39
6. Вячеслав Шалыгин
 38
7. Александр Бушков
 38
8. Владимир Васильев
 38
9. Владимир Савченко
 38
10. Комбат Найтов
 38
...смотреть весь список >>
⇑ Наверх