FantLab ru



  Лингвистический анализ произведения
Произведение: Игра ва-банк
Автор: Юлия Морозова
Дата проведения анализа: 19 сентября 2022 года

Общая статистика

Длина текста, знаков:236222
Слов в произведении (СВП):34005
Приблизительно страниц:122
Средняя длина слова, знаков:5.45
Средняя длина предложения (СДП), знаков:51.02
СДП авторского текста, знаков:65.71
СДП диалога, знаков:36.27
Доля диалогов в тексте:35.61%
Доля авторского текста в диалогах:7.18%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: знаков, шаг: 1000 знаков)

Активный словарный запас

Использовано уникальных слов:7360
Активный словарный запас (АСЗ):6878
Активный несловарный запас (АНСЗ):482
Удельный АСЗ на 3000 слов текста:1369.02
Удельный АСЗ на 10000 слов текста:3274.08 отсутствует в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (0) приходится приблизительно на 0-ю страницу текста.
Миниимальное значение УАСЗ-3000 (10000000) приходится приблизительно на 0-ю страницу текста.

Части речи

Неопределённых частей речи (НОЧР), слов:7699 (22.64% от СВП)
Определённых частей речи (ОЧР), слов:26306 (77.36% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное8523 (32.40%)
          Прилагательное3086 (11.73%)
          Глагол6122 (23.27%)
          Местоимение-существительное2465 (9.37%)
          Местоименное прилагательное1184 (4.50%)
          Местоимение-предикатив4 (0.02%)
          Числительное (количественное)302 (1.15%)
          Числительное (порядковое)81 (0.31%)
          Наречие1620 (6.16%)
          Предикатив252 (0.96%)
          Предлог3509 (13.34%)
          Союз2222 (8.45%)
          Междометие527 (2.00%)
          Вводное слово95 (0.36%)
          Частица2220 (8.44%)
          Причастие550 (2.09%)
          Деепричастие95 (0.36%)
Служебных слов:12321 (46.84%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное401849117.3.041.7.47111.535214.9.50145.3.47
Прилагательное557.3161.9.61.00.47.071.9.544.24.6.97.072.61.2.29
Глагол421719127.4.041.5.438.91.136112.9.29123.2.32
Местоимение-существительное8.87.3294.12.1.00.72.047.1.867.22.9.61.2910.72.25
Местоименное прилагательное186.44.51.2.65.00.25.111.5.251.91.4.11.002.5.72.07
Местоимение-предикатив.04.00.00.00.00.00.00.00.00.00.00.04.00.00.04.00.00
Числительное (колич-ое)3.5.97.97.25.22.04.54.07.25.04.86.79.18.00.54.18.00
Числительное (порядковое)1.5.22.25.04.00.00.00.00.04.04.18.18.00.00.04.00.04
Наречие55.5145.61.5.04.36.002.9.725.82.6.61.075.41.1.11
Предикатив.79.392.5.79.43.00.00.04.11.18.36.57.14.00.75.04.00
Предлог66185.59.313.002.1.86.86.04.291.6.07.00.542.8.07
Союз117.3168.82.9.00.54.325.9.477.33.71.3.437.81.1.32
Междометие5.31.824.1.83.00.11.04.83.11.65.83.11.04.65.14.04
Вводное слово.50.18.61.57.11.00.04.04.18.04.36.29.07.00.11.07.00
Частица8.15.12961.9.001.2.073.7.905.35.6.61.186.1.90.25
Причастие9.11.41.1.65.29.00.07.00.47.003.6.54.22.07.50.22.00
Деепричастие.50.18.43.22.11.00.00.00.25.00.68.36.04.00.29.04.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 12345678910
Существительное17192426273029303127
Прилагательное7.79.27.98.499.58.79.91012
Глагол14232221201819181820
Местоимение-существительное14108.47.56.15.55.25.25.24.5
Местоименное прилагательное2.13.73.94.14.33.63.44.43.53.3
Местоимение-предикатив.00.00.00.10.00.00.00.00.00.00
Числительное (колич-ое).60.80.701.901.21.2.901.70
Числительное (порядковое).20.30.20.20.20.20.20.20.20.40
Наречие76.454.64.14.344.254.8
Предикатив1.3.801.90.60.60.70.60.80.70
Предлог8.38.11112111214111012
Союз1264.65.76.36.25.75.56.16
Междометие3.71.41.41.31.311.31.81.1.90
Вводное слово.90.40.20.20.30.20.10.10.10.20
Частица9.38.37.66.46.85.75.75.85.55.4
Причастие1.111.41.61.82.22.11.72.12.1
Деепричастие.80.20.20.20.10.30.00.20.30.30

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая99.51
          .    точка104.96
          -    тире27.97
          !    восклицательный знак11.41
          ?    вопросительный знак13.56
          ...    многоточие4.12
          !..    воскл. знак с многоточием0.06
          ?..    вопр. знак с многоточием0.26
          !!!    тройной воскл. знак0.18
          ?!    вопр. знак с восклицанием1.26
          "    кавычка11.29
          ()    скобки1.26
          :    двоеточие1.53
          ;    точка с запятой0.00




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Татьяна Коростышевская
 39  – ожидает пересчёта
2. Андрей Белянин
 39  – ожидает пересчёта
3. Сергей Лукьяненко
 39  – ожидает пересчёта
4. Дмитрий Янковский
 38  – ожидает пересчёта
5. Александр Щёголев
 38  – ожидает пересчёта
6. Валерий Алексеев
 37  – ожидает пересчёта
7. Сергей Костин
 37  – ожидает пересчёта
8. Генри Лайон Олди
 37  – ожидает пересчёта
9. Валентина Савенко
 37  – ожидает пересчёта
10. Андрей Валентинов
 37  – ожидает пересчёта
...смотреть весь список >>
⇑ Наверх