FantLab ru



  Лингвистический анализ произведения
Произведение: В направлении Окна
Автор: Андрей Лях
Дата проведения анализа: 24 июля 2018 года

Общая статистика

Длина текста, знаков:336076
Слов в произведении (СВП):49965
Приблизительно страниц:178
Средняя длина слова, знаков:5.37
Средняя длина предложения (СДП), знаков:87.9
СДП авторского текста, знаков:103.52
СДП диалога, знаков:49.17
Доля диалогов в тексте:16.15%
Доля авторского текста в диалогах:5.87%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 23565 (в страницах — примерно 12; начинается где-то на 4-й)

Активный словарный запас

Использовано уникальных слов:9192
Активный словарный запас (АСЗ):8527
Активный несловарный запас (АНСЗ):665
Удельный АСЗ на 3000 слов текста:1366.17
Удельный АСЗ на 10000 слов текста:3323.31 —> 764-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1528) приходится приблизительно на 69-ю страницу текста.
Миниимальное значение УАСЗ-3000 (1160) приходится приблизительно на 140-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:10213 (20.44% от СВП)
Определённых частей речи (ОЧР), слов:39752 (79.56% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное12200 (30.69%)
          Прилагательное3459 (8.70%)
          Глагол7529 (18.94%)
          Местоимение-существительное2533 (6.37%)
          Местоименное прилагательное1665 (4.19%)
          Местоимение-предикатив7 (0.02%)
          Числительное (количественное)502 (1.26%)
          Числительное (порядковое)139 (0.35%)
          Наречие1274 (3.20%)
          Предикатив79 (0.20%)
          Предлог4754 (11.96%)
          Союз2259 (5.68%)
          Междометие15 (0.04%)
          Вводное слово19 (0.05%)
          Частица1094 (2.75%)
          Причастие560 (1.41%)
          Деепричастие22 (0.06%)
Служебных слов:12346 (31.06%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное592370139.5.003.5.628.6.694840.07.117.17.1.36
Прилагательное738.1101.65.00.22.00.76.043.54.4.00.04.511.6.00
Глагол511719128.4.181.7.517.3.51509.9.07.114.92.5.11
Местоимение-существительное64.6322.31.8.00.33.004.6.186.73.00.076.25.00
Местоименное прилагательное276.74.82.5.98.00.58.11.73.15.98.58.00.00.98.29.00
Местоимение-предикатив.00.00.07.00.00.00.00.00.00.00.04.00.00.00.00.00.00
Числительное (колич-ое)7.9.58.84.25.07.001.11.2.11.00.73.47.00.00.33.15.00
Числительное (порядковое)2.4.55.40.07.07.00.00.00.07.00.07.11.00.00.04.00.00
Наречие3.13.6123.3.62.04.36.001.1.114.31.00.002.3.62.00
Предикатив.00.072.1.00.00.00.00.00.00.00.04.04.00.00.00.00.00
Предлог84211.31118.004.31.15.00.18.07.00.00.072.1.00
Союз146.51932.5.00.51.183.9.157.6.47.00.003.2.87.15
Междометие.07.00.07.00.00.00.00.00.00.00.00.00.00.00.04.00.00
Вводное слово.18.00.18.07.00.00.00.00.00.00.00.00.00.00.04.00.00
Частица1.7.9824.65.25.00.18.001.2.001.9.18.00.00.36.62.00
Причастие7.31.7.55.25.18.00.07.04.36.004.4.55.00.00.04.15.00
Деепричастие.15.04.07.00.04.00.00.00.04.00.15.00.00.00.04.04.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное2725273232323334333432343432343431333334
Прилагательное6.37.46.87.67.28.78.59.58.49.38.5109.7101010109118.2
Глагол1630252320221919192020171719201620181718
Местоимение-существительное17109.67.57.56.46.365.75.85.34.855.74.155.25.84.65.1
Местоименное прилагательное4.14.84.53.74.84.25.2444.14.64.54.54.24.24.65.84.54.24.2
Местоимение-предикатив.00.10.00.00.00.10.00.00.00.00.10.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)21.71.32.901.21.11.81.41.31.4.30.70.901.51.4.801.11.2.80
Числительное (порядковое).60.70.60.40.20.30.30.10.40.30.50.20.40.70.30.20.40.30.30.60
Наречие6.24.53.833.13.12.73.23.13.12.53.52.62.92.42.92.43.93.43.1
Предикатив.00.30.20.30.20.30.10.10.30.20.20.20.00.30.20.20.50.00.10.40
Предлог137.8131213131311131214141213121411141414
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз4.92.233.86.15.36.66.77.56.36.97.18.16.77.587.77.35.95.5
Междометие.40.00.00.00.00.00.00.00.00.00.00.00.10.00.00.00.00.00.00.00
Вводное слово.20.10.10.00.00.00.10.10.10.10.10.00.20.00.00.00.20.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица1.74.23.93.93.62.72.82.93.32.42.633.12.42.52.23.71.63.42
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие.60.701.2.801.311.61.41.221.81.42.11.71.121.71.41.83.5
Деепричастие.10.00.00.00.00.00.00.10.00.10.10.00.00.00.10.00.10.30.00.10

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая137.24
          .    точка63.18
          -    тире24.70
          !    восклицательный знак0.84
          ?    вопросительный знак8.47
          ...    многоточие2.90
          !..    воскл. знак с многоточием0.00
          ?..    вопр. знак с многоточием0.04
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.00
          "    кавычка11.63
          ()    скобки0.24
          :    двоеточие3.40
          ;    точка с запятой3.36




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Андрей Лях
 44
2. Василий Аксёнов
 43
3. Аркадий и Борис Стругацкие
 42
4. Юлия Латынина
 42
5. Александр Зорич
 42
6. Сергей Синякин
 42
7. Владимир Васильев
 42
8. Александр Тюрин
 42
9. Сергей Т. Алексеев
 42
10. [Для текстов по лингвоанализу]
 42
...смотреть весь список >>
⇑ Наверх