fantlab ru



  Лингвистический анализ произведения
Произведение: Я - эбонитовая палочка
Автор: Андрей Кокоулин
Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:136270
Слов в произведении (СВП):20249
Приблизительно страниц:69
Средняя длина слова, знаков:5.17
Средняя длина предложения (СДП), знаков:39.01
СДП авторского текста, знаков:43.86
СДП диалога, знаков:25.07
Доля диалогов в тексте:16.64%
Доля авторского текста в диалогах:14.04%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: знаков, шаг: 1000 знаков)

Активный словарный запас

Использовано уникальных слов:4807
Активный словарный запас (АСЗ):4376
Активный несловарный запас (АНСЗ):431
Удельный АСЗ на 3000 слов текста:1260.82
Удельный АСЗ на 10000 слов текста:2983.80 —> 3743-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (0) приходится приблизительно на 0-ю страницу текста.
Миниимальное значение УАСЗ-3000 (10000000) приходится приблизительно на 0-ю страницу текста.

Части речи

Неопределённых частей речи (НОЧР), слов:4727 (23.34% от СВП)
Определённых частей речи (ОЧР), слов:15522 (76.66% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное4809 (30.98%)
          Прилагательное1570 (10.11%)
          Глагол3827 (24.66%)
          Местоимение-существительное2123 (13.68%)
          Местоименное прилагательное640 (4.12%)
          Местоимение-предикатив5 (0.03%)
          Числительное (количественное)186 (1.20%)
          Числительное (порядковое)36 (0.23%)
          Наречие930 (5.99%)
          Предикатив184 (1.19%)
          Предлог1905 (12.27%)
          Союз1497 (9.64%)
          Междометие271 (1.75%)
          Вводное слово111 (0.72%)
          Частица1213 (7.81%)
          Причастие242 (1.56%)
          Деепричастие49 (0.32%)
Служебных слов:7814 (50.34%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное421548127.5.001.4.258.61.529204.5.93104.5.68
Прилагательное387.2132.71.4.00.50.061.5.194.44.1.81.312.91.3.31
Глагол411526205.6.061.7.06101.135142.4.31111.8.25
Местоимение-существительное9.79.7477.93.8.06.74.129.1.938.27.7.501.112.62.31
Местоименное прилагательное1535.11.8.99.00.37.061.1.561.91.5.19.252.7.50.00
Местоимение-предикатив.00.00.12.00.00.00.06.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)3.8.31.99.19.19.06.93.12.12.061.2.43.25.00.74.00.00
Числительное (порядковое)1.2.06.19.00.00.00.00.00.00.00.00.31.06.06.00.00.00
Наречие4.64.3145.71.2.00.19.003.2.434.43.6.31.253.6.81.12
Предикатив1.4.561.51.4.19.00.12.00.56.25.56.74.12.00.68.00.00
Предлог66143.7149.5.001.9.68.62.12.121.2.00.06.502.7.06
Союз137.116142.3.00.62.376.61.56.96.62.879.4.74.25
Междометие5.9.811.63.74.00.06.00.68.19.681.1.06.00.43.12.00
Вводное слово.62.251.11.7.31.00.06.00.68.19.56.50.12.00.25.00.00
Частица9.44.4267.11.5.00.93.063.71.14.65.2.56.565.74.25
Причастие6.81.37.31.06.00.12.00.62.064.31.12.06.19.19.00
Деепричастие.93.06.56.31.00.00.00.00.12.00.43.00.00.00.19.00.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 12345678910
Существительное18212225272726313231
Прилагательное7.37.76.57.58.58.18.88.99.18.7
Глагол14262421202019161718
Местоимение-существительное2011119.38.69.48.3875.5
Местоименное прилагательное1.93.72.62.83.44.63.63.43.34.8
Местоимение-предикатив.10.00.00.10.00.00.00.00.00.00
Числительное (колич-ое).90.9011.701.11.1.401.90
Числительное (порядковое).20.20.10.20.10.30.10.20.10.00
Наречие4.75.95.24.45.24.145.34.82.8
Предикатив1.511.3.60.70.60.60.90.10.40
Предлог7.35.71112119.311121311
Союз1275.26.36.96.58.15.95.77.6
Междометие3.80.901.311.41.1.801.31.7
Вводное слово1.80.50.50.50.70.20.20.10.20
Частица7.67.27.66.45556.13.76.5
Причастие.50.60.901.31.51.621.61.31.3
Деепричастие.40.20.20.20.30.10.50.00.30.00

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая138.72
          .    точка128.75
          -    тире31.51
          !    восклицательный знак10.32
          ?    вопросительный знак22.08
          ...    многоточие13.78
          !..    воскл. знак с многоточием0.15
          ?..    вопр. знак с многоточием0.05
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.05
          "    кавычка13.28
          ()    скобки0.69
          :    двоеточие4.05
          ;    точка с запятой0.00




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Андрей Кокоулин
 36
2. Сергей Лукьяненко
 33
3. Вячеслав Рыбаков
 32
4. Марина и Сергей Дяченко
 32
5. Сергей Волков
 32
6. Аркадий и Борис Стругацкие
 32
7. Андрей Белянин
 32
8. Олег Рой
 32
9. Виктор Косенков
 32
10. Андрей Щупов
 31
...смотреть весь список >>
⇑ Наверх