FantLab ru



  Лингвистический анализ произведения
Произведение: Корректор реальности
Автор: Олег Языков
Дата проведения анализа: 25 июля 2018 года

Общая статистика

Длина текста, знаков:585194
Слов в произведении (СВП):87577
Приблизительно страниц:304
Средняя длина слова, знаков:5.24
Средняя длина предложения (СДП), знаков:42.92
СДП авторского текста, знаков:52.62
СДП диалога, знаков:35.32
Доля диалогов в тексте:46.29%
Доля авторского текста в диалогах:1.07%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 7433 (в страницах — примерно 4; начинается где-то на 228-й)

Активный словарный запас

Использовано уникальных слов:11162
Активный словарный запас (АСЗ):10022
Активный несловарный запас (АНСЗ):1140
Удельный АСЗ на 3000 слов текста:1185.09
Удельный АСЗ на 10000 слов текста:2835.53 —> 4943-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1304) приходится приблизительно на 293-ю страницу текста.
Миниимальное значение УАСЗ-3000 (1026) приходится приблизительно на 218-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:19268 (22.00% от СВП)
Определённых частей речи (ОЧР), слов:68309 (78.00% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное20260 (29.66%)
          Прилагательное5598 (8.20%)
          Глагол14498 (21.22%)
          Местоимение-существительное5989 (8.77%)
          Местоименное прилагательное2500 (3.66%)
          Местоимение-предикатив22 (0.03%)
          Числительное (количественное)553 (0.81%)
          Числительное (порядковое)104 (0.15%)
          Наречие1727 (2.53%)
          Предикатив119 (0.17%)
          Предлог6784 (9.93%)
          Союз3604 (5.28%)
          Междометие93 (0.14%)
          Вводное слово12 (0.02%)
          Частица2086 (3.05%)
          Причастие1149 (1.68%)
          Деепричастие34 (0.05%)
Служебных слов:21090 (30.87%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное692266139.1.051.4.325.3.324027.16.147.16.4.21
Прилагательное647.8161.5.67.00.07.00.55.122.94.7.00.00.482.1.05
Глагол531827168.5.181.8.286.2.534312.02.055.14.2.05
Местоимение-существительное9.26.4445.32.6.00.25.123.8.07114.9.02.028.64.05
Местоименное прилагательное275.64.11.91.3.02.16.18.48.07.76.76.00.00.58.53.00
Местоимение-предикатив.02.02.05.02.00.00.00.00.00.00.05.05.00.00.00.00.00
Числительное (колич-ое)5.1.78.76.21.25.00.32.05.05.00.69.21.00.00.02.12.02
Числительное (порядковое)1.6.02.16.02.02.00.00.00.00.00.05.02.00.00.00.00.00
Наречие2.92.89.63.2.81.02.21.00.74.122.91.2.00.001.2.39.02
Предикатив.12.051.16.05.00.00.00.02.00.02.12.00.00.07.00.00
Предлог81171.71212.003.3.48.39.00.14.07.00.00.003.2.00
Союз139255.52.02.46.002.5.123.7.23.00.003.51.4.07
Междометие.37.05.18.18.00.00.00.00.00.00.02.02.28.00.02.02.00
Вводное слово.02.00.05.05.00.00.00.00.00.00.02.00.00.00.05.00.00
Частица31.4271.53.00.02.02.88.001.4.51.00.00.58.37.00
Причастие102.74.92.30.00.05.00.30.005.1.64.02.00.07.35.00
Деепричастие.23.07.05.02.00.00.00.00.02.00.18.00.00.00.00.02.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное2223283033353536383839383640373943383845
Прилагательное6.77.97.37.68.8998.79.5912101112121210131211
Глагол2027262523212221181918181817171513161614
Местоимение-существительное1915118.76.95.85.54.65.14.53.54.14.52.53.24.73.33.32.13.5
Местоименное прилагательное3.63.84.14.443.93.23.64.43.93.83.64.73.43.42.62.643.71.9
Местоимение-предикатив.10.00.00.00.10.00.00.10.00.10.00.10.00.00.00.00.00.00.00.00
Числительное (колич-ое).90.90.60.80.90.901.1.90.70.90.901.801.80.50.60.90.501.3
Числительное (порядковое).30.20.20.10.20.20.20.00.10.30.20.10.00.10.30.20.00.00.00.00
Наречие5.53.42.52.21.82.32.11.81.41.92.21.821.922.331.41.8.90
Предикатив.30.20.30.30.10.20.10.10.10.10.00.10.00.30.00.00.20.50.30.00
Предлог9.78.39.7101111111211121112121111131211149.8
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз6.15.154.85.35.55.55.36.46.45.75.96.25.96.75.66.57.97.67.9
Междометие.80.20.00.00.00.00.00.10.00.00.00.00.00.00.00.00.00.00.30.00
Вводное слово.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица3.54.33.83.63.13.232.62.92.52.32.91.71.91.51.81.71.42.41.6
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие.9011.41.61.9222.72.21.92.32.12.53.33.92.73.33.52.12.8
Деепричастие.10.00.00.10.00.00.00.10.20.00.00.00.20.00.10.00.20.00.00.00

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая107.41
          .    точка82.75
          -    тире23.27
          !    восклицательный знак26.31
          ?    вопросительный знак18.22
          ...    многоточие28.23
          !..    воскл. знак с многоточием0.00
          ?..    вопр. знак с многоточием0.00
          !!!    тройной воскл. знак0.02
          ?!    вопр. знак с восклицанием0.19
          "    кавычка13.85
          ()    скобки0.30
          :    двоеточие1.68
          ;    точка с запятой0.01




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Олег Языков
 55
2. Сергей Лукьяненко
 42
3. Владимир Кунин
 40
4. Александр Тюрин
 40
5. Аркадий и Борис Стругацкие
 40
6. Андрей Белянин
 40
7. Леонид Каганов
 39
8. Сергей Слюсаренко
 39
9. Сергей Абрамов
 39
10. Андрей Валентинов
 39
...смотреть весь список >>
⇑ Наверх