FantLab ru



  Лингвистический анализ произведения
Произведение: Миллион приключений
Автор: Кир Булычев
Дата проведения анализа: 31 июля 2017 года

Общая статистика

Длина текста, знаков:422502
Слов в произведении (СВП):60984
Приблизительно страниц:207
Средняя длина слова, знаков:5.13
Средняя длина предложения (СДП), знаков:45.07
СДП авторского текста, знаков:63.75
СДП диалога, знаков:35.62
Доля диалогов в тексте:52.68%
Доля авторского текста в диалогах:10.74%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 6494 (в страницах — примерно 3; начинается где-то на 23-й)

Активный словарный запас

Использовано уникальных слов:7130
Активный словарный запас (АСЗ):6805
Активный несловарный запас (АНСЗ):325
Удельный АСЗ на 3000 слов текста:1078.66
Удельный АСЗ на 10000 слов текста:2425.42 —> 8316-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1206) приходится приблизительно на 1-ю страницу текста.
Миниимальное значение УАСЗ-3000 (943) приходится приблизительно на 140-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:14367 (23.56% от СВП)
Определённых частей речи (ОЧР), слов:46617 (76.44% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное14043 (30.12%)
          Прилагательное3406 (7.31%)
          Глагол342 (0.73%)
          Местоимение-существительное4639 (9.95%)
          Местоименное прилагательное1637 (3.51%)
          Местоимение-предикатив10 (0.02%)
          Числительное (количественное)237 (0.51%)
          Числительное (порядковое)76 (0.16%)
          Наречие1432 (3.07%)
          Предикатив110 (0.24%)
          Предлог5089 (10.92%)
          Послелог0 (0.00%)
          Союз189 (0.41%)
          Междометие82 (0.18%)
          Вводное слово10 (0.02%)
          Фразовый глагол4 (0.01%)
          Частица1770 (3.80%)
          Краткое прилагательное0 (0.00%)
          Причастие441 (0.95%)
          Деепричастие11 (0.02%)
          Краткое причастие0 (0.00%)
          Инфинитив11519 (24.71%)
Служебных слов:13426 (28.80%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
П
о
с
л
е
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ф
р
а
з
о
в
ы
й

г
л
а
г
о
л
Ч
а
с
т
и
ц
а
К
р
а
т
к
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
К
р
а
т
к
о
е

п
р
и
ч
а
с
т
и
е
И
н
ф
и
н
и
т
и
в
Существительное45163.79.59.4.041.4.188.4940.00.49.00.07.079.1.004.3.11.0098
Прилагательное656.6.141.4.74.00.04.07.42.003.4.00.21.00.00.00.70.00.77.00.0010
Глагол1.8.70.14.56.25.00.07.04.18.001.6.00.04.00.04.00.14.00.11.00.00.84
Местоимение-существительное117.91.26.73.6.07.18.045.2.4211.00.07.00.04.0013.00.56.04.0053
Местоименное прилагательное265.5.212.6.46.00.00.04.63.07.84.00.00.04.00.001.3.00.28.00.006.6
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00.04.00.00.00.00.00.00.00.00.00.00.21
Числительное (колич-ое)3.6.53.04.04.07.00.14.21.04.07.32.00.00.00.00.00.14.00.00.00.00.81
Числительное (порядковое)1.1.21.00.04.00.00.00.00.04.00.07.00.00.00.00.00.04.00.00.00.00.14
Наречие3.72.4.534.1.60.04.21.07.60.183.5.00.04.00.00.003.3.00.39.00.0013
Предикатив.14.07.00.11.04.00.00.00.07.00.11.00.00.00.00.00.11.00.00.00.002.3
Предлог9918.001714.002.6.53.18.00.04.00.00.00.00.00.00.001.3.00.001.8
Послелог.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз.67.32.001.9.14.00.00.00.04.00.21.00.00.00.00.001.2.00.00.00.001.2
Междометие.39.07.00.28.07.00.00.00.04.00.00.00.00.00.00.00.07.00.00.00.00.46
Вводное слово.14.04.00.00.00.00.00.00.04.00.00.00.04.00.00.00.00.00.00.00.00.00
Фразовый глагол.00.00.00.00.00.00.00.00.00.00.14.00.00.00.00.00.00.00.00.00.00.00
Частица2.11.5.951.3.53.00.00.111.1.001.6.00.00.00.00.00.74.00.63.00.0040
Краткое прилагательное.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие5.81.4.00.25.11.00.00.00.25.002.3.00.04.04.00.00.04.00.07.00.00.42
Деепричастие.14.14.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Краткое причастие.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Инфинитив7522.35188.3.041.4.398.8.3263.00.91.14.04.005.004.1.14.0025

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное2425253233353536353637363838363836413641
Прилагательное45.86.6897.988.59.48.79.41010109.89.910111110
Глагол.90.90.90.80.70.90.50.70.80.50.40.90.50.10.50.60.00.60.301.3
Местоимение-существительное2415118.66.96.17.266.45.26.35.54.24.65.15.94.53.25.82.1
Местоименное прилагательное2.73.43.93.73.73.94.13.93.33.95.13.93.93.63.53.44.72.93.15
Местоимение-предикатив.10.00.00.10.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое).40.40.60.40.60.70.70.50.60.60.201.1.20.70.50.80.70.90.30.40
Числительное (порядковое).20.20.10.10.20.20.10.20.20.20.20.00.00.00.30.20.00.00.30.00
Наречие5.63.82.72.62.62.63.22.73.12.52.32.42.51.62.82.224.33.11.3
Предикатив.60.40.20.20.20.20.10.10.10.00.20.00.00.00.70.20.50.00.00.00
Предлог8.97.7121211121212121414131314141314111514
Послелог.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз1.5.50.20.30.20.30.20.30.20.10.20.10.20.10.50.00.20.00.00.00
Междометие1.2.10.00.00.00.00.00.00.00.00.00.10.10.00.20.00.00.00.00.00
Вводное слово.10.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Фразовый глагол.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица3.15.65.83.843.23.53.73.33.32.52.83.12.13.12.23.21.74.12.9
Краткое прилагательное.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие.20.50.901.11.11.31.11.31.41.61.21.422.4.901.41.72.61.71.7
Деепричастие.00.00.10.00.00.00.00.00.00.10.00.00.00.30.00.00.00.00.00.00
Краткое причастие.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Инфинитив2230302726252423242322232222222222201920

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая118.29
          .    точка114.00
          -    тире52.46
          !    восклицательный знак9.77
          ?    вопросительный знак18.28
          ...    многоточие5.10
          !..    воскл. знак с многоточием0.05
          ?..    вопр. знак с многоточием0.25
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.02
          "    кавычка3.16
          ()    скобки0.03
          :    двоеточие5.15
          ;    точка с запятой0.13




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Кир Булычев
 48
2. Павел Шумил
 41
3. Владислав Крапивин
 41
4. Дмитрий Емец
 41
5. Марина и Сергей Дяченко
 40
6. Далия Трускиновская
 40
7. Алексей Лукьянов
 40
8. Сергей Лукьяненко
 40
9. Андрей Валентинов
 39
10. Марианна Алфёрова
 39
...смотреть весь список >>
⇑ Наверх