FantLab ru



  Лингвистический анализ произведения
Произведение: Бабочка и василиск
Автор: Юлий Буркин
Дата проведения анализа: 23 июля 2018 года

Общая статистика

Длина текста, знаков:87073
Слов в произведении (СВП):12661
Приблизительно страниц:44
Средняя длина слова, знаков:5.28
Средняя длина предложения (СДП), знаков:71.26
СДП авторского текста, знаков:78.57
СДП диалога, знаков:54.11
Доля диалогов в тексте:22.69%
Доля авторского текста в диалогах:17.81%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 8092 (в страницах — примерно 4; начинается где-то на 34-й)

Активный словарный запас

Использовано уникальных слов:3733
Активный словарный запас (АСЗ):3581
Активный несловарный запас (АНСЗ):152
Удельный АСЗ на 3000 слов текста:1316.76
Удельный АСЗ на 10000 слов текста:3167.75 —> 1569-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1370) приходится приблизительно на 27-ю страницу текста.
Миниимальное значение УАСЗ-3000 (1259) приходится приблизительно на 30-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:2616 (20.66% от СВП)
Определённых частей речи (ОЧР), слов:10045 (79.34% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное2759 (27.47%)
          Прилагательное955 (9.51%)
          Глагол2139 (21.29%)
          Местоимение-существительное938 (9.34%)
          Местоименное прилагательное344 (3.42%)
          Местоимение-предикатив2 (0.02%)
          Числительное (количественное)49 (0.49%)
          Числительное (порядковое)18 (0.18%)
          Наречие338 (3.36%)
          Предикатив20 (0.20%)
          Предлог1017 (10.12%)
          Союз621 (6.18%)
          Междометие12 (0.12%)
          Вводное слово1 (0.01%)
          Частица288 (2.87%)
          Причастие168 (1.67%)
          Деепричастие13 (0.13%)
Служебных слов:3223 (32.09%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное502167139.7.00.87.147.1.433233.29.006.96.8.43
Прилагательное669.4173.61.4.00.14.001.2.144.26.2.00.00.582.14
Глагол412028247.5.00.72.297.4.435213.00.005.24.1.14
Местоимение-существительное9.46.5523.22.5.29.43.145.4.008.43.8.00.147.4.72.00
Местоименное прилагательное189.45.22.91.3.00.00.00.43.14.72.29.00.001.4.29.00
Местоимение-предикатив.00.00.29.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)3.3.87.14.43.14.00.00.00.00.00.00.29.00.00.43.29.00
Числительное (порядковое).72.00.72.14.00.00.00.00.00.00.00.00.00.00.00.00.00
Наречие2.33.6115.11.2.00.14.001.4.294.2.87.00.003.3.87.00
Предикатив.00.141.4.29.00.00.14.00.00.00.00.00.00.00.00.00.00
Предлог77171.21212.002.43.29.00.00.00.00.00.001.9.00
Союз188.5227.12.8.00.14.294.2.144.8.14.00.003.51.29
Междометие.14.00.29.29.00.00.00.00.00.00.00.00.14.00.00.00.00
Вводное слово.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица2.21.7231.43.00.00.002.001.3.00.00.00.29.43.00
Причастие821.2.72.43.00.29.00.43.004.1.87.00.00.14.58.00
Деепричастие.29.14.14.00.00.00.00.00.00.00.43.14.00.00.00.00.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное2420232430292828323528343427333231323735
Прилагательное57.27.78.710109.411129.410131214148.5149.61413
Глагол1430312822212421201924151726201817242014
Местоимение-существительное221711109.499.67.26.86.44.96.16.17.17.91056.629
Местоименное прилагательное1.94.33.733.443.84.63.34.24.44.31.94.51.73.64.43.62.72.3
Местоимение-предикатив.00.00.10.00.00.00.00.00.00.00.00.30.00.00.00.00.00.00.00.00
Числительное (колич-ое).801.50.50.40.70.40.40.40.70.00.301.80.40.00.00.00.00.00
Числительное (порядковое).70.50.00.10.10.00.00.20.00.00.00.00.00.00.40.00.60.00.00.80
Наречие5.74.53.332.42.83.64.84333.72.91.12.13.12.83.62.73.8
Предикатив.40.40.30.50.30.20.20.00.20.00.00.00.00.40.00.00.00.00.00.80
Предлог87.28.21111101212121112111391112139138.3
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз1335.85.74.97.47.45.65.56.27.78.36.56.84.67.65.64.244.5
Междометие1.2.00.00.00.00.00.00.00.00.20.30.00.00.00.00.00.00.00.00.00
Вводное слово.00.00.00.00.00.00.00.00.00.00.00.00.00.00.40.00.00.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица1.34.143.82.73.81.33.42.42.22.5.903.22.62.13.12.84.223.8
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие.901.21.5.802.11.71.31.61.32.22.22.11.91.12.11.83.932.75.3
Деепричастие.50.00.00.30.00.00.00.20.00.20.30.30.30.00.40.40.00.00.00.00

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая134.03
          .    точка75.74
          -    тире23.85
          !    восклицательный знак5.21
          ?    вопросительный знак6.87
          ...    многоточие6.24
          !..    воскл. знак с многоточием0.47
          ?..    вопр. знак с многоточием0.24
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.63
          "    кавычка15.16
          ()    скобки2.84
          :    двоеточие8.45
          ;    точка с запятой1.18




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Елена Хаецкая
 37
2. Александр Грин
 37
3. Аркадий и Борис Стругацкие
 36
4. Дмитрий Емец
 36
5. Андрей Столяров
 36
6. Фазиль Искандер
 36
7. Валерий Алексеев
 36
8. Марина и Сергей Дяченко
 35
9. Мария Галина
 35
10. [Для текстов по лингвоанализу]
 35
...смотреть весь список >>
⇑ Наверх