FantLab ru



  Лингвистический анализ произведения
Произведение: Сумасшедшая деревня
Автор: Андрей Саломатов
Дата проведения анализа: 23 июля 2018 года

Общая статистика

Длина текста, знаков:281587
Слов в произведении (СВП):37714
Приблизительно страниц:132
Средняя длина слова, знаков:5.31
Средняя длина предложения (СДП), знаков:60.05
СДП авторского текста, знаков:100.94
СДП диалога, знаков:47.67
Доля диалогов в тексте:61.1%
Доля авторского текста в диалогах:16.98%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 4642 (в страницах — примерно 2; начинается где-то на 129-й)

Активный словарный запас

Использовано уникальных слов:5622
Активный словарный запас (АСЗ):5347
Активный несловарный запас (АНСЗ):275
Удельный АСЗ на 3000 слов текста:1125.41
Удельный АСЗ на 10000 слов текста:2540.32 —> 8235-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1256) приходится приблизительно на 42-ю страницу текста.
Миниимальное значение УАСЗ-3000 (986) приходится приблизительно на 10-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:7559 (20.04% от СВП)
Определённых частей речи (ОЧР), слов:30155 (79.96% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное8210 (27.23%)
          Прилагательное2365 (7.84%)
          Глагол6788 (22.51%)
          Местоимение-существительное2432 (8.06%)
          Местоименное прилагательное1115 (3.70%)
          Местоимение-предикатив3 (0.01%)
          Числительное (количественное)209 (0.69%)
          Числительное (порядковое)18 (0.06%)
          Наречие1031 (3.42%)
          Предикатив52 (0.17%)
          Предлог3201 (10.62%)
          Союз1581 (5.24%)
          Междометие37 (0.12%)
          Вводное слово2 (0.01%)
          Частица848 (2.81%)
          Причастие205 (0.68%)
          Деепричастие18 (0.06%)
Служебных слов:9219 (30.57%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное5416678.68.6.051.7.007.8.213742.00.004.42.5.05
Прилагательное657181.1.84.00.21.00.52.052.93.00.00.63.73.00
Глагол601930159.8.002.5.266.7.05619.6.05.003.31.9.10
Местоимение-существительное6.95.8414.33.2.00.10.105.057.83.3.00.058.8.16.00
Местоименное прилагательное229.45.62.4.63.00.16.001.4.211.4.42.00.001.4.21.00
Местоимение-предикатив.00.00.16.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)51.4.99.16.10.00.31.00.26.00.10.10.00.00.00.37.00
Числительное (порядковое).52.00.05.00.00.00.00.00.05.00.00.00.00.00.00.00.00
Наречие34.9185.1.47.00.26.001.3.212.71.1.00.002.7.31.00
Предикатив.00.10.84.26.00.00.00.00.00.05.16.26.00.00.00.00.00
Предлог91181.91014.101.7.26.16.00.00.00.00.00.051.5.00
Союз126.6264.81.9.00.21.103.8.104.4.26.05.003.6.42.16
Междометие.00.05.16.37.00.00.00.00.00.00.00.05.05.00.10.00.00
Вводное слово.05.00.00.00.05.00.00.00.00.00.00.00.00.00.00.00.00
Частица2.31.427.94.63.00.00.00.57.001.31.00.00.37.16.05
Причастие4.4.94.63.16.05.00.10.00.10.001.7.26.00.00.00.05.00
Деепричастие.21.00.21.00.00.00.00.00.00.00.31.00.00.00.00.00.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное1724272831333131333332313233353231403040
Прилагательное67.46.77.18.68.19.19.58.89.8108.31111117.612118.213
Глагол2425273024252224222324222323222119192018
Местоимение-существительное2216128.96.75.25.95.43.74.63.94.83.84.743.34.33.14.64.2
Местоименное прилагательное24.34.14.23.83.85.54.54.83.8333.24.23.76.12.74.85.94.2
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.10.00.10.00.00.00.00.00.00.30.00
Числительное (колич-ое).501.40.701.1.701.60.90.70.701.3.60.40.401.2.50.301.3.00
Числительное (порядковое).10.10.20.00.10.00.10.00.10.00.10.00.00.00.00.00.00.00.00.00
Наречие7.65.73.82.33.13.12.53.32.22.84.4332.22.63.52.33.122.5
Предикатив.60.30.30.10.00.00.20.20.00.20.00.10.00.10.00.20.20.00.30.40
Предлог119.11110131012111211121413147.91618111611
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз4.62.52.64.15.17.48.27.58.27.87.28.16.86.78.26.77.148.64.6
Междометие1.2.00.00.00.00.00.00.00.00.00.10.00.00.00.00.00.00.00.00.00
Вводное слово.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица3.14.84.73.43.22.82.522.721.432.21.82.81.21.822.3.80
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие.50.30.40.70.50.60.40.80.70.901.21.31.302.1.801.62.311.2
Деепричастие.30.00.10.00.00.00.10.00.10.00.00.00.00.00.00.40.00.00.00.00

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая120.51
          .    точка95.30
          -    тире56.40
          !    восклицательный знак7.24
          ?    вопросительный знак12.30
          ...    многоточие2.68
          !..    воскл. знак с многоточием0.00
          ?..    вопр. знак с многоточием0.00
          !!!    тройной воскл. знак0.03
          ?!    вопр. знак с восклицанием0.82
          "    кавычка5.59
          ()    скобки0.11
          :    двоеточие8.80
          ;    точка с запятой0.05




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Андрей Саломатов
 49
2. Кир Булычев
 40
3. Александр Житинский
 40
4. Алексей Лукьянов
 39
5. Аркадий и Борис Стругацкие
 39
6. Сергей Абрамов
 38
7. Далия Трускиновская
 38
8. Павел Шумил
 37
9. Алекс Орлов
 37
10. Владимир Кунин
 37
...смотреть весь список >>
⇑ Наверх