FantLab ru



  Лингвистический анализ произведения
Произведение: Арес
Автор: Даниил Аксёнов
Дата проведения анализа: 24 июля 2018 года

Общая статистика

Длина текста, знаков:610148
Слов в произведении (СВП):88573
Приблизительно страниц:311
Средняя длина слова, знаков:5.3
Средняя длина предложения (СДП), знаков:54.5
СДП авторского текста, знаков:72.33
СДП диалога, знаков:38.85
Доля диалогов в тексте:38.1%
Доля авторского текста в диалогах:9.98%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 6620 (в страницах — примерно 3; начинается где-то на 141-й)

Активный словарный запас

Использовано уникальных слов:9098
Активный словарный запас (АСЗ):8570
Активный несловарный запас (АНСЗ):528
Удельный АСЗ на 3000 слов текста:1140.95
Удельный АСЗ на 10000 слов текста:2573.91 —> 7605-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1284) приходится приблизительно на 114-ю страницу текста.
Миниимальное значение УАСЗ-3000 (990) приходится приблизительно на 35-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:21687 (24.48% от СВП)
Определённых частей речи (ОЧР), слов:66886 (75.52% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное18325 (27.40%)
          Прилагательное5536 (8.28%)
          Глагол15515 (23.20%)
          Местоимение-существительное4592 (6.87%)
          Местоименное прилагательное3119 (4.66%)
          Местоимение-предикатив9 (0.01%)
          Числительное (количественное)344 (0.51%)
          Числительное (порядковое)112 (0.17%)
          Наречие2407 (3.60%)
          Предикатив201 (0.30%)
          Предлог6486 (9.70%)
          Союз2982 (4.46%)
          Междометие72 (0.11%)
          Вводное слово36 (0.05%)
          Частица2689 (4.02%)
          Причастие876 (1.31%)
          Деепричастие35 (0.05%)
Служебных слов:19985 (29.88%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное5318716.511.00.95.279.783424.05.34107.3.29
Прилагательное695.4171.1.44.00.12.00.78.022.63.9.00.02.971.2.02
Глагол5724291211.121.7.2711.44549.1.12.077.74.07
Местоимение-существительное5.65.3363.22.3.00.24.054.224.92.00.029.2.53.07
Местоименное прилагательное327.37.31.91.5.00.19.241.271.2.29.02.021.8.44.00
Местоимение-предикатив.02.00.10.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)3.6.75.48.29.07.00.22.00.24.00.27.02.00.00.05.12.00
Числительное (порядковое)1.4.12.19.02.00.00.00.00.05.00.10.00.00.00.02.05.00
Наречие2.86.3143.31.1.00.05.001.2.322.71.3.02.003.51.05
Предикатив.02.272.05.05.00.00.00.10.00.15.22.00.00.10.00.00
Предлог7418.871320.001.2.75.27.00.02.00.00.00.001.7.00
Союз116193.31.6.02.24.122.8.223.6.65.00.024.5.46.07
Междометие.17.05.29.07.02.00.00.00.02.00.02.05.00.00.07.02.00
Вводное слово.12.07.15.10.02.00.00.00.05.00.05.05.00.00.00.00.00
Частица2.32.13811.00.02.072.3.002.2.17.00.00.61.46.02
Причастие6.31.8.80.48.48.00.05.05.46.003.7.39.00.00.17.15.00
Деепричастие.27.10.10.02.02.00.00.00.00.00.12.00.00.00.00.00.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное2324242830323132313231323433323434343436
Прилагательное6.47.17.58.19.29.78.88.9109.89.4119.3119.112119.7109.7
Глагол1830322826232424232223212120232021202020
Местоимение-существительное17117.776.15.455.45.24.14.74.44.94.24.53.54.52.93.72.8
Местоименное прилагательное4.45.34.25.15.254.64.55.16.6554.34.655.255.74.66.3
Местоимение-предикатив.00.00.00.00.10.00.00.00.00.00.00.10.00.00.00.00.00.00.00.00
Числительное (колич-ое).90.60.60.50.60.60.60.60.40.50.30.40.40.60.10.20.50.90.20.40
Числительное (порядковое).20.20.20.20.20.10.20.10.20.20.20.20.30.00.30.20.20.00.00.00
Наречие6.45.44.132.93.43.23.33.33.73.12.63.13343.52.73.33.5
Предикатив.50.40.40.40.30.20.30.20.20.30.30.20.20.20.10.20.20.50.00.00
Предлог106.79.5119.9101112119.912121212121112111312
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз8.63.32.93.44554.95.24.855.25.15.75.14.43.95.15.74.8
Междометие.90.10.00.00.00.00.00.00.00.00.00.00.00.10.00.00.00.00.00.00
Вводное слово.20.00.10.10.10.00.00.10.10.00.10.10.00.00.00.00.00.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица2.865.65.13.93.94.14.13.44.33.84.433.43.63.83.13.53.13
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие.40.801.21.31.41.31.61.31.81.51.92.421.721.3.903.82.21.5
Деепричастие.00.00.00.00.10.00.10.10.10.10.10.00.10.10.10.20.00.00.20.00

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая122.38
          .    точка96.24
          -    тире27.55
          !    восклицательный знак8.58
          ?    вопросительный знак14.99
          ...    многоточие4.82
          !..    воскл. знак с многоточием0.00
          ?..    вопр. знак с многоточием0.01
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием1.20
          "    кавычка7.10
          ()    скобки0.08
          :    двоеточие2.45
          ;    точка с запятой0.01




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Даниил Аксёнов
 49
2. Вера Ковальчук
 42
3. Николай Романецкий
 41  – ожидает пересчёта
4. Игорь Пронин
 41  – ожидает пересчёта
5. Александр Мазин
 41
6. Александр Рудазов
 41  – ожидает пересчёта
7. Андрей Валентинов
 41  – ожидает пересчёта
8. Алексей Калугин
 41  – ожидает пересчёта
9. Дмитрий Янковский
 40
10. Елизавета Шумская
 40
...смотреть весь список >>
⇑ Наверх