fantlab ru



  Лингвистический анализ произведения
Произведение: Ожог
Автор: Василий Аксёнов
Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:959985
Слов в произведении (СВП):137064
Приблизительно страниц:497
Средняя длина слова, знаков:5.47
Средняя длина предложения (СДП), знаков:73.44
СДП авторского текста, знаков:99.52
СДП диалога, знаков:45.67
Доля диалогов в тексте:30.27%
Доля авторского текста в диалогах:9.09%

Активный словарный запас

Использовано уникальных слов:19012
Активный словарный запас (АСЗ):16215
Активный несловарный запас (АНСЗ):2797
Удельный АСЗ на 3000 слов текста:1402.26
Удельный АСЗ на 10000 слов текста:3535.82 —> 263-е место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста:16073.80

Части речи

Неопределённых частей речи (НОЧР), слов:27195 (19.84% от СВП)
Определённых частей речи (ОЧР), слов:109869 (80.16% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное38357 (34.91%)
          Прилагательное14538 (13.23%)
          Глагол21432 (19.51%)
          Местоимение-существительное9413 (8.57%)
          Местоименное прилагательное5691 (5.18%)
          Местоимение-предикатив22 (0.02%)
          Числительное (количественное)1244 (1.13%)
          Числительное (порядковое)286 (0.26%)
          Наречие5446 (4.96%)
          Предикатив789 (0.72%)
          Предлог13934 (12.68%)
          Союз9912 (9.02%)
          Междометие1699 (1.55%)
          Вводное слово334 (0.30%)
          Частица6734 (6.13%)
          Причастие1970 (1.79%)
          Деепричастие258 (0.23%)
Служебных слов:47997 (43.69%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая145.95
          .    точка58.90
          -    тире24.48
          !    восклицательный знак18.68
          ?    вопросительный знак12.22
          ...    многоточие6.48
          !..    воскл. знак с многоточием0.08
          ?..    вопр. знак с многоточием0.13
          !!!    тройной воскл. знак0.04
          ?!    вопр. знак с восклицанием0.23
          "    кавычка18.91
          ()    скобки0.54
          :    двоеточие4.18
          ;    точка с запятой0.23




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Василий Аксёнов
 54
2. Сергей Волков
 42
3. Михаил Зайцев
 41
4. Борис Акунин
 41
5. Александр и Людмила Белаш
 41
6. Андрей Ерпылев
 40
7. Александр Сивинских
 40
8. Александр Зорич
 40
9. Сергей Панарин
 39
10. Генри Лайон Олди
 39
...смотреть весь список >>
⇑ Наверх