fantlab ru



  Лингвистический анализ произведения
Произведение: Варвар, который ошибался
Автор: Евгений Шепельский
Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:470306
Слов в произведении (СВП):71014
Приблизительно страниц:245
Средняя длина слова, знаков:5.22
Средняя длина предложения (СДП), знаков:57.81
СДП авторского текста, знаков:67.95
СДП диалога, знаков:41.83
Доля диалогов в тексте:28.22%
Доля авторского текста в диалогах:4.19%

Активный словарный запас

Использовано уникальных слов:10476
Активный словарный запас (АСЗ):9579
Активный несловарный запас (АНСЗ):897
Удельный АСЗ на 3000 слов текста:1296.59
Удельный АСЗ на 10000 слов текста:3142.52 —> 2039-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:15233 (21.45% от СВП)
Определённых частей речи (ОЧР), слов:55781 (78.55% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное17537 (31.44%)
          Прилагательное6048 (10.84%)
          Глагол13272 (23.79%)
          Местоимение-существительное5993 (10.74%)
          Местоименное прилагательное2657 (4.76%)
          Местоимение-предикатив5 (0.01%)
          Числительное (количественное)643 (1.15%)
          Числительное (порядковое)116 (0.21%)
          Наречие2895 (5.19%)
          Предикатив510 (0.91%)
          Предлог6388 (11.45%)
          Союз5235 (9.38%)
          Междометие1166 (2.09%)
          Вводное слово204 (0.37%)
          Частица3769 (6.76%)
          Причастие920 (1.65%)
          Деепричастие163 (0.29%)
Служебных слов:25580 (45.86%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая122.50
          .    точка83.46
          -    тире25.56
          !    восклицательный знак15.95
          ?    вопросительный знак8.90
          ...    многоточие12.48
          !..    воскл. знак с многоточием0.28
          ?..    вопр. знак с многоточием0.10
          !!!    тройной воскл. знак0.13
          ?!    вопр. знак с восклицанием0.00
          "    кавычка3.22
          ()    скобки2.11
          :    двоеточие4.29
          ;    точка с запятой0.59




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Евгений Шепельский
 62
2. Александр Сивинских
 43
3. Александр Зорич
 43
4. Никита Аверин
 43
5. Александр и Людмила Белаш
 43
6. Илья Крымов
 43
7. Кирилл Бенедиктов
 42
8. Сергей Волков
 42
9. Zотов
 42
10. Альтс Геймер
 42
...смотреть весь список >>
⇑ Наверх