fantlab ru



  Лингвистический анализ произведения
Произведение: Войти в образ
Автор: Генри Лайон Олди
Дата проведения анализа: 19 сентября 2022 года

Общая статистика

Длина текста, знаков:245662
Слов в произведении (СВП):35893
Приблизительно страниц:124
Средняя длина слова, знаков:5.24
Средняя длина предложения (СДП), знаков:67
СДП авторского текста, знаков:86.68
СДП диалога, знаков:42.05
Доля диалогов в тексте:27.86%
Доля авторского текста в диалогах:12.48%

Активный словарный запас

Использовано уникальных слов:7032
Активный словарный запас (АСЗ):6627
Активный несловарный запас (АНСЗ):405
Удельный АСЗ на 3000 слов текста:1288.05
Удельный АСЗ на 10000 слов текста:3063.54 —> 2826-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:7498 (20.89% от СВП)
Определённых частей речи (ОЧР), слов:28395 (79.11% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное9021 (31.77%)
          Прилагательное3490 (12.29%)
          Глагол6313 (22.23%)
          Местоимение-существительное2495 (8.79%)
          Местоименное прилагательное1118 (3.94%)
          Местоимение-предикатив6 (0.02%)
          Числительное (количественное)316 (1.11%)
          Числительное (порядковое)115 (0.41%)
          Наречие1559 (5.49%)
          Предикатив264 (0.93%)
          Предлог3386 (11.92%)
          Союз3203 (11.28%)
          Междометие467 (1.64%)
          Вводное слово92 (0.32%)
          Частица1858 (6.54%)
          Причастие1085 (3.82%)
          Деепричастие85 (0.30%)
Служебных слов:12710 (44.76%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая123.76
          .    точка73.11
          -    тире38.53
          !    восклицательный знак6.49
          ?    вопросительный знак8.22
          ...    многоточие20.76
          !..    воскл. знак с многоточием1.78
          ?..    вопр. знак с многоточием1.14
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием2.42
          "    кавычка5.24
          ()    скобки0.25
          :    двоеточие1.89
          ;    точка с запятой5.13




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Генри Лайон Олди
 38
2. Сергей Волков
 38
3. Дмитрий Скирюк
 37
4. Марина и Сергей Дяченко
 37
5. Олег Верещагин
 37
6. Лев Вершинин
 36
7. Данил Корецкий
 36
8. Диана Удовиченко
 36
9. Андрей Ерпылев
 36
10. Zотов
 36
...смотреть весь список >>
⇑ Наверх