FantLab ru



  Лингвистический анализ произведения
Произведение: Имею топор - готов путешествовать
Автор: Евгений Шепельский
Дата проведения анализа: 25 июля 2018 года

Общая статистика

Длина текста, знаков:588221
Слов в произведении (СВП):89793
Приблизительно страниц:313
Средняя длина слова, знаков:5.26
Средняя длина предложения (СДП), знаков:53.15
СДП авторского текста, знаков:53.37
СДП диалога, знаков:40.97
Доля диалогов в тексте:1.37%
Доля авторского текста в диалогах:4.88%

Активный словарный запас

Использовано уникальных слов:13205
Активный словарный запас (АСЗ):11571
Активный несловарный запас (АНСЗ):1634
Удельный АСЗ на 3000 слов текста:1394.01
Удельный АСЗ на 10000 слов текста:3381.61 —> 572-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:17471 (19.46% от СВП)
Определённых частей речи (ОЧР), слов:72322 (80.54% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное20377 (28.18%)
          Прилагательное6345 (8.77%)
          Глагол15251 (21.09%)
          Местоимение-существительное6597 (9.12%)
          Местоименное прилагательное2380 (3.29%)
          Местоимение-предикатив4 (0.01%)
          Числительное (количественное)460 (0.64%)
          Числительное (порядковое)80 (0.11%)
          Наречие1840 (2.54%)
          Предикатив89 (0.12%)
          Предлог7139 (9.87%)
          Союз2978 (4.12%)
          Междометие181 (0.25%)
          Вводное слово18 (0.02%)
          Частица1972 (2.73%)
          Причастие869 (1.20%)
          Деепричастие73 (0.10%)
Служебных слов:21269 (29.41%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая120.67
          .    точка83.88
          -    тире22.56
          !    восклицательный знак18.12
          ?    вопросительный знак10.12
          ...    многоточие11.78
          !..    воскл. знак с многоточием0.43
          ?..    вопр. знак с многоточием0.12
          !!!    тройной воскл. знак0.06
          ?!    вопр. знак с восклицанием0.00
          "    кавычка6.74
          ()    скобки2.03
          :    двоеточие5.43
          ;    точка с запятой0.81




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Евгений Шепельский
 56
2. Генри Лайон Олди
 45  – ожидает пересчёта
3. Аркадий и Борис Стругацкие
 44
4. Сергей Волков
 44
5. Сергей Лукьяненко
 44
6. Андрей Белянин
 43
7. Александр Житинский
 43
8. Марина и Сергей Дяченко
 43
9. Андрей Левицкий
 43
10. Валерий Алексеев
 43
...смотреть весь список >>
⇑ Наверх