FantLab ru



  Лингвистический анализ произведения
Произведение: Волчья хватка-2
Автор: Сергей Т. Алексеев
Дата проведения анализа: 23 июля 2018 года

Общая статистика

Длина текста, знаков:505019
Слов в произведении (СВП):73384
Приблизительно страниц:259
Средняя длина слова, знаков:5.32
Средняя длина предложения (СДП), знаков:62.03
СДП авторского текста, знаков:130.78
СДП диалога, знаков:34.37
Доля диалогов в тексте:39.83%
Доля авторского текста в диалогах:7.82%

Активный словарный запас

Использовано уникальных слов:10541
Активный словарный запас (АСЗ):9702
Активный несловарный запас (АНСЗ):839
Удельный АСЗ на 3000 слов текста:1301.09
Удельный АСЗ на 10000 слов текста:3131.21 —> 1837-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:15135 (20.62% от СВП)
Определённых частей речи (ОЧР), слов:58249 (79.38% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное16059 (27.57%)
          Прилагательное5227 (8.97%)
          Глагол12420 (21.32%)
          Местоимение-существительное3276 (5.62%)
          Местоименное прилагательное2069 (3.55%)
          Местоимение-предикатив8 (0.01%)
          Числительное (количественное)321 (0.55%)
          Числительное (порядковое)101 (0.17%)
          Наречие2001 (3.44%)
          Предикатив138 (0.24%)
          Предлог6205 (10.65%)
          Союз3655 (6.27%)
          Междометие25 (0.04%)
          Вводное слово28 (0.05%)
          Частица2103 (3.61%)
          Причастие1017 (1.75%)
          Деепричастие22 (0.04%)
Служебных слов:17369 (29.82%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая125.16
          .    точка56.14
          -    тире27.50
          !    восклицательный знак12.09
          ?    вопросительный знак16.15
          ...    многоточие17.85
          !..    воскл. знак с многоточием2.29
          ?..    вопр. знак с многоточием1.38
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.29
          "    кавычка2.63
          ()    скобки0.11
          :    двоеточие6.47
          ;    точка с запятой0.49




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Сергей Т. Алексеев
 54
2. Елена Хаецкая
 45
3. Владимир Васильев
 44
4. Святослав Логинов
 43
5. Аркадий и Борис Стругацкие
 43
6. Сергей Синякин
 43
7. Александр Бушков
 43
8. Борис Акунин
 42  – ожидает пересчёта
9. Николай Романецкий
 42
10. Сергей Абрамов
 42
...смотреть весь список >>
⇑ Наверх