FantLab ru



  Лингвистический анализ произведения
Произведение: Дикий Феникс
Автор: Руслан Мельников
Дата проведения анализа: 25 июля 2018 года

Общая статистика

Длина текста, знаков:635516
Слов в произведении (СВП):87710
Приблизительно страниц:329
Средняя длина слова, знаков:5.66
Средняя длина предложения (СДП), знаков:47.54
СДП авторского текста, знаков:52.44
СДП диалога, знаков:40.14
Доля диалогов в тексте:33.67%
Доля авторского текста в диалогах:9.15%

Активный словарный запас

Использовано уникальных слов:10473
Активный словарный запас (АСЗ):9625
Активный несловарный запас (АНСЗ):848
Удельный АСЗ на 3000 слов текста:1236.96
Удельный АСЗ на 10000 слов текста:2891.00 —> 4311-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:18876 (21.52% от СВП)
Определённых частей речи (ОЧР), слов:68834 (78.48% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное22296 (32.39%)
          Прилагательное6631 (9.63%)
          Глагол13791 (20.04%)
          Местоимение-существительное3279 (4.76%)
          Местоименное прилагательное2655 (3.86%)
          Местоимение-предикатив8 (0.01%)
          Числительное (количественное)282 (0.41%)
          Числительное (порядковое)118 (0.17%)
          Наречие2158 (3.14%)
          Предикатив169 (0.25%)
          Предлог7158 (10.40%)
          Союз3469 (5.04%)
          Междометие41 (0.06%)
          Вводное слово10 (0.01%)
          Частица2607 (3.79%)
          Причастие1765 (2.56%)
          Деепричастие28 (0.04%)
Служебных слов:19227 (27.93%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая95.03
          .    точка117.14
          -    тире35.88
          !    восклицательный знак7.26
          ?    вопросительный знак13.53
          ...    многоточие9.81
          !..    воскл. знак с многоточием0.25
          ?..    вопр. знак с многоточием0.13
          !!!    тройной воскл. знак0.02
          ?!    вопр. знак с восклицанием0.76
          "    кавычка35.55
          ()    скобки0.23
          :    двоеточие4.53
          ;    точка с запятой0.01




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Руслан Мельников
 50
2. Александр Бушков
 42
3. Сергей Лукьяненко
 42
4. Дмитрий Янковский
 42
5. Александр Тюрин
 42
6. Святослав Логинов
 42
7. [Для текстов по лингвоанализу]
 42
8. Владимир Васильев
 41
9. Вячеслав Шалыгин
 41
10. Андрей Столяров
 41
...смотреть весь список >>
⇑ Наверх