FantLab ru



  Лингвистический анализ произведения
Произведение: Блюз чёрной собаки
Автор: Дмитрий Скирюк
Дата проведения анализа: 23 июля 2018 года

Общая статистика

Длина текста, знаков:664045
Слов в произведении (СВП):99397
Приблизительно страниц:335
Средняя длина слова, знаков:5.08
Средняя длина предложения (СДП), знаков:53.53
СДП авторского текста, знаков:74.83
СДП диалога, знаков:35.3
Доля диалогов в тексте:35.72%
Доля авторского текста в диалогах:8.18%

Активный словарный запас

Использовано уникальных слов:13323
Активный словарный запас (АСЗ):11582
Активный несловарный запас (АНСЗ):1741
Удельный АСЗ на 3000 слов текста:1261.82
Удельный АСЗ на 10000 слов текста:3069.51 —> 2396-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:22122 (22.26% от СВП)
Определённых частей речи (ОЧР), слов:77275 (77.74% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное20082 (25.99%)
          Прилагательное5842 (7.56%)
          Глагол16989 (21.99%)
          Местоимение-существительное7001 (9.06%)
          Местоименное прилагательное2812 (3.64%)
          Местоимение-предикатив14 (0.02%)
          Числительное (количественное)645 (0.83%)
          Числительное (порядковое)158 (0.20%)
          Наречие2634 (3.41%)
          Предикатив139 (0.18%)
          Предлог7598 (9.83%)
          Союз3901 (5.05%)
          Междометие94 (0.12%)
          Вводное слово21 (0.03%)
          Частица2771 (3.59%)
          Причастие712 (0.92%)
          Деепричастие31 (0.04%)
Служебных слов:24212 (31.33%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая128.02
          .    точка88.11
          -    тире35.64
          !    восклицательный знак6.62
          ?    вопросительный знак19.16
          ...    многоточие11.25
          !..    воскл. знак с многоточием0.18
          ?..    вопр. знак с многоточием0.06
          !!!    тройной воскл. знак0.09
          ?!    вопр. знак с восклицанием0.39
          "    кавычка23.58
          ()    скобки1.57
          :    двоеточие8.15
          ;    точка с запятой0.84




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Леонид Каганов
 48
2. Эдуард Веркин
 47
3. Дмитрий Скирюк
 46
4. Олег Дивов
 46
5. Аркадий и Борис Стругацкие
 46
6. Алексей Лукьянов
 46
7. Сергей Лукьяненко
 46
8. Валерий Алексеев
 45
9. Константин Сергиенко
 44
10. Мария Галина
 44
...смотреть весь список >>
⇑ Наверх