FantLab ru



  Лингвистический анализ произведения
Произведение: Медная луна
Автор: Сергей Синякин
Дата проведения анализа: 13 сентября 2019 года

Общая статистика

Длина текста, знаков:92256
Слов в произведении (СВП):13156
Приблизительно страниц:46
Средняя длина слова, знаков:5.33
Средняя длина предложения (СДП), знаков:66.49
СДП авторского текста, знаков:92.58
СДП диалога, знаков:49.07
Доля диалогов в тексте:44.42%
Доля авторского текста в диалогах:11.3%

Активный словарный запас

Использовано уникальных слов:3915
Активный словарный запас (АСЗ):3671
Активный несловарный запас (АНСЗ):244
Удельный АСЗ на 3000 слов текста:1327.86
Удельный АСЗ на 10000 слов текста:3194.53 —> 1413-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:2595 (19.72% от СВП)
Определённых частей речи (ОЧР), слов:10561 (80.28% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное3165 (29.97%)
          Прилагательное1202 (11.38%)
          Глагол2255 (21.35%)
          Местоимение-существительное540 (5.11%)
          Местоименное прилагательное413 (3.91%)
          Местоимение-предикатив5 (0.05%)
          Числительное (количественное)39 (0.37%)
          Числительное (порядковое)13 (0.12%)
          Наречие227 (2.15%)
          Предикатив20 (0.19%)
          Предлог1092 (10.34%)
          Союз507 (4.80%)
          Междометие13 (0.12%)
          Вводное слово1 (0.01%)
          Частица364 (3.45%)
          Причастие151 (1.43%)
          Деепричастие2 (0.02%)
Служебных слов:2935 (27.79%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая131.95
          .    точка68.71
          -    тире43.48
          !    восклицательный знак18.17
          ?    вопросительный знак14.67
          ...    многоточие2.05
          !..    воскл. знак с многоточием0.00
          ?..    вопр. знак с многоточием0.00
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.08
          "    кавычка2.89
          ()    скобки0.08
          :    двоеточие2.20
          ;    точка с запятой0.00




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Сергей Синякин
 36
2. Святослав Логинов
 35
3. Генри Лайон Олди
 33  – ожидает пересчёта
4. Михаил Успенский
 33
5. Елена Хаецкая
 33
6. [Для текстов по лингвоанализу]
 33
7. Андрей Валентинов
 33
8. Юрий Никитин
 32
9. Александр Бушков
 32
10. Сергей Шведов
 32
...смотреть весь список >>
⇑ Наверх