fantlab ru



  Лингвистический анализ произведения
Произведение: Сын погибели
Автор: Владимир Свержин
Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:708298
Слов в произведении (СВП):100786
Приблизительно страниц:353
Средняя длина слова, знаков:5.29
Средняя длина предложения (СДП), знаков:68
СДП авторского текста, знаков:98.95
СДП диалога, знаков:56.21
Доля диалогов в тексте:59.97%
Доля авторского текста в диалогах:9.21%

Активный словарный запас

Использовано уникальных слов:11808
Активный словарный запас (АСЗ):10765
Активный несловарный запас (АНСЗ):1043
Удельный АСЗ на 3000 слов текста:1332.98
Удельный АСЗ на 10000 слов текста:3130.64 —> 2159-е место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста:11738.80

Части речи

Неопределённых частей речи (НОЧР), слов:22882 (22.70% от СВП)
Определённых частей речи (ОЧР), слов:77904 (77.30% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное26247 (33.69%)
          Прилагательное8690 (11.15%)
          Глагол17750 (22.78%)
          Местоимение-существительное7092 (9.10%)
          Местоименное прилагательное4742 (6.09%)
          Местоимение-предикатив8 (0.01%)
          Числительное (количественное)670 (0.86%)
          Числительное (порядковое)111 (0.14%)
          Наречие4230 (5.43%)
          Предикатив778 (1.00%)
          Предлог9237 (11.86%)
          Союз7813 (10.03%)
          Междометие1681 (2.16%)
          Вводное слово178 (0.23%)
          Частица6147 (7.89%)
          Причастие1851 (2.38%)
          Деепричастие239 (0.31%)
Служебных слов:37137 (47.67%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая127.43
          .    точка72.43
          -    тире39.72
          !    восклицательный знак11.32
          ?    вопросительный знак11.64
          ...    многоточие5.73
          !..    воскл. знак с многоточием0.13
          ?..    вопр. знак с многоточием0.07
          !!!    тройной воскл. знак0.04
          ?!    вопр. знак с восклицанием0.67
          "    кавычка5.22
          ()    скобки0.02
          :    двоеточие4.25
          ;    точка с запятой0.06




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Владимир Свержин
 56
2. Александр Зорич
 40
3. Павел Молитвин
 40
4. Наталия Ипатова
 40
5. Александр и Людмила Белаш
 40
6. Наталья Резанова
 40
7. Елена Хаецкая
 39
8. Борис Толчинский
 39
9. Игорь Мерцалов
 39
10. Лев Вершинин
 39
...смотреть весь список >>
⇑ Наверх