fantlab ru



  Лингвистический анализ произведения
Произведение: Помор
Автор: Валерий Большаков
Дата проведения анализа: 19 сентября 2022 года

Общая статистика

Длина текста, знаков:454443
Слов в произведении (СВП):64758
Приблизительно страниц:231
Средняя длина слова, знаков:5.38
Средняя длина предложения (СДП), знаков:56.39
СДП авторского текста, знаков:79.73
СДП диалога, знаков:36.82
Доля диалогов в тексте:35.7%
Доля авторского текста в диалогах:9.08%

Активный словарный запас

Использовано уникальных слов:12107
Активный словарный запас (АСЗ):10660
Активный несловарный запас (АНСЗ):1447
Удельный АСЗ на 3000 слов текста:1490.12
Удельный АСЗ на 10000 слов текста:3663.64 —> 114-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:12612 (19.48% от СВП)
Определённых частей речи (ОЧР), слов:52146 (80.52% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное17016 (32.63%)
          Прилагательное5625 (10.79%)
          Глагол12686 (24.33%)
          Местоимение-существительное3549 (6.81%)
          Местоименное прилагательное1987 (3.81%)
          Местоимение-предикатив13 (0.02%)
          Числительное (количественное)717 (1.37%)
          Числительное (порядковое)122 (0.23%)
          Наречие2554 (4.90%)
          Предикатив343 (0.66%)
          Предлог6216 (11.92%)
          Союз4822 (9.25%)
          Междометие749 (1.44%)
          Вводное слово76 (0.15%)
          Частица3038 (5.83%)
          Причастие1115 (2.14%)
          Деепричастие284 (0.54%)
Служебных слов:20734 (39.76%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая132.77
          .    точка77.86
          -    тире45.97
          !    восклицательный знак19.95
          ?    вопросительный знак12.11
          ...    многоточие14.27
          !..    воскл. знак с многоточием0.09
          ?..    вопр. знак с многоточием0.20
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.49
          "    кавычка15.92
          ()    скобки0.12
          :    двоеточие3.72
          ;    точка с запятой0.06




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Валерий Большаков
 50
2. Сергей Волков
 39
3. Ольга Громыко
 38
4. Михаил Зайцев
 37
5. Александр и Людмила Белаш
 37
6. Юрий Гаврюченков
 37
7. Владислав Русанов
 37
8. Сергей Панарин
 36
9. Алина Илларионова
 36
10. Александр Сивинских
 36
...смотреть весь список >>
⇑ Наверх