fantlab ru



  Лингвистический анализ произведения
Произведение: Девушка в белом с огромной собакой
Автор: Андрей Саломатов
Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:126219
Слов в произведении (СВП):18542
Приблизительно страниц:63
Средняя длина слова, знаков:5.2
Средняя длина предложения (СДП), знаков:65.61
СДП авторского текста, знаков:88.62
СДП диалога, знаков:43.31
Доля диалогов в тексте:33.7%
Доля авторского текста в диалогах:12.74%

Активный словарный запас

Использовано уникальных слов:4221
Активный словарный запас (АСЗ):4088
Активный несловарный запас (АНСЗ):133
Удельный АСЗ на 3000 слов текста:1197.78
Удельный АСЗ на 10000 слов текста:2835.92 —> 5884-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:4209 (22.70% от СВП)
Определённых частей речи (ОЧР), слов:14333 (77.30% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное4549 (31.74%)
          Прилагательное1582 (11.04%)
          Глагол3501 (24.43%)
          Местоимение-существительное1263 (8.81%)
          Местоименное прилагательное828 (5.78%)
          Местоимение-предикатив5 (0.03%)
          Числительное (количественное)250 (1.74%)
          Числительное (порядковое)31 (0.22%)
          Наречие870 (6.07%)
          Предикатив136 (0.95%)
          Предлог1841 (12.84%)
          Союз1680 (11.72%)
          Междометие275 (1.92%)
          Вводное слово43 (0.30%)
          Частица1113 (7.77%)
          Причастие240 (1.67%)
          Деепричастие54 (0.38%)
Служебных слов:7102 (49.55%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая128.25
          .    точка87.21
          -    тире31.28
          !    восклицательный знак1.89
          ?    вопросительный знак8.68
          ...    многоточие1.56
          !..    воскл. знак с многоточием0.00
          ?..    вопр. знак с многоточием0.00
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.27
          "    кавычка9.44
          ()    скобки0.00
          :    двоеточие6.63
          ;    точка с запятой0.11




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Андрей Саломатов
 36
2. Борис Акунин
 33
3. Сергей Волков
 32
4. Аркадий и Борис Стругацкие
 32
5. Олег Верещагин
 32
6. Елена Хаецкая
 32
7. Иван Сербин
 32
8. Александр Варго
 32
9. Виктор Косенков
 32
10. Данил Корецкий
 32
...смотреть весь список >>
⇑ Наверх