fantlab ru



  Лингвистический анализ произведения
Произведение: Западня. Шельф
Автор: Карина Шаинян
Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:369845
Слов в произведении (СВП):53535
Приблизительно страниц:185
Средняя длина слова, знаков:5.22
Средняя длина предложения (СДП), знаков:66.48
СДП авторского текста, знаков:82.15
СДП диалога, знаков:46.23
Доля диалогов в тексте:30.42%
Доля авторского текста в диалогах:14.84%

Активный словарный запас

Использовано уникальных слов:7329
Активный словарный запас (АСЗ):7103
Активный несловарный запас (АНСЗ):226
Удельный АСЗ на 3000 слов текста:1207.96
Удельный АСЗ на 10000 слов текста:2733.92 —> 7509-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:11941 (22.31% от СВП)
Определённых частей речи (ОЧР), слов:41594 (77.69% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное13718 (32.98%)
          Прилагательное4608 (11.08%)
          Глагол11138 (26.78%)
          Местоимение-существительное3924 (9.43%)
          Местоименное прилагательное1828 (4.39%)
          Местоимение-предикатив8 (0.02%)
          Числительное (количественное)397 (0.95%)
          Числительное (порядковое)67 (0.16%)
          Наречие2489 (5.98%)
          Предикатив419 (1.01%)
          Предлог4925 (11.84%)
          Союз4229 (10.17%)
          Междометие822 (1.98%)
          Вводное слово120 (0.29%)
          Частица3414 (8.21%)
          Причастие794 (1.91%)
          Деепричастие145 (0.35%)
Служебных слов:19415 (46.68%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая137.31
          .    точка81.24
          -    тире42.18
          !    восклицательный знак4.18
          ?    вопросительный знак10.03
          ...    многоточие12.72
          !..    воскл. знак с многоточием0.04
          ?..    вопр. знак с многоточием0.06
          !!!    тройной воскл. знак0.02
          ?!    вопр. знак с восклицанием0.11
          "    кавычка6.56
          ()    скобки0.19
          :    двоеточие2.99
          ;    точка с запятой4.63




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Карина Шаинян
 50
2. Анна Гурова
 38
3. Альбина Нури
 38
4. Марина и Сергей Дяченко
 38
5. Наталья Колесова
 38
6. Олег Верещагин
 38
7. Александр Матюхин
 38
8. Сергей Давиденко
 38
9. Дмитрий Емец
 38
10. Михаил Тырин
 37
...смотреть весь список >>
⇑ Наверх