fantlab ru



  Лингвистический анализ произведения
Произведение: С викингами на Свальбард
Автор: Мария Семёнова
Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:239451
Слов в произведении (СВП):37022
Приблизительно страниц:125
Средняя длина слова, знаков:5.12
Средняя длина предложения (СДП), знаков:77.49
СДП авторского текста, знаков:86.26
СДП диалога, знаков:52.9
Доля диалогов в тексте:17.98%
Доля авторского текста в диалогах:8.03%

Активный словарный запас

Использовано уникальных слов:5906
Активный словарный запас (АСЗ):5579
Активный несловарный запас (АНСЗ):327
Удельный АСЗ на 3000 слов текста:1244.45
Удельный АСЗ на 10000 слов текста:2775.76 —> 6825-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:7944 (21.46% от СВП)
Определённых частей речи (ОЧР), слов:29078 (78.54% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное8611 (29.61%)
          Прилагательное3075 (10.57%)
          Глагол7296 (25.09%)
          Местоимение-существительное2266 (7.79%)
          Местоименное прилагательное1384 (4.76%)
          Местоимение-предикатив5 (0.02%)
          Числительное (количественное)286 (0.98%)
          Числительное (порядковое)54 (0.19%)
          Наречие1983 (6.82%)
          Предикатив265 (0.91%)
          Предлог3562 (12.25%)
          Союз3227 (11.10%)
          Междометие537 (1.85%)
          Вводное слово74 (0.25%)
          Частица2190 (7.53%)
          Причастие741 (2.55%)
          Деепричастие177 (0.61%)
Служебных слов:13422 (46.16%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая118.61
          .    точка63.12
          -    тире11.61
          !    восклицательный знак4.43
          ?    вопросительный знак2.03
          ...    многоточие10.72
          !..    воскл. знак с многоточием2.40
          ?..    вопр. знак с многоточием0.59
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.00
          "    кавычка0.62
          ()    скобки0.00
          :    двоеточие8.21
          ;    точка с запятой1.32




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Мария Семёнова
 42
2. Анна Гурова
 33
3. Олег Верещагин
 33
4. Марина и Сергей Дяченко
 33
5. Елена Хаецкая
 33
6. Виктор Ночкин
 32
7. Галина Романова
 32
8. Елизавета Дворецкая
 32
9. Александр Мазин
 32
10. Дмитрий Скирюк
 32
...смотреть весь список >>
⇑ Наверх