fantlab ru



  Лингвистический анализ произведения
Произведение: Пламя изменений
Автор: Алексей Олейников
Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:477391
Слов в произведении (СВП):68962
Приблизительно страниц:240
Средняя длина слова, знаков:5.25
Средняя длина предложения (СДП), знаков:55.97
СДП авторского текста, знаков:71.88
СДП диалога, знаков:43.06
Доля диалогов в тексте:42.64%
Доля авторского текста в диалогах:10.12%

Активный словарный запас

Использовано уникальных слов:9541
Активный словарный запас (АСЗ):8991
Активный несловарный запас (АНСЗ):550
Удельный АСЗ на 3000 слов текста:1302.99
Удельный АСЗ на 10000 слов текста:3071.22 —> 2763-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:14489 (21.01% от СВП)
Определённых частей речи (ОЧР), слов:54473 (78.99% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное18257 (33.52%)
          Прилагательное5747 (10.55%)
          Глагол13153 (24.15%)
          Местоимение-существительное5558 (10.20%)
          Местоименное прилагательное2979 (5.47%)
          Местоимение-предикатив4 (0.01%)
          Числительное (количественное)731 (1.34%)
          Числительное (порядковое)164 (0.30%)
          Наречие2734 (5.02%)
          Предикатив594 (1.09%)
          Предлог6320 (11.60%)
          Союз4153 (7.62%)
          Междометие943 (1.73%)
          Вводное слово161 (0.30%)
          Частица3702 (6.80%)
          Причастие945 (1.73%)
          Деепричастие154 (0.28%)
Служебных слов:23974 (44.01%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая139.00
          .    точка92.08
          -    тире44.65
          !    восклицательный знак7.55
          ?    вопросительный знак13.96
          ...    многоточие7.67
          !..    воскл. знак с многоточием0.01
          ?..    вопр. знак с многоточием0.06
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием1.46
          "    кавычка4.94
          ()    скобки0.19
          :    двоеточие3.32
          ;    точка с запятой0.00




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Алексей Олейников
 55
2. Кирилл Бенедиктов
 40
3. Сергей Волков
 39
4. Диана Удовиченко
 39
5. Марина и Сергей Дяченко
 39
6. Денис Чекалов
 39
7. Ольга Онойко
 39
8. Дмитрий Емец
 39
9. Марианна Алфёрова
 39
10. Александр и Людмила Белаш
 39
...смотреть весь список >>
⇑ Наверх