fantlab ru



  Лингвистический анализ произведения
Произведение: Двойные мосты Венисаны
Автор: Линор Горалик
Дата проведения анализа: 19 сентября 2022 года

Общая статистика

Длина текста, знаков:178669
Слов в произведении (СВП):26976
Приблизительно страниц:89
Средняя длина слова, знаков:5.02
Средняя длина предложения (СДП), знаков:156.98
СДП авторского текста, знаков:202.74
СДП диалога, знаков:87.22
Доля диалогов в тексте:22.07%
Доля авторского текста в диалогах:21.54%

Активный словарный запас

Использовано уникальных слов:4217
Активный словарный запас (АСЗ):3919
Активный несловарный запас (АНСЗ):298
Удельный АСЗ на 3000 слов текста:1045.98
Удельный АСЗ на 10000 слов текста:2334.95 отсутствует в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:6650 (24.65% от СВП)
Определённых частей речи (ОЧР), слов:20326 (75.35% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное6592 (32.43%)
          Прилагательное2072 (10.19%)
          Глагол4289 (21.10%)
          Местоимение-существительное1841 (9.06%)
          Местоименное прилагательное1249 (6.14%)
          Местоимение-предикатив7 (0.03%)
          Числительное (количественное)289 (1.42%)
          Числительное (порядковое)58 (0.29%)
          Наречие1434 (7.05%)
          Предикатив268 (1.32%)
          Предлог2573 (12.66%)
          Союз2674 (13.16%)
          Междометие500 (2.46%)
          Вводное слово100 (0.49%)
          Частица1680 (8.27%)
          Причастие374 (1.84%)
          Деепричастие42 (0.21%)
Служебных слов:10666 (52.47%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая160.70
          .    точка29.06
          -    тире28.06
          !    восклицательный знак4.34
          ?    вопросительный знак4.26
          ...    многоточие2.97
          !..    воскл. знак с многоточием0.44
          ?..    вопр. знак с многоточием0.11
          !!!    тройной воскл. знак0.04
          ?!    вопр. знак с восклицанием0.19
          "    кавычка12.46
          ()    скобки1.33
          :    двоеточие10.94
          ;    точка с запятой2.19




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Линор Горалик
 38
2. Дмитрий Глуховский
 30
3. Марина и Сергей Дяченко
 29
4. Борис Акунин
 29
5. Сергей Волков
 28
6. Аркадий и Борис Стругацкие
 28
7. Вячеслав Рыбаков
 28
8. Дмитрий Володихин
 28
9. Галина Романова
 28
10. Александр Громов
 28
...смотреть весь список >>
⇑ Наверх