fantlab ru



  Лингвистический анализ произведения
Произведение: Лимпопо
Автор: Татьяна Толстая
Дата проведения анализа: 17 сентября 2022 года

Общая статистика

Длина текста, знаков:100562
Слов в произведении (СВП):14597
Приблизительно страниц:52
Средняя длина слова, знаков:5.4
Средняя длина предложения (СДП), знаков:145.03
СДП авторского текста, знаков:214.94
СДП диалога, знаков:57.53
Доля диалогов в тексте:17.76%
Доля авторского текста в диалогах:12.16%

Активный словарный запас

Использовано уникальных слов:4976
Активный словарный запас (АСЗ):4745
Активный несловарный запас (АНСЗ):231
Удельный АСЗ на 3000 слов текста:1505.03
Удельный АСЗ на 10000 слов текста:3826.18 —> 34-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:3087 (21.15% от СВП)
Определённых частей речи (ОЧР), слов:11510 (78.85% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное4185 (36.36%)
          Прилагательное1539 (13.37%)
          Глагол2157 (18.74%)
          Местоимение-существительное728 (6.32%)
          Местоименное прилагательное561 (4.87%)
          Местоимение-предикатив4 (0.03%)
          Числительное (количественное)122 (1.06%)
          Числительное (порядковое)23 (0.20%)
          Наречие551 (4.79%)
          Предикатив70 (0.61%)
          Предлог1365 (11.86%)
          Союз1448 (12.58%)
          Междометие175 (1.52%)
          Вводное слово27 (0.23%)
          Частица861 (7.48%)
          Причастие377 (3.28%)
          Деепричастие39 (0.34%)
Служебных слов:5208 (45.25%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая192.16
          .    точка32.34
          -    тире33.23
          !    восклицательный знак8.77
          ?    вопросительный знак5.00
          ...    многоточие2.88
          !..    воскл. знак с многоточием0.89
          ?..    вопр. знак с многоточием0.34
          !!!    тройной воскл. знак0.07
          ?!    вопр. знак с восклицанием0.14
          "    кавычка8.08
          ()    скобки1.23
          :    двоеточие8.70
          ;    точка с запятой6.37




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


Внимание! У Татьяны Толстой пока не сформирован лингвистический паспорт, а значит этого автора в списке результатов не будет в любом случае. Проверка авторства для данного произведения не может претендовать на верный результат.

АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Василий Аксёнов
 31
2. Александр Бушков
 30
3. Сергей Волков
 30
4. О'Санчес
 30
5. Лев Вершинин
 30
6. Андрей Белянин
 29
7. Александр и Людмила Белаш
 29
8. Андрей Ерпылев
 29
9. Генри Лайон Олди
 29
10. Михаил Ахманов
 29
...смотреть весь список >>
⇑ Наверх