fantlab ru



  Лингвистический анализ произведения
Произведение: Колыбельная
Автор: Владимир Данихнов
Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:458632
Слов в произведении (СВП):70729
Приблизительно страниц:245
Средняя длина слова, знаков:5.23
Средняя длина предложения (СДП), знаков:67.64
СДП авторского текста, знаков:67.64
СДП диалога, знаков:0
Доля диалогов в тексте:0%
Доля авторского текста в диалогах:0%

Активный словарный запас

Использовано уникальных слов:8813
Активный словарный запас (АСЗ):8234
Активный несловарный запас (АНСЗ):579
Удельный АСЗ на 3000 слов текста:1195.67
Удельный АСЗ на 10000 слов текста:2772.88 —> 6875-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:14111 (19.95% от СВП)
Определённых частей речи (ОЧР), слов:56618 (80.05% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное18534 (32.74%)
          Прилагательное5097 (9.00%)
          Глагол15032 (26.55%)
          Местоимение-существительное5695 (10.06%)
          Местоименное прилагательное2673 (4.72%)
          Местоимение-предикатив5 (0.01%)
          Числительное (количественное)518 (0.91%)
          Числительное (порядковое)103 (0.18%)
          Наречие2682 (4.74%)
          Предикатив443 (0.78%)
          Предлог7029 (12.41%)
          Союз4978 (8.79%)
          Междометие1347 (2.38%)
          Вводное слово125 (0.22%)
          Частица3428 (6.05%)
          Причастие804 (1.42%)
          Деепричастие151 (0.27%)
Служебных слов:25431 (44.92%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая118.06
          .    точка86.17
          -    тире10.21
          !    восклицательный знак1.50
          ?    вопросительный знак7.41
          ...    многоточие2.02
          !..    воскл. знак с многоточием0.00
          ?..    вопр. знак с многоточием0.00
          !!!    тройной воскл. знак0.01
          ?!    вопр. знак с восклицанием0.31
          "    кавычка6.12
          ()    скобки0.16
          :    двоеточие9.42
          ;    точка с запятой6.08




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Владимир Данихнов
 41
2. Александр Варго
 36
3. Сергей Давиденко
 35
4. Марина и Сергей Дяченко
 35
5. Дмитрий Липскеров
 35
6. Елена Жаринова
 35
7. Олег Синицын
 35
8. Борис Акунин
 34
9. Альбина Нури
 34
10. Анатолий Дроздов
 34
...смотреть весь список >>
⇑ Наверх