fantlab ru



  Лингвистический анализ произведения
Произведение: Песня песка
Автор: Василий Воронков
Дата проведения анализа: 19 сентября 2022 года

Общая статистика

Длина текста, знаков:491482
Слов в произведении (СВП):73515
Приблизительно страниц:259
Средняя длина слова, знаков:5.31
Средняя длина предложения (СДП), знаков:56.5
СДП авторского текста, знаков:71.93
СДП диалога, знаков:32.36
Доля диалогов в тексте:22.51%
Доля авторского текста в диалогах:5.64%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: знаков, шаг: 1000 знаков)

Активный словарный запас

Использовано уникальных слов:7353
Активный словарный запас (АСЗ):6819
Активный несловарный запас (АНСЗ):534
Удельный АСЗ на 3000 слов текста:1143.69
Удельный АСЗ на 10000 слов текста:2484.11 отсутствует в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (0) приходится приблизительно на 0-ю страницу текста.
Миниимальное значение УАСЗ-3000 (10000000) приходится приблизительно на 0-ю страницу текста.

Части речи

Неопределённых частей речи (НОЧР), слов:16235 (22.08% от СВП)
Определённых частей речи (ОЧР), слов:57280 (77.92% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное18664 (32.58%)
          Прилагательное6617 (11.55%)
          Глагол14272 (24.92%)
          Местоимение-существительное4794 (8.37%)
          Местоименное прилагательное2627 (4.59%)
          Местоимение-предикатив7 (0.01%)
          Числительное (количественное)736 (1.28%)
          Числительное (порядковое)145 (0.25%)
          Наречие3667 (6.40%)
          Предикатив496 (0.87%)
          Предлог7657 (13.37%)
          Союз4785 (8.35%)
          Междометие1341 (2.34%)
          Вводное слово201 (0.35%)
          Частица4043 (7.06%)
          Причастие1270 (2.22%)
          Деепричастие211 (0.37%)
Служебных слов:25666 (44.81%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное38185877.3.001.1813.9831227.47135.9.98
Прилагательное527.5171.1.77.00.58.031.9.294.65.3.52.033.21.9.50
Глагол382021118.6.032.1.1910.8446184.8.479.33.4.60
Местоимение-существительное5.56.3282.91.9.03.76.056.8.644.63.6.48.6810.32.15
Местоименное прилагательное154.87.81.61.00.15.161.6.442.11.4.32.053.2.64.03
Местоимение-предикатив.02.00.02.02.00.00.00.00.00.02.00.00.00.00.00.00.00
Числительное (колич-ое)4.7.581.8.27.13.00.44.35.13.11.82.98.11.02.45.05.00
Числительное (порядковое)1.1.06.29.05.03.00.08.03.00.00.06.23.00.00.19.03.00
Наречие44.4204.81.03.50.003.4.824.82.3.76.084.5.74.13
Предикатив.58.481.8.63.23.00.05.00.48.21.47.45.06.02.47.03.00
Предлог66203612.002.4.89.95.10.08.64.10.00.474.1.06
Союз127.8179.33.02.87.025.7.825.441.1.276.3.85.21
Междометие8.51.11.24.6.89.00.10.06.98.10.97.82.06.03.77.23.03
Вводное слово.37.21.32.53.06.00.00.00.21.15.18.29.03.00.24.03.00
Частица5.53.9293.41.2.001.3.033.2.633.43.9.55.375.2.87.10
Причастие101.6.68.06.32.00.10.02.47.034.1.50.18.02.27.27.00
Деепричастие.58.15.48.19.10.00.02.00.13.02.85.26.05.00.23.05.03

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 12345678910
Существительное28201924262827272927
Прилагательное6.47.77.49.39.910109.8109.8
Глагол11312622211820191818
Местоимение-существительное188.86.65.75.44.54.14.44.94.1
Местоименное прилагательное2.22.93.33.943.63.83.53.84.2
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое).901.21.11.21.2.901.41.4.80.90
Числительное (порядковое).20.30.20.30.20.20.10.20.20.30
Наречие6.17.65.654.54.654.74.33.9
Предикатив1.2.90.70.70.70.50.60.70.60.50
Предлог8.66.11212121111121113
Союз856.26.26.28.37.17.37.56.5
Междометие3.91.21.61.51.21.71.92.21.81.9
Вводное слово.60.40.40.40.30.30.20.10.10.20
Частица46.47.55.75.75.55.45.55.56.5
Причастие.501.11.21.71.61.81.92.322.5
Деепричастие.40.30.20.30.30.30.30.20.20.60

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая109.83
          .    точка97.64
          -    тире31.15
          !    восклицательный знак6.75
          ?    вопросительный знак7.55
          ...    многоточие5.63
          !..    воскл. знак с многоточием0.00
          ?..    вопр. знак с многоточием0.00
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.04
          "    кавычка1.55
          ()    скобки0.83
          :    двоеточие0.60
          ;    точка с запятой0.45




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


Внимание! У Василия Воронкова пока не сформирован лингвистический паспорт, а значит этого автора в списке результатов не будет в любом случае. Проверка авторства для данного произведения не может претендовать на верный результат.

АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Олег Синицын
 34
2. Сергей Волков
 34
3. Альбина Нури
 34
4. Сергей Давиденко
 34
5. Алексей Бессонов
 34
6. Марина и Сергей Дяченко
 34
7. Карина Шаинян
 33
8. Александр Варго
 33
9. Диана Удовиченко
 33
10. Константин Бояндин
 33
...смотреть весь список >>
⇑ Наверх