FantLab ru



  Лингвистический анализ произведения
Произведение: Дороги судеб
Автор: Андрей Васильев
Дата проведения анализа: 25 июля 2018 года

Общая статистика

Длина текста, знаков:804052
Слов в произведении (СВП):118251
Приблизительно страниц:377
Средняя длина слова, знаков:4.81
Средняя длина предложения (СДП), знаков:56.91
СДП авторского текста, знаков:75.42
СДП диалога, знаков:47.74
Доля диалогов в тексте:56.23%
Доля авторского текста в диалогах:15.77%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 7462 (в страницах — примерно 3; начинается где-то на 11-й)

Активный словарный запас

Использовано уникальных слов:10795
Активный словарный запас (АСЗ):10102
Активный несловарный запас (АНСЗ):693
Удельный АСЗ на 3000 слов текста:1067.33
Удельный АСЗ на 10000 слов текста:2470.27 —> 8488-е место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста:9883.90
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1170) приходится приблизительно на 39-ю страницу текста.
Миниимальное значение УАСЗ-3000 (949) приходится приблизительно на 171-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:31614 (26.73% от СВП)
Определённых частей речи (ОЧР), слов:86637 (73.27% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное21191 (24.46%)
          Прилагательное6294 (7.26%)
          Глагол18565 (21.43%)
          Местоимение-существительное9931 (11.46%)
          Местоименное прилагательное5000 (5.77%)
          Местоимение-предикатив29 (0.03%)
          Числительное (количественное)558 (0.64%)
          Числительное (порядковое)137 (0.16%)
          Наречие3122 (3.60%)
          Предикатив197 (0.23%)
          Предлог8736 (10.08%)
          Союз4980 (5.75%)
          Междометие77 (0.09%)
          Вводное слово31 (0.04%)
          Частица4073 (4.70%)
          Причастие718 (0.83%)
          Деепричастие26 (0.03%)
Служебных слов:32857 (37.92%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное3815601516.061.3.357.3.453523.00.069.83.5.15
Прилагательное484.7132.91.00.07.04.95.1744.4.06.001.1.95.02
Глагол4414222210.151.3.288.8.724211.06.0492.2.06
Местоимение-существительное116.75085.5.07.56.227.4.22135.4.02.1113.46.04
Местоименное прилагательное3379.47.82.00.78.261.1.1731.1.02.002.5.17.00
Местоимение-предикатив.00.02.07.09.00.00.00.00.00.00.02.02.00.00.00.00.00
Числительное (колич-ое)3.9.33.85.22.13.00.26.06.30.00.56.24.00.00.13.04.00
Числительное (порядковое)1.2.11.22.06.02.00.02.00.02.00.04.06.00.00.06.00.00
Наречие2.76.4124.51.2.02.15.00.93.153.71.6.00.002.4.57.00
Предикатив.02.071.6.17.07.00.00.00.04.00.07.13.00.00.06.00.00
Предлог73131.42020.002.69.41.00.00.00.02.00.071.1.00
Союз127.4187.43.9.04.46.063.9.065.8.67.07.025.7.48.04
Междометие.11.00.09.24.02.00.02.00.02.00.04.13.00.00.02.00.00
Вводное слово.11.00.11.00.04.00.00.00.02.00.06.02.00.00.04.00.00
Частица4.32.9401.61.3.00.15.043.4.002.9.43.06.00.45.54.00
Причастие3.8.59.61.61.15.00.04.02.26.002.6.41.00.00.13.02.00
Деепричастие.17.02.04.04.02.00.00.00.00.00.11.00.00.00.02.00.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное2319242625262727262728272826272729292928
Прилагательное6.36.76.67.17.48.27.87.48.38.48.88.17.98.489.28.59.68.17.9
Глагол1526232323242323232120232223232219201819
Местоимение-существительное2017141311109.89.48.59.19.78.18.68.97.58.298.18.210
Местоименное прилагательное4.45.45.86.36.15.86.6666.55.86.46.55.96.47.17.97.55.76.9
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00.10.10.00.10.10.10.00.00.00.00
Числительное (колич-ое).60.60.80.70.80.70.60.80.50.80.70.40.801.70.70.20.90.40.60
Числительное (порядковое).10.20.20.10.10.20.10.20.30.30.10.20.10.40.30.20.10.10.10.00
Наречие4.344.13.83.53.23.73.83.43.23.83.73.53.93.83.33.23.34.12.5
Предикатив.30.20.20.20.20.20.40.10.20.30.30.40.30.20.10.00.10.10.00.40
Предлог87.9101111111111111112121212111112101412
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз126.14.53.84.95.15.55.45.96.25.75.15.45.95.94.96.25.17.16.7
Междометие.60.00.10.00.00.00.00.00.00.10.00.00.00.10.00.10.00.00.10.00
Вводное слово.20.10.00.00.00.00.00.00.00.00.00.00.00.10.00.00.00.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица4.65.85.54.75.34.94.54.65.24.84.64.54.84.34.54.54.33.84.34.4
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие.30.50.60.90.90.80.901.1.90.90.701.5.901.11.31.41.51.221.5
Деепричастие.10.00.00.00.00.00.00.00.00.10.00.00.00.10.00.00.00.10.00.00

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая146.44
          .    точка97.83
          -    тире54.32
          !    восклицательный знак5.13
          ?    вопросительный знак14.33
          ...    многоточие3.43
          !..    воскл. знак с многоточием0.00
          ?..    вопр. знак с многоточием0.01
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.03
          "    кавычка7.70
          ()    скобки0.34
          :    двоеточие3.55
          ;    точка с запятой0.01




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Андрей Васильев
 55
2. Владимир Михайлов
 40  – ожидает пересчёта
3. Зиновий Юрьев
 39  – ожидает пересчёта
4. Константин Якименко
 39  – ожидает пересчёта
5. Макс Фрай
 39  – ожидает пересчёта
6. Виталий Каплан
 39  – ожидает пересчёта
7. Галина Гончарова
 39
8. Владимир Корн
 39
9. Александр Конторович
 39
10. Мария Галина
 39  – ожидает пересчёта
...смотреть весь список >>
⇑ Наверх