Доля прямой речи (DPER): крайние значения — подозрительный сигнал
structure.wlen↑ 5.0
Средняя длина слова (WLEN): аномалии могут указывать на шум
Карл
PER
2
ЛенPER2
МальчуганPER2
ТиргартенLOC2
Тот КPER2
БетлингаPER1
Ботанический СадLOC1
Войти ЛенаLOC1
ГейленбургаPER1
ГосподинPER1
ГоффориPER1
ИноврацлавLOC1
КанарейкаLOC1
КанарейкаPER1
КарлаPER1
ЛепсиусPER1
ЛютцовштрассеPER1
Не ЕтPER1
ОмарPER1
Постдамский УлицаLOC1
Потсдамский УлицаLOC1
СиверсPER1
СпасительPER1
ТраутманаPER1
ТюрингенLOC1
ТюрннгенLOC1
ФитораPER1
ХристосPER1
Цецилия ВерджбннскаяPER1
Эдуард ЭнгельPER1
ЭросPER1
ОбъемΔ −89.1%
6 875 слов
~521 предложений
РитмΔ +34.3%
13.2 слов/предл.
средняя длина предложения
ДиалогиΔ −14.45 п.п.
19.9%
доля прямой речи
Редкие словаΔ ~0 п.п.
1.31%
«неизвестные» токены
ПовторыЛучше · Δ −0.67 п.п.
0.26%
повторы n-грамм
Полные метрики 87
Подсветка: зелёный = значение выше среднего по базе, красный = значение ниже среднего. жёлтый = сильное отклонение.Δ показывает разницу (п.п. для долей/процентов) или относительное изменение (для прочих метрик).
Показано: 44 · всего: 87 · отклонений: 44
Топ отклонений
Доля прямой речи
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
19.90%в пределах нормы
Типичный диапазон (среднее внутри)
Структура
Δ −14.45 п.п.
Плотность паттерна на 1000 знаков — многоточия
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
1.5438в пределах нормы
Типичный диапазон (среднее внутри)
Шум/повторы
Хуже · Δ +593.9%
Слов в диалогах
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
1 312в пределах нормы
Типичный диапазон (среднее внутри)
Структура
Δ −93.7%
Токены: буквы+цифры
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
3в пределах нормы
Типичный диапазон (среднее внутри)
Шум/повторы
Хуже · Δ +50.0%
Части речи: количество — латиница
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
7в пределах нормы
Типичный диапазон (среднее внутри)
Морфология
Δ −58.8%
Части речи: количество — междометия
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
15в пределах нормы
Типичный диапазон (среднее внутри)
Морфология
Δ −80.4%
value
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
0.284778выше нормы
Типичный диапазон (среднее внутри)
Лексика
Δ +134.0%
Средняя длина предложения
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
13.1958в пределах нормы
Типичный диапазон (среднее внутри)
Структура
Δ +34.3%
Части речи: доля — прилагательные
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
15.55%в пределах нормы
Типичный диапазон (среднее внутри)
Морфология
Δ +2.71 п.п.
sz03: лексическое разнообразие
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
35.10%в пределах нормы
Типичный диапазон (среднее внутри)
Лексика
Хуже · Δ −3.70 п.п.
Размеры3 из 3
Количество знаков
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
43 400ниже нормы
Типичный диапазон (среднее внутри)
Δ −89.3%
Количество предложений (оценка)
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
521ниже нормы
Типичный диапазон (среднее внутри)
Δ −91.8%
Количество слов
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
6 875ниже нормы
Типичный диапазон (среднее внутри)
Δ −89.1%
Структура4 из 4
Доля прямой речи
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
19.90%в пределах нормы
Типичный диапазон (среднее внутри)
%
Δ −14.45 п.п.
Слов в диалогах
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
1 312в пределах нормы
Типичный диапазон (среднее внутри)
Δ −93.7%
Средняя длина предложения
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
13.1958в пределах нормы
Типичный диапазон (среднее внутри)
Δ +34.3%
Слов в прямой речи
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
1 368ниже нормы
Типичный диапазон (среднее внутри)
Δ −93.7%
Лексика9 из 9
value
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
0.284778выше нормы
Типичный диапазон (среднее внутри)
ключ: lexicon.sz100.value
Δ +134.0%
sz03: лексическое разнообразие
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
35.10%в пределах нормы
Типичный диапазон (среднее внутри)
%
Хуже · Δ −3.70 п.п.
«Неизвестных» слов (кол-во)
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
90ниже нормы
Типичный диапазон (среднее внутри)
Лучше · Δ −92.1%
sample words
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
6 865ниже нормы
Типичный диапазон (среднее внутри)
ключ: lexicon.sz100.sample_words
Δ −89.1%
sz03: уникальных лемм
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
1 053в пределах нормы
Типичный диапазон (среднее внутри)
Δ −9.3%
sz10: лексическое разнообразие
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
28.48%в пределах нормы
Типичный диапазон (среднее внутри)
%
Лучше · Δ +1.95 п.п.
sz10: размер выборки (слов)
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
6 865ниже нормы
Типичный диапазон (среднее внутри)
Δ −31.4%
sz10: уникальных лемм
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
1 955ниже нормы
Типичный диапазон (среднее внутри)
Δ −25.3%
unique lemmas
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
1 955ниже нормы
Типичный диапазон (среднее внутри)
ключ: lexicon.sz100.unique_lemmas
Δ −73.8%
Морфология17 из 17
Части речи: количество — латиница
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
7в пределах нормы
Типичный диапазон (среднее внутри)
Δ −58.8%
Части речи: количество — междометия
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
15в пределах нормы
Типичный диапазон (среднее внутри)
Δ −80.4%
Части речи: доля — прилагательные
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
15.55%в пределах нормы
Типичный диапазон (среднее внутри)
%
Δ +2.71 п.п.
Части речи: доля — глаголы
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
16.25%в пределах нормы
Типичный диапазон (среднее внутри)
%
Δ −2.00 п.п.
Части речи: доля — местоимения
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
10.91%в пределах нормы
Типичный диапазон (среднее внутри)
%
Δ +2.46 п.п.
Части речи: доля — существительные
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
21.00%ниже нормы
Типичный диапазон (среднее внутри)
%
Δ −4.65 п.п.
Части речи: доля — частицы
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
7.20%в пределах нормы
Типичный диапазон (среднее внутри)
%
Δ +1.48 п.п.
Части речи: количество — глаголы
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
1 117ниже нормы
Типичный диапазон (среднее внутри)
Δ −90.2%
Части речи: количество — местоимения
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
750ниже нормы
Типичный диапазон (среднее внутри)
Δ −85.6%
Части речи: количество — наречия
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
497ниже нормы
Типичный диапазон (среднее внутри)
Δ −88.8%
Части речи: количество — предлоги
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
690ниже нормы
Типичный диапазон (среднее внутри)
Δ −89.2%
Части речи: количество — прилагательные
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
1 069ниже нормы
Типичный диапазон (среднее внутри)
Δ −86.7%
Части речи: количество — прочее
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
51ниже нормы
Типичный диапазон (среднее внутри)
Δ −89.5%
Части речи: количество — союзы
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
721ниже нормы
Типичный диапазон (среднее внутри)
Δ −88.2%
Части речи: количество — существительные
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
1 444ниже нормы
Типичный диапазон (среднее внутри)
Δ −91.0%
Части речи: количество — частицы
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
495ниже нормы
Типичный диапазон (среднее внутри)
Δ −86.5%
Части речи: количество — числительные
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
19ниже нормы
Типичный диапазон (среднее внутри)
Δ −92.7%
Шум/повторы9 из 9
Плотность паттерна на 1000 знаков — многоточия
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
1.5438в пределах нормы
Типичный диапазон (среднее внутри)
на 1000 знаков
Хуже · Δ +593.9%
Токены: буквы+цифры
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
3в пределах нормы
Типичный диапазон (среднее внутри)
Хуже · Δ +50.0%
Всего n-грамм
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
6 862ниже нормы
Типичный диапазон (среднее внутри)
Лучше · Δ −89.1%
Доля повторяющихся n-грамм (вхождения)
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
0.26%ниже нормы
Типичный диапазон (среднее внутри)
%
Лучше · Δ −0.67 п.п.
Доля повторяющихся n-грамм (типы)
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
0.23%ниже нормы
Типичный диапазон (среднее внутри)
%
Лучше · Δ −0.49 п.п.
Макс. частота одной n-граммы
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
3ниже нормы
Типичный диапазон (среднее внутри)
Лучше · Δ −70.0%
Повторяющиеся n-граммы (вхождения)
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
18ниже нормы
Типичный диапазон (среднее внутри)
Лучше · Δ −96.7%
Повторяющихся n-грамм
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
16ниже нормы
Типичный диапазон (среднее внутри)
Лучше · Δ −96.3%
Слова в CAPS
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
0ниже нормы
Типичный диапазон (среднее внутри)
Лучше · Δ −100.0%
quality_v12 из 2
morphology
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).
0.7488в пределах нормы
Типичный диапазон (среднее внутри)
ключ: quality_v1.subscores.morphology
Δ −10.4%
noise
Палочка — среднее значение по базе. Кружок — значение этой книги. Полоса — типичный диапазон (P10–P90).