Перейти к основному содержимому
Перейти к основному содержимому

system.asynchronous_metrics

Выполнение запросов в ClickHouse Cloud

Данные в этой системной таблице хранятся локально на каждом узле в ClickHouse Cloud. Поэтому для получения полного обзора всех данных требуется функция clusterAllReplicas. Подробности см. здесь.

Описание

Содержит метрики, которые периодически вычисляются в фоновом режиме. Например, объём используемой оперативной памяти.

Столбцы

  • metric (String) — имя метрики.
  • value (Float64) — значение метрики.
  • description (String) — описание метрики.

Пример

SELECT * FROM system.asynchronous_metrics LIMIT 10
┌─metric──────────────────────────────────┬──────value─┬─description────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┐
│ AsynchronousMetricsCalculationTimeSpent │ 0.00179053 │ Time in seconds spent for calculation of asynchronous metrics (this is the overhead of asynchronous metrics).                                                                                                                                              │
│ NumberOfDetachedByUserParts             │          0 │ The total number of parts detached from MergeTree tables by users with the `ALTER TABLE DETACH` query (as opposed to unexpected, broken or ignored parts). The server does not care about detached parts and they can be removed.                          │
│ NumberOfDetachedParts                   │          0 │ The total number of parts detached from MergeTree tables. A part can be detached by a user with the `ALTER TABLE DETACH` query or by the server itself it the part is broken, unexpected or unneeded. The server does not care about detached parts and they can be removed. │
│ TotalRowsOfMergeTreeTables              │    2781309 │ Total amount of rows (records) stored in all tables of MergeTree family.                                                                                                                                                                                   │
│ TotalBytesOfMergeTreeTables             │    7741926 │ Total amount of bytes (compressed, including data and indices) stored in all tables of MergeTree family.                                                                                                                                                   │
│ NumberOfTables                          │         93 │ Total number of tables summed across the databases on the server, excluding the databases that cannot contain MergeTree tables. The excluded database engines are those who generate the set of tables on the fly, like `Lazy`, `MySQL`, `PostgreSQL`, `SQlite`. │
│ NumberOfDatabases                       │          6 │ Total number of databases on the server.                                                                                                                                                                                                                   │
│ MaxPartCountForPartition                │          6 │ Maximum number of parts per partition across all partitions of all tables of MergeTree family. Values larger than 300 indicates misconfiguration, overload, or massive data loading.                                                                       │
│ ReplicasSumMergesInQueue                │          0 │ Sum of merge operations in the queue (still to be applied) across Replicated tables.                                                                                                                                                                       │
│ ReplicasSumInsertsInQueue               │          0 │ Sum of INSERT operations in the queue (still to be replicated) across Replicated tables.                                                                                                                                                                   │
└─────────────────────────────────────────┴────────────┴────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘

Описания метрик

Приведённые ниже описания сгенерированы из исходного кода C++ с помощью utils/generate-async-metrics-docs. Единственным источником истины служит строковый литерал рядом с регистрацией каждой метрики в src/Common/AsynchronousMetrics.cpp, src/Interpreters/ServerAsynchronousMetrics.cpp и src/Coordination/KeeperAsynchronousMetrics.cpp. Имена метрик, содержащие переменный suffix (для каждого диска, для каждого CPU, для каждого interface и т. д.), показаны с placeholder *name*; работающий сервер возвращает их с подставленным конкретным суффиксом.

AsynchronousHeavyMetricsCalculationTimeSpent

Время в секундах, затраченное на вычисление тяжёлых асинхронных метрик, связанных с таблицами (это накладные расходы, связанные с асинхронными метриками).

AsynchronousHeavyMetricsUpdateInterval

Интервал обновления «тяжёлых» метрик, связанных с таблицами

AsynchronousMetricsCalculationTimeSpent

Время в секундах, затраченное на вычисление асинхронных метрик (накладные расходы на асинхронные метрики).

AsynchronousMetricsUpdateInterval

Интервал обновления метрик

AsyncLoggingmetric_firstQueueSize

Количество асинхронных сообщений в очереди, ожидающих записи в журнал в этом канале

BlockActiveTime_name

Время в секундах, в течение которого для блочного устройства были поставлены в очередь запросы ввода-вывода (I/O). Это системная метрика: она учитывает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockActiveTimePerOp_name

Аналогично метрикам BlockActiveTime, но значение делится на количество операций ввода-вывода, чтобы получить время на одну операцию.

BlockDiscardBytes_name

Объём отброшенных байт на блочном устройстве. Эти операции актуальны для SSD. Операции discard не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardMerges_name

Количество операций сброса (discard), запрошенных для блочного устройства и объединённых планировщиком ввода-вывода ОС. Эти операции актуальны для SSD. Операции сброса не используются ClickHouse, но могут использоваться другими процессами в системе. Это системная метрика, она включает все процессы на хостовой машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardOps_name

Количество операций сброса (discard), запрошенных у блочного устройства. Эти операции актуальны для SSD. Операции сброса не используются ClickHouse, но могут использоваться другими процессами в системе. Это системная метрика, она включает все процессы на хостовой машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardTime_name

Время в секундах, затраченное на операции discard, запрошенные у блочного устройства, суммарно по всем операциям. Эти операции актуальны для SSD. Операции discard не используются ClickHouse, но могут использоваться другими процессами в системе. Это системная метрика, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockInFlightOps_name

Это значение показывает количество запросов ввода-вывода (I/O), которые были переданы драйверу устройства, но еще не завершены. Оно не включает запросы ввода-вывода, которые находятся в очереди, но еще не переданы драйверу устройства. Это системная метрика; она охватывает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockQueueTime_name

Это значение показывает количество миллисекунд, в течение которых запросы ввода-вывода (I/O) ожидали на этом блочном устройстве. Если одновременно ожидает несколько запросов ввода-вывода, это значение увеличивается как произведение числа миллисекунд на число ожидающих запросов. Это системная метрика; она учитывает все процессы на хостовой системе, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockQueueTimePerOp_name

Аналогично метрикам BlockQueueTime, но здесь значение делится на количество операций ввода-вывода, чтобы получить время на одну операцию.

BlockReadBytes_name

Количество байт, прочитанных с блочного устройства. Может быть меньше количества байт, прочитанных из файловой системы, из-за использования кэша страниц ОС, который уменьшает объем операций ввода-вывода (I/O). Это системная метрика, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadMerges_name

Количество операций чтения, запрошенных у блочного устройства и объединённых планировщиком ввода-вывода ОС. Это системная метрика; она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadOps_name

Количество операций чтения, запрошенных у блочного устройства. Это системная метрика, она включает все процессы на хостовой машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadTime_name

Время в секундах, затраченное на операции чтения, выполняемые блочным устройством, суммированное по всем операциям. Это метрика уровня всей системы: она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteBytes_name

Количество байт, записанных на блочное устройство. Это значение может быть меньше количества байт, записанных в файловую систему, из‑за использования кэша страниц ОС, который уменьшает объем операций ввода‑вывода (I/O). Запись на блочное устройство может произойти позже соответствующей записи в файловую систему из‑за кэширования с прямой записью (write-through caching). Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteMerges_name

Количество операций записи, запрошенных у блочного устройства и объединённых планировщиком ввода-вывода ОС. Это системная метрика, охватывающая все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteOps_name

Количество операций записи, запрошенных у блочного устройства. Это метрика на уровне всей системы: она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteTime_name

Время в секундах, затраченное на операции записи, выполняемые блочным устройством, суммарно по всем операциям. Это метрика на уровне всей системы: она учитывает все процессы на хост‑машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

CGroupMaxCPU

Максимальное количество ядер CPU в соответствии с CGroups.

CGroupMemoryTotal

Общий объём памяти в cgroup, в байтах. Если указано значение 0, лимит совпадает с OSMemoryTotal.

CGroupMemoryUsed

Объём памяти, используемой в cgroup, в байтах. В cgroup v2 это anon + sock + невытесняемая память ядра; в cgroup v1 — RSS. В обоих случаях кэш страниц ядра ОС (файловый кэш) не учитывается.

CGroupMemoryUsedWithoutPageCache

Объем памяти, используемой в cgroup, в байтах, без учета кэша страниц ClickHouse в пространстве пользователя. Это значение CGroupMemoryUsed за вычетом размера кэша страниц в пространстве пользователя. Если кэш страниц в пространстве пользователя отключен, это значение равно CGroupMemoryUsed.

CGroupSystemTime

Доля времени, в течение которого ядро CPU выполняло код ядра ОС (system).

CGroupSystemTimeNormalized

Это значение похоже на CGroupSystemTime, но делится на число доступных ядер CPU, поэтому измеряется в диапазоне [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если число ядер различается, и при этом всё равно получать среднее значение метрики использования ресурсов. При необходимости вместо фактического числа ядер CPU можно использовать квоту CPU cgroup, делённую на её период; в этом случае значение этой метрики в отдельные моменты может превышать 1.

CGroupUserTime

Доля времени, в течение которого ядро CPU выполняло код в пространстве пользователя. Сюда также входит время, когда CPU был недоиспользован по причинам, связанным с самим CPU (загрузки из памяти, простои конвейера, ошибочные предсказания переходов, выполнение другого SMT‑потока).

CGroupUserTimeNormalized

Значение аналогично CGroupUserTime, но делится на количество доступных ядер CPU, чтобы находиться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер различается, и при этом получать метрику средней утилизации ресурсов. Если указана квота CPU для CGroup, разделённая на её период, её можно использовать вместо фактического количества ядер CPU, и в этом случае значение этой метрики в отдельные моменты может превышать 1.

CPUFrequencyMHz_core_id

Текущая частота процессора в МГц. Большинство современных CPU динамически изменяют частоту для экономии энергии и работы в режиме Turbo Boost.

DictionaryMaxUpdateDelay

Максимально допустимая задержка (в секундах) обновления словаря

DictionaryTotalFailedUpdates

Количество ошибок с момента последней успешной загрузки во всех словарях.

DiskAvailable_name

Доступное количество байт на диске (на виртуальной файловой системе). Удалённые файловые системы могут не предоставлять эту информацию и показывать очень большие значения, например 16 EiB.

DiskGetObjectThrottlerAvailable_name

Количество запросов GetObject, которые в данный момент можно отправить, не достигнув лимита троттлинга на диске (виртуальной файловой системе). Локальные файловые системы могут не предоставлять эту информацию.

DiskGetObjectThrottlerRPS_name

Предел ограничителя скорости запросов GetObject на диске в запросах в секунду (виртуальная файловая система). Локальные файловые системы могут не предоставлять эту информацию.

DiskPutObjectThrottlerAvailable_name

Количество запросов PutObject, которые в данный момент можно отправить, не достигнув предела ограничения скорости на диске (виртуальной файловой системе). Локальные файловые системы могут не предоставлять эту информацию.

DiskPutObjectThrottlerRPS_name

Лимит ограничения скорости запросов PutObject для диска, в запросах в секунду (виртуальная файловая система). Локальные файловые системы могут не предоставлять эту информацию.

DiskTotal_name

Общий размер диска (виртуальной файловой системы) в байтах. Удалённые файловые системы могут не предоставлять эту информацию и показывать очень большое значение, например 16 EiB.

DiskUnreserved_name

Доступное количество байт на диске (на виртуальной файловой системе) без учёта резервов для слияний, выборок и перемещений. Удалённые файловые системы могут не предоставлять эту информацию и показывать очень большое значение, например 16 EiB.

DiskUsed_name

Количество использованных байт на диске (виртуальная файловая система). Удалённые файловые системы могут не предоставлять эту информацию.

EDACi_Correctable

Количество исправимых ошибок памяти ECC. Высокое значение этого показателя указывает на неисправную оперативную память, которую необходимо немедленно заменить, поскольку при большом числе исправленных ошибок возможны и скрытые ошибки, приводящие к повреждению данных. Источник: /sys/devices/system/edac/mc/

EDACi_Uncorrectable

Количество неисправимых ошибок ECC в памяти. Ненулевое значение этого показателя указывает на неисправную оперативную память, которую необходимо немедленно заменить, поскольку это может привести к повреждению данных. Источник: /sys/devices/system/edac/mc/

FilesystemCacheBytes

Общее количество байт в виртуальной файловой системе cache. Этот кэш хранится на диске.

FilesystemCacheCapacity

Общая ёмкость виртуальной файловой системы cache. Этот кэш хранится на диске.

FilesystemCacheFiles

Общее количество сегментов кэшированных файлов в виртуальной файловой системе cache. Этот кэш хранится на диске.

FilesystemLogsPathAvailableBytes

Доступное количество байт на томе, где расположен каталог журналов ClickHouse. Если это значение приближается к нулю, следует настроить ротацию журналов в конфигурационном файле.

FilesystemLogsPathAvailableINodes

Количество доступных inode на томе, где примонтирован каталог с журналами ClickHouse.

FilesystemLogsPathTotalBytes

Размер тома, на который смонтирован каталог с логами ClickHouse, в байтах. Рекомендуется выделять под логи не менее 10 ГБ.

FilesystemLogsPathTotalINodes

Общее количество инодов на томе, где смонтирован каталог с логами ClickHouse.

FilesystemLogsPathUsedBytes

Занято байт на томе, где смонтирован путь к логам ClickHouse.

FilesystemLogsPathUsedINodes

Количество использованных инодов на томе, где смонтирован каталог журналов ClickHouse.

FilesystemMainPathAvailableBytes

Доступное количество байт на томе, где смонтирован основной каталог ClickHouse.

FilesystemMainPathAvailableINodes

Количество доступных inode на томе, где смонтирован основной каталог ClickHouse. Если это значение близко к нулю, это указывает на некорректную конфигурацию, и вы получите сообщение об ошибке «no space left on device», даже если диск не заполнен.

FilesystemMainPathTotalBytes

Размер тома, на который смонтирован основной каталог ClickHouse, в байтах.

FilesystemMainPathTotalINodes

Общее количество inode на томе файловой системы, где смонтирован основной путь ClickHouse. Если оно меньше 25 миллионов, это говорит о некорректной конфигурации.

FilesystemMainPathUsedBytes

Количество использованных байт на томе, где смонтирован основной путь ClickHouse.

FilesystemMainPathUsedINodes

Количество использованных инодов на томе, где смонтирован основной каталог ClickHouse. Это значение, как правило, соответствует количеству файлов.

GRPCRejectedConnections

Количество отклонённых соединений по протоколу GRPC.

GRPCThreads

Количество потоков в сервере gRPC.

HashTableStatsCacheEntries

Количество записей в кэше размеров хеш-таблиц. Этот кэш используется для предиктивной оптимизации GROUP BY.

HashTableStatsCacheHits

Количество случаев, когда предсказание размера хеш-таблицы оказалось верным.

HashTableStatsCacheMisses

Количество случаев, когда оценка размера хеш-таблицы оказывалась неверной.

HTTPConnectionPoolgroup_nameTCPRcvBufTotalBytes

Суммарный объём памяти буфера приёма TCP в ядре (sk_rmem_alloc) для всех сокетов пула HTTP-соединений.

HTTPConnectionPoolgroup_nameTCPSndBufTotalBytes

Суммарный объём памяти ядра, занимаемой TCP-буферами передачи (sk_wmem_alloc) всех сокетов пула HTTP-соединений.

HTTPRejectedConnections

Количество отклонённых соединений через HTTP-интерфейс (без TLS).

HTTPSecureRejectedConnections

Количество отклонённых соединений интерфейса HTTPS.

HTTPSecureThreads

Количество потоков в сервере HTTPS-интерфейса.

HTTPThreads

Количество потоков сервера HTTP-интерфейса (без TLS).

InterserverRejectedConnections

Число отклонённых соединений по протоколу взаимодействия между репликами (без TLS).

InterserverSecureRejectedConnections

Количество отклонённых соединений по протоколу связи между репликами (с TLS).

InterserverSecureThreads

Количество потоков в сервере протокола обмена данными между репликами (с TLS).

InterserverThreads

Количество потоков в сервере протокола взаимодействия реплик (без TLS).

jemalloc.active

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). Подробнее см. https://jemalloc.net/jemalloc.3.html

jemalloc.allocated

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). Подробнее см. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.dirty_purged

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.muzzy_purged

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pactive

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). Подробнее см. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pdirty

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). Подробнее см. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pmuzzy

Внутренняя метрика низкоуровневого аллокатора памяти jemalloc. См. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.dirty_decay_ms

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.num_runs

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). Подробнее см. на https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.num_threads

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.run_intervals

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См.: https://jemalloc.net/jemalloc.3.html

jemalloc.cache_arena.pactive

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.cache_arena.pdirty

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.epoch

Внутренний порядковый номер обновления статистики jemalloc (распределителя памяти Джейсона Эванса), используемый во всех остальных метриках jemalloc.

jemalloc.mapped

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). Подробнее см. https://jemalloc.net/jemalloc.3.html

jemalloc.mergetree_arena.active_bytes

Активные байты в выделенной арене jemalloc для MergeTree. Содержит долгоживущее состояние кучи MergeTree: метаданные на уровне части (NamesAndTypesList, SerializationInfoByName, отображение serializations, column_name_to_position, дерево MergeTreeDataPartChecksums, делегаты Poco::LRUCache<String, ColumnSize> внутри каждой IMergeTreeDataPart, отображения ColumnSize/IndexSize на уровне части, MinMaxIndex, VersionMetadataOnDisk и сам объект MergeTreeDataPart{Compact,Wide}), а также метаданные на уровне таблицы (клоны StorageInMemoryMetadata / ColumnsDescription / VirtualColumnsDescription, настроенные через setProperties, агрегация serialization_hints и columns_descriptions_cache). В эту метрику входят как активные части, так и устаревшие части, ожидающие очистки. Не пересекается с ареной кэша и ареной JIT. Столбцы на уровне части system.parts.primary_key_bytes_in_memory[_allocated] и system.parts.index_granularity_bytes_in_memory[_allocated] являются подмножествами этой метрики (когда их значения ненулевые — они также могут находиться в PrimaryIndexCacheBytes, который расположен в арене кэша и здесь не учитывается).

jemalloc.mergetree_arena.dirty_bytes

«Грязные» байты в арене MergeTree, подлежащие очистке с возвратом ОС.

jemalloc.mergetree_arena.pactive

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.mergetree_arena.pdirty

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.metadata

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.metadata_thp

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.prof.active

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.prof.lg_sample

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.prof.thread_active_init

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.resident

Внутренняя метрика низкоуровневого аллокатора памяти jemalloc. См. https://jemalloc.net/jemalloc.3.html

jemalloc.retained

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

Джиттер

Разница между моментом времени, когда было запланировано пробуждение потока, выполняющего вычисление асинхронных метрик, и моментом времени, когда он был фактически пробуждён. Является косвенным индикатором общей задержки и отзывчивости системы.

KeeperApproximateDataSize

Примерный размер данных ClickHouse Keeper в байтах.

KeeperAvgLatency

Средняя задержка запросов в ClickHouse Keeper.

KeeperCommitLogsCacheEntries

Количество записей, хранящихся в кэше памяти для следующих журналов, ожидающих фиксации

KeeperCommitLogsCacheSize

Общий размер кэша в памяти для следующих записей журнала, ожидающих фиксации

KeeperEphemeralsCount

Количество временных узлов в ClickHouse Keeper.

KeeperFollowers

Количество followers в ClickHouse Keeper.

KeeperIsExceedingMemorySoftLimitHit

1, если ClickHouse Keeper превышает мягкий лимит памяти; в противном случае — 0.

KeeperIsFollower

1, если ClickHouse Keeper работает как follower, в противном случае — 0.

KeeperIsLeader

1, если ClickHouse Keeper — лидер, иначе 0.

KeeperIsObserver

1, если ClickHouse Keeper работает как observer, иначе — 0.

KeeperIsStandalone

1, если ClickHouse Keeper работает в автономном режиме, иначе 0.

KeeperKeyArenaSize

Размер арены памяти для ключей в ClickHouse Keeper в байтах.

KeeperLastCommittedLogIdx

Индекс последней подтверждённой записи журнала в ClickHouse Keeper.

KeeperLastLogIdx

Индекс последней записи журнала, сохранённой в ClickHouse Keeper.

KeeperLastLogTerm

Терм Raft последней записи журнала, сохранённой в ClickHouse Keeper.

KeeperLastSnapshotIdx

Индекс последней записи журнала в последнем созданном снимке.

KeeperLatestLogsCacheEntries

Количество записей, хранящихся в кэше в памяти для последних записей журнала

KeeperLatestLogsCacheSize

Общий размер кэша в памяти для последних записей журнала

KeeperLatestSnapshotSize

Размер в байтах несжатого последнего снимка, созданного ClickHouse Keeper.

KeeperMaxFileDescriptorCount

Максимальное число открытых дескрипторов файлов в ClickHouse Keeper.

KeeperMaxLatency

Максимальная задержка запросов в ClickHouse Keeper.

KeeperMinLatency

Минимальная задержка при обработке запросов в ClickHouse Keeper.

KeeperOpenFileDescriptorCount

Количество открытых файловых дескрипторов в ClickHouse Keeper.

KeeperPacketsReceived

Количество пакетов, полученных в ClickHouse Keeper.

KeeperPacketsSent

Количество пакетов, отправленных ClickHouse Keeper.

KeeperPathsWatched

Количество различных путей, для которых клиенты ClickHouse Keeper установили наблюдение.

KeeperSessionWithWatches

Количество клиентских сеансов ClickHouse Keeper с установленными наблюдениями.

KeeperSyncedFollowers

Количество follower-узлов ClickHouse Keeper, находящихся в синхронизированном состоянии.

KeeperTargetCommitLogIdx

Индекс, до которого можно зафиксировать журналы в ClickHouse Keeper.

KeeperTCPRejectedConnections

Количество отклонённых TCP-соединений Keeper (без TLS).

KeeperTCPSecureRejectedConnections

Количество отклонённых подключений по протоколу Keeper TCP (с TLS).

KeeperTCPSecureThreads

Количество потоков на сервере протокола Keeper TCP (с TLS).

KeeperTCPThreads

Количество потоков на сервере протокола Keeper TCP (без TLS).

KeeperWatchCount

Количество зарегистрированных наблюдений в ClickHouse Keeper.

KeeperZnodeCount

Количество узлов (элементов данных) в ClickHouse Keeper.

KeeperZxid

Текущий идентификатор транзакции (zxid) в ClickHouse Keeper.

LoadAverage1

Суммарная нагрузка на всю систему, усреднённая с помощью экспоненциального сглаживания за 1 минуту. Нагрузка представляет собой количество потоков во всех процессах (сущностях планировщика ядра ОС), которые в данный момент выполняются на CPU, ожидают I/O или готовы к выполнению, но прямо сейчас не запланированы к исполнению. Это число включает все процессы, а не только clickhouse-server. Значение может быть больше количества ядер CPU, если система перегружена и многие процессы готовы к выполнению, но ожидают CPU или I/O.

LoadAverage15

Суммарная нагрузка на всю систему, усреднённая с помощью экспоненциального сглаживания за 15 минут. Нагрузка представляет собой количество потоков во всех процессах (сущностях планировщика ядра ОС), которые в данный момент выполняются на CPU, ожидают I/O или готовы к выполнению, но прямо сейчас не запланированы к исполнению. Это число включает все процессы, а не только clickhouse-server. Значение может быть больше количества ядер CPU, если система перегружена и многие процессы готовы к выполнению, но ожидают CPU или I/O.

LoadAverage5

Суммарная нагрузка на всю систему, усреднённая с помощью экспоненциального сглаживания за 5 минут. Нагрузка представляет собой количество потоков во всех процессах (сущностях планировщика ядра ОС), которые в данный момент выполняются на CPU, ожидают I/O или готовы к выполнению, но прямо сейчас не запланированы к исполнению. Это число включает все процессы, а не только clickhouse-server. Значение может быть больше количества ядер CPU, если система перегружена и многие процессы готовы к выполнению, но ожидают CPU или I/O.

LongestRunningMerge

Длительность в секундах самой продолжительной фоновой операции слияния, выполняющейся в данный момент.

MaxPartCountForPartition

Максимальное количество частей на партицию во всех партициях всех таблиц семейства MergeTree. Значения более 300 указывают на неверную конфигурацию, перегрузку или массовую загрузку данных.

MemoryCode

Объём виртуальной памяти, сопоставленной со страницами машинного кода серверного процесса, в байтах.

MemoryDataAndStack

Объём виртуальной памяти, отображённой под стек и динамически выделяемую память, в байтах. Не определено, включает ли он стеки отдельных потоков и большую часть памяти, выделяемой системным вызовом mmap. Эта метрика существует только для полноты описания. Для мониторинга рекомендуется использовать метрику MemoryResident.

MemoryResident

Объём физической памяти, потребляемый серверным процессом, в байтах.

MemoryResidentMax

Максимальный объем физической памяти, используемой серверным процессом, в байтах.

MemoryResidentWithoutPageCache

Объём физической памяти, используемой серверным процессом, без учёта кэша страниц в пространстве пользователя, в байтах. Этот показатель даёт более точное представление о фактическом использовании памяти, если используется кэш страниц в пространстве пользователя. Когда кэш страниц в пространстве пользователя отключён, это значение равно MemoryResident.

MemoryShared

Объём памяти, используемой серверным процессом и одновременно другими процессами, в байтах. ClickHouse не использует разделяемую память, но часть памяти может помечаться ОС как разделяемая по её собственным причинам. Эта метрика почти не имеет смысла для мониторинга и существует только для полноты.

MemoryVirtual

Размер виртуального адресного пространства, выделенного серверным процессом, в байтах. Размер виртуального адресного пространства, как правило, значительно больше фактического потребления физической памяти и не должен использоваться для оценки реального потребления памяти. Большие значения этой метрики являются совершенно нормальными и имеют только технический смысл.

MySQLRejectedConnections

Число отклонённых соединений для протокола совместимости MySQL.

MySQLThreads

Количество потоков на сервере протокола совместимости с MySQL.

NetworkReceiveBytes_interface_name

Количество байт, полученных через сетевой интерфейс. Это метрика на уровне всей системы: она учитывает все процессы на хосте, а не только clickhouse-server.

NetworkReceiveDrop_interface_name

Объём данных в байтах в пакетах, отброшенных при приёме через сетевой интерфейс. Это системная метрика: она включает все процессы на хосте, а не только clickhouse-server.

NetworkReceiveErrors_interface_name

Количество случаев возникновения ошибок при приёме данных через сетевой интерфейс. Это общесистемная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server.

NetworkReceivePackets_interface_name

Количество сетевых пакетов, полученных через сетевой интерфейс. Это системная метрика: она включает все процессы на хосте, а не только clickhouse-server.

NetworkSendBytes_interface_name

Количество байт, отправленных через сетевой интерфейс. Это метрика уровня всей системы; она учитывает все процессы на хосте, а не только clickhouse-server.

NetworkSendDrop_interface_name

Количество раз, когда пакет был отброшен при отправке через сетевой интерфейс. Это системная метрика, она включает все процессы на хостовой машине, а не только clickhouse-server.

NetworkSendErrors_interface_name

Количество ошибок (например, повторных передач TCP), возникших при отправке данных через сетевой интерфейс. Это метрика на уровне всей системы: она учитывает все процессы на хосте, а не только clickhouse-server.

NetworkSendPackets_interface_name

Количество сетевых пакетов, отправленных через сетевой интерфейс. Это системная метрика: она включает все процессы на хосте, а не только clickhouse-server.

NetworkTCPReceiveQueue

Суммарный размер очередей приёма сетевых сокетов, используемых сервером, в TCPv4 и TCPv6.

NetworkTCPSocketRemoteAddresses

Общее число уникальных удалённых адресов сетевых сокетов, используемых сервером по TCPv4 и TCPv6.

NetworkTCPSockets

Общее число сетевых сокетов, используемых сервером по TCPv4 и TCPv6, во всех состояниях.

NetworkTCPSockets_описание

Общее число сетевых сокетов на сервере в указанном состоянии для TCPv4 и TCPv6.

NetworkTCPTransmitQueue

Суммарный размер очередей передачи сетевых сокетов, используемых сервером в TCPv4 и TCPv6.

NetworkTCPUnrecoveredRetransmits

Общий объем текущих повторных передач (не восстановленных на данный момент) для сетевых сокетов, используемых на сервере, по TCPv4 и TCPv6.

NumberOfDatabases

Общее количество баз данных на сервере.

NumberOfDetachedByUserParts

Общее количество частей, отсоединённых от таблиц MergeTree пользователями с помощью запроса ALTER TABLE DETACH (в отличие от неожиданных, повреждённых или игнорируемых частей). Сервер не отслеживает отсоединённые части и их можно удалить.

NumberOfDetachedParts

Общее количество частей, отсоединённых от таблиц MergeTree. Часть может быть отсоединена пользователем с помощью запроса ALTER TABLE DETACH или самим сервером, если часть повреждена, появилась неожиданно или не требуется. Сервер не использует отсоединённые части и их можно удалить.

NumberOfPendingMutations

Общее количество мутаций, которые ещё ожидают выполнения.

NumberOfPendingMutationsOverExecutionTime

Общее количество мутаций, для которых остались части данных, ожидающие мутации дольше значения, заданного настройкой max_pending_mutations_execution_time_to_warn.

NumberOfTables

Общее суммарное количество таблиц по всем базам данных на сервере, за исключением баз данных, которые не могут содержать таблицы MergeTree. Исключаемые движки баз данных — это те, которые формируют набор таблиц «на лету», такие как Lazy, MySQL, PostgreSQL, SQlite.

NumberOfTablesSystem

Общее количество таблиц в системной базе данных на сервере, которые хранятся в таблицах семейства MergeTree.

OSContextSwitches

Количество переключений контекста, которые система выполнила на хостовой машине. Это метрика на уровне всей системы: она включает все процессы на данном хосте, а не только clickhouse-server.

OSCPUOverload

Относительный дефицит CPU, рассчитываемый как количество потоков, ожидающих CPU, по отношению к числу потоков, использующих CPU. Если значение больше нуля, серверу не помешает больше ресурсов CPU. Если оно значительно превышает ноль, сервер может перестать отвечать. Метрика накапливается между обновлениями асинхронных метрик.

OSGuestNiceTimecpu_suffix

Отношение времени, затраченного на работу виртуального CPU для гостевых операционных систем под управлением ядра Linux, когда для гостевой системы был установлен более высокий приоритет (см. man procfs). Это системная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server. Эта метрика не имеет прямого отношения к ClickHouse, но приведена для полноты. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма значений по всем ядрам [0..число ядер].

OSGuestNiceTimeNormalized

Значение аналогично OSGuestNiceTime, но делится на количество ядер CPU, чтобы находиться в интервале [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и при этом получать среднее значение метрики использования ресурсов. Если указано, вместо фактического количества ядер CPU может использоваться квота CPU Cgroup, делённая на её период, и в этом случае значение этой метрики в отдельные моменты может превышать 1.

OSGuestTimecpu_suffix

Отношение времени, в течение которого выполняется виртуальный CPU для гостевых операционных систем под управлением ядра Linux (см. man procfs). Это общесистемная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server. Эта метрика не представляет интереса для ClickHouse, но приводится для полноты. Значение для одного ядра CPU находится в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..число ядер].

OSGuestTimeNormalized

Значение аналогично OSGuestTime, но делится на количество ядер CPU, чтобы лежать в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и при этом получать корректную среднюю метрику использования ресурсов. Если задана QUOTA CPU Cgroup, вместо фактического числа ядер CPU может использоваться её значение, делённое на период; в этом случае значение этой метрики в отдельные моменты может превышать 1.

OSIdleTimecpu_suffix

Отношение времени, в течение которого ядро CPU простаивало (не было даже готово к выполнению процесса, ожидающего IO), с точки зрения ядра ОС. Это системная метрика: она включает все процессы на хостовой системе, а не только clickhouse-server. В нее не входит время, когда загрузка CPU была ниже максимальной по причинам, внутренним для самого CPU (загрузки памяти, остановки конвейера, ошибки предсказания переходов, выполнение другого SMT-ядра). Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..число ядер].

OSIdleTimeNormalized

Значение похоже на OSIdleTime, но делится на количество ядер CPU, чтобы находиться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере даже при различном количестве ядер и при этом получать среднюю метрику использования ресурсов. Если указано, вместо фактического количества ядер CPU может использоваться квота CPU cgroup, делённая на её период, и в этом случае значение этой метрики в отдельные моменты может превышать 1.

OSInterrupts

Количество прерываний на хосте. Это метрика на уровне всей системы: она учитывает все процессы на хосте, а не только clickhouse-server.

OSIOWaitTimecpu_suffix

Доля времени, в течение которого ядро CPU не выполняло код, но при этом ядро ОС не запускало на данном CPU никакие другие процессы, поскольку процессы ожидали операции ввода-вывода (I/O). Это системная метрика: она учитывает все процессы на хосте, а не только clickhouse-server. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..число ядер].

OSIOWaitTimeNormalized

Значение аналогично OSIOWaitTime, но делится на количество ядер CPU, чтобы лежать в диапазоне [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер различается, и при этом получать усреднённый показатель использования ресурсов. Если задано, вместо фактического количества ядер CPU может использоваться квота CPU cgroup, делённая на её период, и в этом случае значение этой метрики в некоторые моменты может превышать 1.

OSIrqTimecpu_suffix

Отношение времени, затраченного на обработку аппаратных прерываний на CPU. Это метрика на уровне всей системы: она учитывает все процессы на хостовой машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на некорректную конфигурацию аппаратного обеспечения или очень высокую сетевую нагрузку. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как их сумма и лежит в интервале [0..число ядер].

OSIrqTimeNormalized

Значение аналогично OSIrqTime, но делённое на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если число ядер на них различается, и при этом получать усреднённую метрику использования ресурсов. Если она задана, вместо фактического количества ядер CPU может использоваться QUOTA CPU Cgroup, делённая на её период, и в этом случае значение этой метрики в отдельные моменты времени может превышать 1.

OSMemoryAvailable

Объём доступной для использования программами памяти (в байтах). Очень похожа на метрику OSMemoryFreePlusCached. Это метрика на уровне всей системы: она учитывает все процессы на хостовой машине, а не только clickhouse-server.

OSMemoryBuffers

Объём памяти, используемой буферами ядра ОС, в байтах. Обычно это значение должно быть небольшим; большие значения могут указывать на некорректную конфигурацию ОС. Это системная метрика: она охватывает все процессы на хосте, а не только clickhouse-server.

OSMemoryCached

Объем памяти, используемой кэшем страниц ОС, в байтах. Как правило, почти вся доступная память используется кэшем страниц ОС — высокие значения этой метрики являются нормальными и ожидаемыми. Это системная метрика: она включает все процессы на хосте, а не только clickhouse-server.

OSMemoryFreePlusCached

Количество свободной памяти плюс память кэша страниц ОС на хост-системе, в байтах. Эта память доступна для использования программами. Значение должно быть очень близко к OSMemoryAvailable. Это системная метрика: она учитывает все процессы на хосте, а не только clickhouse-server.

OSMemoryFreeWithoutCached

Объём свободной памяти на хост-системе в байтах. Сюда не входит память, используемая кэшем страниц ОС. Память кэша страниц также доступна для использования программами, поэтому значение этого метрика может быть сбивающим с толку. Вместо этого см. метрику OSMemoryAvailable. Для удобства мы также предоставляем метрику OSMemoryFreePlusCached, которая должна быть в некоторой степени похожа на OSMemoryAvailable. См. также https://www.linuxatemyram.com/. Это системный метрик: он включает все процессы на хост-машине, а не только clickhouse-server.

OSMemorySwapCached

Объём памяти в swap, которая также загружена в оперативную память. В производственных системах swap должен быть отключён. Если значение этой метрики велико, это указывает на неверную конфигурацию. Это метрика на уровне всей системы: она учитывает все процессы на хосте, а не только clickhouse-server.

OSMemoryTotal

Общий объём памяти на хосте, в байтах.

OSNiceTimecpu_suffix

Доля времени, когда ядро CPU выполняло пользовательский код с более высоким приоритетом. Это системная метрика: она учитывает все процессы на хосте, а не только clickhouse-server. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..количество ядер].

OSNiceTimeNormalized

Значение аналогично OSNiceTime, но делится на количество ядер CPU и тем самым нормализуется к интервалу [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер на них различается, и при этом получать среднюю метрику использования ресурсов. Если указано, вместо фактического числа ядер CPU может использоваться QUOTA Cgroup для CPU, делённая на её период, и в этом случае значение этой метрики в некоторые моменты может превышать 1.

OSOpenFiles

Общее количество открытых файлов на хостовой машине. Это системная метрика на уровне всей системы: она включает все процессы на хостовой машине, а не только clickhouse-server.

OSProcessesBlocked

Количество потоков, ожидающих завершения операций ввода-вывода (man procfs). Это системная метрика: она включает все процессы на хосте, а не только clickhouse-server.

OSProcessesCreated

Количество созданных процессов. Это системная метрика: она включает все процессы на хосте, а не только clickhouse-server.

OSProcessesRunning

Количество исполняемых потоков (работающих или готовых к выполнению) с точки зрения операционной системы. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server.

OSSoftIrqTimecpu_suffix

Доля времени, затраченного на обработку программных прерываний на CPU. Это системная метрика: она учитывает все процессы на хосте, а не только clickhouse-server. Высокое значение этой метрики может указывать на неэффективно работающее программное обеспечение в системе. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..число ядер].

OSSoftIrqTimeNormalized

Значение аналогично OSSoftIrqTime, но делится на количество процессорных ядер, чтобы находиться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер отличается, и при этом получать среднюю метрику использования ресурсов. Если указано, вместо фактического количества процессорных ядер может использоваться квота Cgroup по CPU, делённая на её период, и в этом случае значение этой метрики в отдельные моменты может превышать 1.

OSStealTimecpu_suffix

Отношение времени, которое CPU проводит в других операционных системах при работе в виртуализированной среде. Это системная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server. Не каждая виртуализированная среда предоставляет эту метрику, и большинство — нет. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам и лежит в интервале [0..num cores].

OSStealTimeNormalized

Значение аналогично OSStealTime, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от их числа. Это позволяет усреднять значения этого метрика по нескольким серверам кластера, даже если количество ядер неоднородно, и при этом получать средний показатель использования ресурсов. Если задана квота Cgroup по CPU (QUOTA), вместо фактического количества ядер CPU может использоваться она, делённая на её период, и в этом случае значение этой метрики в отдельные моменты времени может превышать 1.

OSSystemTimecpu_suffix

Отношение времени, в течение которого ядро CPU выполняло код ядра операционной системы (system). Это системная метрика: она учитывает все процессы на хост‑машине, а не только clickhouse-server. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..число ядер].

OSSystemTimeNormalized

Значение аналогично OSSystemTime, но нормируется по количеству ядер CPU, чтобы лежать в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер различается, и при этом получать средний показатель использования ресурсов. Если указано, вместо фактического числа ядер CPU может использоваться квота CPU cgroup, делённая на её период, и в таком случае значение этой метрики может в отдельные моменты времени превышать 1.

OSThreadsRunnable

Общее количество потоков в состоянии «runnable», как их видит планировщик ядра операционной системы.

OSThreadsTotal

Общее количество потоков, как его видит планировщик ядра операционной системы.

OSUptime

Время непрерывной работы хост-сервера (машины, на которой запущен ClickHouse), в секундах.

OSUserTimecpu_suffix

Доля времени, в течение которого ядро CPU выполняло код в пространстве пользователя. Это метрика на уровне всей системы; она включает все процессы на хостовой машине, а не только clickhouse-server. Сюда также входит время, когда CPU был недоиспользован по причинам, связанным с самим CPU (загрузки из памяти, простои конвейера, ошибочные предсказания переходов, выполнение другого SMT‑потока). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..количество ядер].

OSUserTimeNormalized

Значение аналогично OSUserTime, но делится на количество ядер CPU, чтобы находиться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и при этом получать усреднённый показатель использования ресурсов. Если указано, вместо фактического количества ядер CPU может использоваться квота Cgroup CPU, делённая на её период, и в этом случае значение этой метрики в отдельные моменты времени может превышать 1.

PageCacheMaxBytes

Текущий предел размера кэша страниц в пространстве пользователя, в байтах.

PostgreSQLRejectedConnections

Количество отклонённых подключений по протоколу совместимости с PostgreSQL.

PostgreSQLThreads

Количество потоков на сервере протокола совместимости PostgreSQL.

ProcessSignalQueueLimit

Общий лимит очереди сигналов (при достижении значения ProcessSignalQueueSize возможны ошибки CANNOT_CREATE_TIMER)

ProcessSignalQueueSize

Размер очереди сигналов (сигналы в ожидании, таймеры для сбора данных профилирования запросов)

PrometheusRejectedConnections

Количество отклонённых подключений к конечной точке Prometheus. Примечание: конечные точки Prometheus также доступны через стандартные порты HTTP/HTTPS.

PrometheusThreads

Количество потоков на сервере эндпоинта Prometheus. Примечание: эндпоинты Prometheus также могут использоваться через обычные порты HTTP/HTTPS.

PSI_type_stall_type

Время простоя в микросекундах с момента последнего измерения. Документацию по этим метрикам и их интерпретации см. по адресу: https://docs.kernel.org/accounting/psi.html

QueriesMemoryUsage

Общий объём памяти, который в данный момент используют все выполняющиеся на сервере запросы, в байтах. Полезно для соотнесения нагрузки на память с количеством одновременно выполняющихся запросов.

QueriesPeakMemoryUsage

Сумма пикового потребления памяти запросами для всех пользователей, отслеживаемых в ProcessList, в байтах. Пик для каждого пользователя — это максимальное значение, достигнутое его трекером памяти; оно сбрасывается, когда у пользователя нет выполняющихся запросов. Таким образом, это агрегированное значение текущих отслеживаемых пользовательских пиков, а не единый общесерверный пик всех запросов с момента запуска.

ReplicasMaxAbsoluteDelay

Максимальная разница в секундах между самой свежей реплицированной частью и самой свежей частью данных, которую ещё предстоит реплицировать, по таблицам типа Replicated. Очень большое значение указывает на реплику без данных.

ReplicasMaxInsertsInQueue

Максимальное количество операций INSERT в очереди (ещё не реплицированных) во всех Replicated-таблицах.

ReplicasMaxMergesInQueue

Максимальное количество операций слияния в очереди (ещё не выполненных) во всех таблицах Replicated.

ReplicasMaxQueueSize

Максимальный размер очереди (по количеству операций, таких как get, merge) во всех реплицируемых таблицах.

ReplicasMaxRelativeDelay

Максимальная разница между задержкой реплики и задержкой наиболее актуальной реплики той же таблицы во всех таблицах типа Replicated.

ReplicasSumInsertsInQueue

Сумма операций INSERT в очереди (ожидающих репликации) по всем реплицированным таблицам.

ReplicasSumMergesInQueue

Суммарное количество операций слияния в очереди (ещё не применённых) по всем реплицированным таблицам.

ReplicasSumQueueSize

Суммарный размер очереди (в количестве операций типа get, merge) по всем реплицированным таблицам.

TCPRejectedConnections

Количество отклонённых соединений по протоколу TCP (без TLS).

TCPSecureRejectedConnections

Число отклонённых TCP-соединений (с TLS).

TCPSecureThreads

Количество потоков в сервере протокола TCP (с поддержкой TLS).

TCPThreads

Количество потоков на сервере протокола TCP (без TLS).

Temperaturei

Температура соответствующего устройства в ℃. Датчик может сообщить нереалистичное значение. Источник: /sys/class/thermal

Temperature_hwmon_name

Температура в ℃, считываемая соответствующим аппаратным монитором. Датчик может возвращать нереалистичное значение. Источник: /sys/class/hwmon

Temperature_hwmon_name_sensor_name

Температура в ℃, считываемая соответствующим аппаратным монитором и датчиком. Датчик может возвращать нереалистичное значение. Источник: /sys/class/hwmon

TotalBytesOfMergeTreeTables

Общий объем (в байтах, в сжатом виде, включая данные и индексы), хранящийся во всех таблицах семейства MergeTree.

TotalBytesOfMergeTreeTablesSystem

Общее количество байт (в сжатом виде, включая данные и индексы), хранящихся в таблицах семейства MergeTree в системной базе данных.

TotalIndexGranularityBytesInMemory

Общий объем памяти (в байтах), занимаемый гранулами индекса (учитываются только активные части).

TotalIndexGranularityBytesInMemoryAllocated

Общий объём памяти (в байтах), зарезервированный для индексных гранул (учитываются только активные части).

TotalPartsOfMergeTreeTables

Общее количество частей во всех таблицах семейства MergeTree. Значения свыше 10 000 ухудшают время запуска сервера и могут указывать на неудачный выбор ключа партиции.

TotalPartsOfMergeTreeTablesSystem

Общее количество частей в таблицах семейства MergeTree в системной базе данных.

TotalPrimaryKeyBytesInMemory

Общее количество памяти (в байтах), используемой под значения первичного ключа (учитываются только активные части).

TotalPrimaryKeyBytesInMemoryAllocated

Общий объем памяти (в байтах), выделенной под значения первичного ключа (учитываются только активные части).

TotalProjectionIndexGranularityBytesInMemory

Общий объём памяти (в байтах), занимаемый гранулярностью индекса проекции (учитываются только активные части).

TotalProjectionIndexGranularityBytesInMemoryAllocated

Общий объём памяти (в байтах), выделенный под гранулярность индекса проекции (учитываются только активные части).

TotalProjectionPrimaryKeyBytesInMemory

Общий объём памяти (в байтах), занимаемый значениями первичного ключа проекций (учитываются только активные части).

TotalProjectionPrimaryKeyBytesInMemoryAllocated

Общий объём памяти (в байтах), выделенный для значений первичного ключа проекции (учитываются только активные части).

TotalRowsOfMergeTreeTables

Общее количество строк (записей), хранящихся во всех таблицах семейства движков MergeTree.

TotalRowsOfMergeTreeTablesSystem

Общее количество строк (записей), хранящихся в таблицах семейства MergeTree в системной базе данных.

TrackedMemory

Объём памяти, отслеживаемый ClickHouse (должен быть равен метрике MemoryTracking), в байтах.

Время работы сервера

Время работы сервера в секундах. Включает время, затраченное на инициализацию сервера до начала принятия подключений.

Максимальное число отображений памяти

Максимальное число отображений памяти, которое может иметь процесс (/proc/sys/vm/max_map_count).

VMNumMaps

Текущее количество отображений памяти процесса (/proc/self/maps). Если оно близко к максимальному значению (VMMaxMapCount), следует увеличить лимит vm.max_map_count в /etc/sysctl.conf

ZooKeeperClientLastZXIDSeen

Последний ZXID, зафиксированный в текущем сеансе клиента ZooKeeper. Это значение монотонно увеличивается по мере того, как клиент наблюдает транзакции из ZooKeeper.

См. также

  • Monitoring — Базовые концепции мониторинга ClickHouse.
  • system.metrics — Содержит мгновенно вычисляемые метрики.
  • system.events — Содержит счётчики произошедших событий.
  • system.metric_log — Содержит историю значений метрик из таблиц system.metrics и system.events.