system.asynchronous_metrics
Данные в этой системной таблице хранятся локально на каждом узле в ClickHouse Cloud. Поэтому для получения полного обзора всех данных требуется функция clusterAllReplicas. Подробности см. здесь.
Описание
Содержит метрики, которые периодически вычисляются в фоновом режиме. Например, объём используемой оперативной памяти.
Столбцы
metric(String) — имя метрики.value(Float64) — значение метрики.description(String) — описание метрики.
Пример
Описания метрик
Приведённые ниже описания сгенерированы из исходного кода C++ с помощью utils/generate-async-metrics-docs. Единственным источником истины служит строковый литерал рядом с регистрацией каждой метрики в src/Common/AsynchronousMetrics.cpp, src/Interpreters/ServerAsynchronousMetrics.cpp и src/Coordination/KeeperAsynchronousMetrics.cpp. Имена метрик, содержащие переменный suffix (для каждого диска, для каждого CPU, для каждого interface и т. д.), показаны с placeholder *name*; работающий сервер возвращает их с подставленным конкретным суффиксом.
AsynchronousHeavyMetricsCalculationTimeSpent
Время в секундах, затраченное на вычисление тяжёлых асинхронных метрик, связанных с таблицами (это накладные расходы, связанные с асинхронными метриками).
AsynchronousHeavyMetricsUpdateInterval
Интервал обновления «тяжёлых» метрик, связанных с таблицами
AsynchronousMetricsCalculationTimeSpent
Время в секундах, затраченное на вычисление асинхронных метрик (накладные расходы на асинхронные метрики).
AsynchronousMetricsUpdateInterval
Интервал обновления метрик
AsyncLoggingmetric_firstQueueSize
Количество асинхронных сообщений в очереди, ожидающих записи в журнал в этом канале
BlockActiveTime_name
Время в секундах, в течение которого для блочного устройства были поставлены в очередь запросы ввода-вывода (I/O). Это системная метрика: она учитывает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockActiveTimePerOp_name
Аналогично метрикам BlockActiveTime, но значение делится на количество операций ввода-вывода, чтобы получить время на одну операцию.
BlockDiscardBytes_name
Объём отброшенных байт на блочном устройстве. Эти операции актуальны для SSD. Операции discard не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardMerges_name
Количество операций сброса (discard), запрошенных для блочного устройства и объединённых планировщиком ввода-вывода ОС. Эти операции актуальны для SSD. Операции сброса не используются ClickHouse, но могут использоваться другими процессами в системе. Это системная метрика, она включает все процессы на хостовой машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardOps_name
Количество операций сброса (discard), запрошенных у блочного устройства. Эти операции актуальны для SSD. Операции сброса не используются ClickHouse, но могут использоваться другими процессами в системе. Это системная метрика, она включает все процессы на хостовой машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardTime_name
Время в секундах, затраченное на операции discard, запрошенные у блочного устройства, суммарно по всем операциям. Эти операции актуальны для SSD. Операции discard не используются ClickHouse, но могут использоваться другими процессами в системе. Это системная метрика, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockInFlightOps_name
Это значение показывает количество запросов ввода-вывода (I/O), которые были переданы драйверу устройства, но еще не завершены. Оно не включает запросы ввода-вывода, которые находятся в очереди, но еще не переданы драйверу устройства. Это системная метрика; она охватывает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockQueueTime_name
Это значение показывает количество миллисекунд, в течение которых запросы ввода-вывода (I/O) ожидали на этом блочном устройстве. Если одновременно ожидает несколько запросов ввода-вывода, это значение увеличивается как произведение числа миллисекунд на число ожидающих запросов. Это системная метрика; она учитывает все процессы на хостовой системе, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockQueueTimePerOp_name
Аналогично метрикам BlockQueueTime, но здесь значение делится на количество операций ввода-вывода, чтобы получить время на одну операцию.
BlockReadBytes_name
Количество байт, прочитанных с блочного устройства. Может быть меньше количества байт, прочитанных из файловой системы, из-за использования кэша страниц ОС, который уменьшает объем операций ввода-вывода (I/O). Это системная метрика, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadMerges_name
Количество операций чтения, запрошенных у блочного устройства и объединённых планировщиком ввода-вывода ОС. Это системная метрика; она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadOps_name
Количество операций чтения, запрошенных у блочного устройства. Это системная метрика, она включает все процессы на хостовой машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadTime_name
Время в секундах, затраченное на операции чтения, выполняемые блочным устройством, суммированное по всем операциям. Это метрика уровня всей системы: она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteBytes_name
Количество байт, записанных на блочное устройство. Это значение может быть меньше количества байт, записанных в файловую систему, из‑за использования кэша страниц ОС, который уменьшает объем операций ввода‑вывода (I/O). Запись на блочное устройство может произойти позже соответствующей записи в файловую систему из‑за кэширования с прямой записью (write-through caching). Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteMerges_name
Количество операций записи, запрошенных у блочного устройства и объединённых планировщиком ввода-вывода ОС. Это системная метрика, охватывающая все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteOps_name
Количество операций записи, запрошенных у блочного устройства. Это метрика на уровне всей системы: она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteTime_name
Время в секундах, затраченное на операции записи, выполняемые блочным устройством, суммарно по всем операциям. Это метрика на уровне всей системы: она учитывает все процессы на хост‑машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
CGroupMaxCPU
Максимальное количество ядер CPU в соответствии с CGroups.
CGroupMemoryTotal
Общий объём памяти в cgroup, в байтах. Если указано значение 0, лимит совпадает с OSMemoryTotal.
CGroupMemoryUsed
Объём памяти, используемой в cgroup, в байтах. В cgroup v2 это anon + sock + невытесняемая память ядра; в cgroup v1 — RSS. В обоих случаях кэш страниц ядра ОС (файловый кэш) не учитывается.
CGroupMemoryUsedWithoutPageCache
Объем памяти, используемой в cgroup, в байтах, без учета кэша страниц ClickHouse в пространстве пользователя. Это значение CGroupMemoryUsed за вычетом размера кэша страниц в пространстве пользователя. Если кэш страниц в пространстве пользователя отключен, это значение равно CGroupMemoryUsed.
CGroupSystemTime
Доля времени, в течение которого ядро CPU выполняло код ядра ОС (system).
CGroupSystemTimeNormalized
Это значение похоже на CGroupSystemTime, но делится на число доступных ядер CPU, поэтому измеряется в диапазоне [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если число ядер различается, и при этом всё равно получать среднее значение метрики использования ресурсов. При необходимости вместо фактического числа ядер CPU можно использовать квоту CPU cgroup, делённую на её период; в этом случае значение этой метрики в отдельные моменты может превышать 1.
CGroupUserTime
Доля времени, в течение которого ядро CPU выполняло код в пространстве пользователя. Сюда также входит время, когда CPU был недоиспользован по причинам, связанным с самим CPU (загрузки из памяти, простои конвейера, ошибочные предсказания переходов, выполнение другого SMT‑потока).
CGroupUserTimeNormalized
Значение аналогично CGroupUserTime, но делится на количество доступных ядер CPU, чтобы находиться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер различается, и при этом получать метрику средней утилизации ресурсов. Если указана квота CPU для CGroup, разделённая на её период, её можно использовать вместо фактического количества ядер CPU, и в этом случае значение этой метрики в отдельные моменты может превышать 1.
CPUFrequencyMHz_core_id
Текущая частота процессора в МГц. Большинство современных CPU динамически изменяют частоту для экономии энергии и работы в режиме Turbo Boost.
DictionaryMaxUpdateDelay
Максимально допустимая задержка (в секундах) обновления словаря
DictionaryTotalFailedUpdates
Количество ошибок с момента последней успешной загрузки во всех словарях.
DiskAvailable_name
Доступное количество байт на диске (на виртуальной файловой системе). Удалённые файловые системы могут не предоставлять эту информацию и показывать очень большие значения, например 16 EiB.
DiskGetObjectThrottlerAvailable_name
Количество запросов GetObject, которые в данный момент можно отправить, не достигнув лимита троттлинга на диске (виртуальной файловой системе). Локальные файловые системы могут не предоставлять эту информацию.
DiskGetObjectThrottlerRPS_name
Предел ограничителя скорости запросов GetObject на диске в запросах в секунду (виртуальная файловая система). Локальные файловые системы могут не предоставлять эту информацию.
DiskPutObjectThrottlerAvailable_name
Количество запросов PutObject, которые в данный момент можно отправить, не достигнув предела ограничения скорости на диске (виртуальной файловой системе). Локальные файловые системы могут не предоставлять эту информацию.
DiskPutObjectThrottlerRPS_name
Лимит ограничения скорости запросов PutObject для диска, в запросах в секунду (виртуальная файловая система). Локальные файловые системы могут не предоставлять эту информацию.
DiskTotal_name
Общий размер диска (виртуальной файловой системы) в байтах. Удалённые файловые системы могут не предоставлять эту информацию и показывать очень большое значение, например 16 EiB.
DiskUnreserved_name
Доступное количество байт на диске (на виртуальной файловой системе) без учёта резервов для слияний, выборок и перемещений. Удалённые файловые системы могут не предоставлять эту информацию и показывать очень большое значение, например 16 EiB.
DiskUsed_name
Количество использованных байт на диске (виртуальная файловая система). Удалённые файловые системы могут не предоставлять эту информацию.
EDACi_Correctable
Количество исправимых ошибок памяти ECC. Высокое значение этого показателя указывает на неисправную оперативную память, которую необходимо немедленно заменить, поскольку при большом числе исправленных ошибок возможны и скрытые ошибки, приводящие к повреждению данных. Источник: /sys/devices/system/edac/mc/
EDACi_Uncorrectable
Количество неисправимых ошибок ECC в памяти. Ненулевое значение этого показателя указывает на неисправную оперативную память, которую необходимо немедленно заменить, поскольку это может привести к повреждению данных. Источник: /sys/devices/system/edac/mc/
FilesystemCacheBytes
Общее количество байт в виртуальной файловой системе cache. Этот кэш хранится на диске.
FilesystemCacheCapacity
Общая ёмкость виртуальной файловой системы cache. Этот кэш хранится на диске.
FilesystemCacheFiles
Общее количество сегментов кэшированных файлов в виртуальной файловой системе cache. Этот кэш хранится на диске.
FilesystemLogsPathAvailableBytes
Доступное количество байт на томе, где расположен каталог журналов ClickHouse. Если это значение приближается к нулю, следует настроить ротацию журналов в конфигурационном файле.
FilesystemLogsPathAvailableINodes
Количество доступных inode на томе, где примонтирован каталог с журналами ClickHouse.
FilesystemLogsPathTotalBytes
Размер тома, на который смонтирован каталог с логами ClickHouse, в байтах. Рекомендуется выделять под логи не менее 10 ГБ.
FilesystemLogsPathTotalINodes
Общее количество инодов на томе, где смонтирован каталог с логами ClickHouse.
FilesystemLogsPathUsedBytes
Занято байт на томе, где смонтирован путь к логам ClickHouse.
FilesystemLogsPathUsedINodes
Количество использованных инодов на томе, где смонтирован каталог журналов ClickHouse.
FilesystemMainPathAvailableBytes
Доступное количество байт на томе, где смонтирован основной каталог ClickHouse.
FilesystemMainPathAvailableINodes
Количество доступных inode на томе, где смонтирован основной каталог ClickHouse. Если это значение близко к нулю, это указывает на некорректную конфигурацию, и вы получите сообщение об ошибке «no space left on device», даже если диск не заполнен.
FilesystemMainPathTotalBytes
Размер тома, на который смонтирован основной каталог ClickHouse, в байтах.
FilesystemMainPathTotalINodes
Общее количество inode на томе файловой системы, где смонтирован основной путь ClickHouse. Если оно меньше 25 миллионов, это говорит о некорректной конфигурации.
FilesystemMainPathUsedBytes
Количество использованных байт на томе, где смонтирован основной путь ClickHouse.
FilesystemMainPathUsedINodes
Количество использованных инодов на томе, где смонтирован основной каталог ClickHouse. Это значение, как правило, соответствует количеству файлов.
GRPCRejectedConnections
Количество отклонённых соединений по протоколу GRPC.
GRPCThreads
Количество потоков в сервере gRPC.
HashTableStatsCacheEntries
Количество записей в кэше размеров хеш-таблиц. Этот кэш используется для предиктивной оптимизации GROUP BY.
HashTableStatsCacheHits
Количество случаев, когда предсказание размера хеш-таблицы оказалось верным.
HashTableStatsCacheMisses
Количество случаев, когда оценка размера хеш-таблицы оказывалась неверной.
HTTPConnectionPoolgroup_nameTCPRcvBufTotalBytes
Суммарный объём памяти буфера приёма TCP в ядре (sk_rmem_alloc) для всех сокетов пула HTTP-соединений.
HTTPConnectionPoolgroup_nameTCPSndBufTotalBytes
Суммарный объём памяти ядра, занимаемой TCP-буферами передачи (sk_wmem_alloc) всех сокетов пула HTTP-соединений.
HTTPRejectedConnections
Количество отклонённых соединений через HTTP-интерфейс (без TLS).
HTTPSecureRejectedConnections
Количество отклонённых соединений интерфейса HTTPS.
HTTPSecureThreads
Количество потоков в сервере HTTPS-интерфейса.
HTTPThreads
Количество потоков сервера HTTP-интерфейса (без TLS).
InterserverRejectedConnections
Число отклонённых соединений по протоколу взаимодействия между репликами (без TLS).
InterserverSecureRejectedConnections
Количество отклонённых соединений по протоколу связи между репликами (с TLS).
InterserverSecureThreads
Количество потоков в сервере протокола обмена данными между репликами (с TLS).
InterserverThreads
Количество потоков в сервере протокола взаимодействия реплик (без TLS).
jemalloc.active
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). Подробнее см. https://jemalloc.net/jemalloc.3.html
jemalloc.allocated
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). Подробнее см. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.dirty_purged
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.muzzy_purged
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pactive
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). Подробнее см. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pdirty
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). Подробнее см. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pmuzzy
Внутренняя метрика низкоуровневого аллокатора памяти jemalloc. См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.dirty_decay_ms
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.num_runs
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). Подробнее см. на https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.num_threads
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.run_intervals
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См.: https://jemalloc.net/jemalloc.3.html
jemalloc.cache_arena.pactive
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.cache_arena.pdirty
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.epoch
Внутренний порядковый номер обновления статистики jemalloc (распределителя памяти Джейсона Эванса), используемый во всех остальных метриках jemalloc.
jemalloc.mapped
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). Подробнее см. https://jemalloc.net/jemalloc.3.html
jemalloc.mergetree_arena.active_bytes
Активные байты в выделенной арене jemalloc для MergeTree. Содержит долгоживущее состояние кучи MergeTree: метаданные на уровне части (NamesAndTypesList, SerializationInfoByName, отображение serializations, column_name_to_position, дерево MergeTreeDataPartChecksums, делегаты Poco::LRUCache<String, ColumnSize> внутри каждой IMergeTreeDataPart, отображения ColumnSize/IndexSize на уровне части, MinMaxIndex, VersionMetadataOnDisk и сам объект MergeTreeDataPart{Compact,Wide}), а также метаданные на уровне таблицы (клоны StorageInMemoryMetadata / ColumnsDescription / VirtualColumnsDescription, настроенные через setProperties, агрегация serialization_hints и columns_descriptions_cache). В эту метрику входят как активные части, так и устаревшие части, ожидающие очистки. Не пересекается с ареной кэша и ареной JIT. Столбцы на уровне части system.parts.primary_key_bytes_in_memory[_allocated] и system.parts.index_granularity_bytes_in_memory[_allocated] являются подмножествами этой метрики (когда их значения ненулевые — они также могут находиться в PrimaryIndexCacheBytes, который расположен в арене кэша и здесь не учитывается).
jemalloc.mergetree_arena.dirty_bytes
«Грязные» байты в арене MergeTree, подлежащие очистке с возвратом ОС.
jemalloc.mergetree_arena.pactive
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.mergetree_arena.pdirty
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.metadata
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.metadata_thp
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.prof.active
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.prof.lg_sample
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.prof.thread_active_init
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.resident
Внутренняя метрика низкоуровневого аллокатора памяти jemalloc. См. https://jemalloc.net/jemalloc.3.html
jemalloc.retained
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
Джиттер
Разница между моментом времени, когда было запланировано пробуждение потока, выполняющего вычисление асинхронных метрик, и моментом времени, когда он был фактически пробуждён. Является косвенным индикатором общей задержки и отзывчивости системы.
KeeperApproximateDataSize
Примерный размер данных ClickHouse Keeper в байтах.
KeeperAvgLatency
Средняя задержка запросов в ClickHouse Keeper.
KeeperCommitLogsCacheEntries
Количество записей, хранящихся в кэше памяти для следующих журналов, ожидающих фиксации
KeeperCommitLogsCacheSize
Общий размер кэша в памяти для следующих записей журнала, ожидающих фиксации
KeeperEphemeralsCount
Количество временных узлов в ClickHouse Keeper.
KeeperFollowers
Количество followers в ClickHouse Keeper.
KeeperIsExceedingMemorySoftLimitHit
1, если ClickHouse Keeper превышает мягкий лимит памяти; в противном случае — 0.
KeeperIsFollower
1, если ClickHouse Keeper работает как follower, в противном случае — 0.
KeeperIsLeader
1, если ClickHouse Keeper — лидер, иначе 0.
KeeperIsObserver
1, если ClickHouse Keeper работает как observer, иначе — 0.
KeeperIsStandalone
1, если ClickHouse Keeper работает в автономном режиме, иначе 0.
KeeperKeyArenaSize
Размер арены памяти для ключей в ClickHouse Keeper в байтах.
KeeperLastCommittedLogIdx
Индекс последней подтверждённой записи журнала в ClickHouse Keeper.
KeeperLastLogIdx
Индекс последней записи журнала, сохранённой в ClickHouse Keeper.
KeeperLastLogTerm
Терм Raft последней записи журнала, сохранённой в ClickHouse Keeper.
KeeperLastSnapshotIdx
Индекс последней записи журнала в последнем созданном снимке.
KeeperLatestLogsCacheEntries
Количество записей, хранящихся в кэше в памяти для последних записей журнала
KeeperLatestLogsCacheSize
Общий размер кэша в памяти для последних записей журнала
KeeperLatestSnapshotSize
Размер в байтах несжатого последнего снимка, созданного ClickHouse Keeper.
KeeperMaxFileDescriptorCount
Максимальное число открытых дескрипторов файлов в ClickHouse Keeper.
KeeperMaxLatency
Максимальная задержка запросов в ClickHouse Keeper.
KeeperMinLatency
Минимальная задержка при обработке запросов в ClickHouse Keeper.
KeeperOpenFileDescriptorCount
Количество открытых файловых дескрипторов в ClickHouse Keeper.
KeeperPacketsReceived
Количество пакетов, полученных в ClickHouse Keeper.
KeeperPacketsSent
Количество пакетов, отправленных ClickHouse Keeper.
KeeperPathsWatched
Количество различных путей, для которых клиенты ClickHouse Keeper установили наблюдение.
KeeperSessionWithWatches
Количество клиентских сеансов ClickHouse Keeper с установленными наблюдениями.
KeeperSyncedFollowers
Количество follower-узлов ClickHouse Keeper, находящихся в синхронизированном состоянии.
KeeperTargetCommitLogIdx
Индекс, до которого можно зафиксировать журналы в ClickHouse Keeper.
KeeperTCPRejectedConnections
Количество отклонённых TCP-соединений Keeper (без TLS).
KeeperTCPSecureRejectedConnections
Количество отклонённых подключений по протоколу Keeper TCP (с TLS).
KeeperTCPSecureThreads
Количество потоков на сервере протокола Keeper TCP (с TLS).
KeeperTCPThreads
Количество потоков на сервере протокола Keeper TCP (без TLS).
KeeperWatchCount
Количество зарегистрированных наблюдений в ClickHouse Keeper.
KeeperZnodeCount
Количество узлов (элементов данных) в ClickHouse Keeper.
KeeperZxid
Текущий идентификатор транзакции (zxid) в ClickHouse Keeper.
LoadAverage1
Суммарная нагрузка на всю систему, усреднённая с помощью экспоненциального сглаживания за 1 минуту. Нагрузка представляет собой количество потоков во всех процессах (сущностях планировщика ядра ОС), которые в данный момент выполняются на CPU, ожидают I/O или готовы к выполнению, но прямо сейчас не запланированы к исполнению. Это число включает все процессы, а не только clickhouse-server. Значение может быть больше количества ядер CPU, если система перегружена и многие процессы готовы к выполнению, но ожидают CPU или I/O.
LoadAverage15
Суммарная нагрузка на всю систему, усреднённая с помощью экспоненциального сглаживания за 15 минут. Нагрузка представляет собой количество потоков во всех процессах (сущностях планировщика ядра ОС), которые в данный момент выполняются на CPU, ожидают I/O или готовы к выполнению, но прямо сейчас не запланированы к исполнению. Это число включает все процессы, а не только clickhouse-server. Значение может быть больше количества ядер CPU, если система перегружена и многие процессы готовы к выполнению, но ожидают CPU или I/O.
LoadAverage5
Суммарная нагрузка на всю систему, усреднённая с помощью экспоненциального сглаживания за 5 минут. Нагрузка представляет собой количество потоков во всех процессах (сущностях планировщика ядра ОС), которые в данный момент выполняются на CPU, ожидают I/O или готовы к выполнению, но прямо сейчас не запланированы к исполнению. Это число включает все процессы, а не только clickhouse-server. Значение может быть больше количества ядер CPU, если система перегружена и многие процессы готовы к выполнению, но ожидают CPU или I/O.
LongestRunningMerge
Длительность в секундах самой продолжительной фоновой операции слияния, выполняющейся в данный момент.
MaxPartCountForPartition
Максимальное количество частей на партицию во всех партициях всех таблиц семейства MergeTree. Значения более 300 указывают на неверную конфигурацию, перегрузку или массовую загрузку данных.
MemoryCode
Объём виртуальной памяти, сопоставленной со страницами машинного кода серверного процесса, в байтах.
MemoryDataAndStack
Объём виртуальной памяти, отображённой под стек и динамически выделяемую память, в байтах. Не определено, включает ли он стеки отдельных потоков и большую часть памяти, выделяемой системным вызовом mmap. Эта метрика существует только для полноты описания. Для мониторинга рекомендуется использовать метрику MemoryResident.
MemoryResident
Объём физической памяти, потребляемый серверным процессом, в байтах.
MemoryResidentMax
Максимальный объем физической памяти, используемой серверным процессом, в байтах.
MemoryResidentWithoutPageCache
Объём физической памяти, используемой серверным процессом, без учёта кэша страниц в пространстве пользователя, в байтах. Этот показатель даёт более точное представление о фактическом использовании памяти, если используется кэш страниц в пространстве пользователя. Когда кэш страниц в пространстве пользователя отключён, это значение равно MemoryResident.
MemoryShared
Объём памяти, используемой серверным процессом и одновременно другими процессами, в байтах. ClickHouse не использует разделяемую память, но часть памяти может помечаться ОС как разделяемая по её собственным причинам. Эта метрика почти не имеет смысла для мониторинга и существует только для полноты.
MemoryVirtual
Размер виртуального адресного пространства, выделенного серверным процессом, в байтах. Размер виртуального адресного пространства, как правило, значительно больше фактического потребления физической памяти и не должен использоваться для оценки реального потребления памяти. Большие значения этой метрики являются совершенно нормальными и имеют только технический смысл.
MySQLRejectedConnections
Число отклонённых соединений для протокола совместимости MySQL.
MySQLThreads
Количество потоков на сервере протокола совместимости с MySQL.
NetworkReceiveBytes_interface_name
Количество байт, полученных через сетевой интерфейс. Это метрика на уровне всей системы: она учитывает все процессы на хосте, а не только clickhouse-server.
NetworkReceiveDrop_interface_name
Объём данных в байтах в пакетах, отброшенных при приёме через сетевой интерфейс. Это системная метрика: она включает все процессы на хосте, а не только clickhouse-server.
NetworkReceiveErrors_interface_name
Количество случаев возникновения ошибок при приёме данных через сетевой интерфейс. Это общесистемная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server.
NetworkReceivePackets_interface_name
Количество сетевых пакетов, полученных через сетевой интерфейс. Это системная метрика: она включает все процессы на хосте, а не только clickhouse-server.
NetworkSendBytes_interface_name
Количество байт, отправленных через сетевой интерфейс. Это метрика уровня всей системы; она учитывает все процессы на хосте, а не только clickhouse-server.
NetworkSendDrop_interface_name
Количество раз, когда пакет был отброшен при отправке через сетевой интерфейс. Это системная метрика, она включает все процессы на хостовой машине, а не только clickhouse-server.
NetworkSendErrors_interface_name
Количество ошибок (например, повторных передач TCP), возникших при отправке данных через сетевой интерфейс. Это метрика на уровне всей системы: она учитывает все процессы на хосте, а не только clickhouse-server.
NetworkSendPackets_interface_name
Количество сетевых пакетов, отправленных через сетевой интерфейс. Это системная метрика: она включает все процессы на хосте, а не только clickhouse-server.
NetworkTCPReceiveQueue
Суммарный размер очередей приёма сетевых сокетов, используемых сервером, в TCPv4 и TCPv6.
NetworkTCPSocketRemoteAddresses
Общее число уникальных удалённых адресов сетевых сокетов, используемых сервером по TCPv4 и TCPv6.
NetworkTCPSockets
Общее число сетевых сокетов, используемых сервером по TCPv4 и TCPv6, во всех состояниях.
NetworkTCPSockets_описание
Общее число сетевых сокетов на сервере в указанном состоянии для TCPv4 и TCPv6.
NetworkTCPTransmitQueue
Суммарный размер очередей передачи сетевых сокетов, используемых сервером в TCPv4 и TCPv6.
NetworkTCPUnrecoveredRetransmits
Общий объем текущих повторных передач (не восстановленных на данный момент) для сетевых сокетов, используемых на сервере, по TCPv4 и TCPv6.
NumberOfDatabases
Общее количество баз данных на сервере.
NumberOfDetachedByUserParts
Общее количество частей, отсоединённых от таблиц MergeTree пользователями с помощью запроса ALTER TABLE DETACH (в отличие от неожиданных, повреждённых или игнорируемых частей). Сервер не отслеживает отсоединённые части и их можно удалить.
NumberOfDetachedParts
Общее количество частей, отсоединённых от таблиц MergeTree. Часть может быть отсоединена пользователем с помощью запроса ALTER TABLE DETACH или самим сервером, если часть повреждена, появилась неожиданно или не требуется. Сервер не использует отсоединённые части и их можно удалить.
NumberOfPendingMutations
Общее количество мутаций, которые ещё ожидают выполнения.
NumberOfPendingMutationsOverExecutionTime
Общее количество мутаций, для которых остались части данных, ожидающие мутации дольше значения, заданного настройкой max_pending_mutations_execution_time_to_warn.
NumberOfTables
Общее суммарное количество таблиц по всем базам данных на сервере, за исключением баз данных, которые не могут содержать таблицы MergeTree. Исключаемые движки баз данных — это те, которые формируют набор таблиц «на лету», такие как Lazy, MySQL, PostgreSQL, SQlite.
NumberOfTablesSystem
Общее количество таблиц в системной базе данных на сервере, которые хранятся в таблицах семейства MergeTree.
OSContextSwitches
Количество переключений контекста, которые система выполнила на хостовой машине. Это метрика на уровне всей системы: она включает все процессы на данном хосте, а не только clickhouse-server.
OSCPUOverload
Относительный дефицит CPU, рассчитываемый как количество потоков, ожидающих CPU, по отношению к числу потоков, использующих CPU. Если значение больше нуля, серверу не помешает больше ресурсов CPU. Если оно значительно превышает ноль, сервер может перестать отвечать. Метрика накапливается между обновлениями асинхронных метрик.
OSGuestNiceTimecpu_suffix
Отношение времени, затраченного на работу виртуального CPU для гостевых операционных систем под управлением ядра Linux, когда для гостевой системы был установлен более высокий приоритет (см. man procfs). Это системная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server. Эта метрика не имеет прямого отношения к ClickHouse, но приведена для полноты. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма значений по всем ядрам [0..число ядер].
OSGuestNiceTimeNormalized
Значение аналогично OSGuestNiceTime, но делится на количество ядер CPU, чтобы находиться в интервале [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и при этом получать среднее значение метрики использования ресурсов. Если указано, вместо фактического количества ядер CPU может использоваться квота CPU Cgroup, делённая на её период, и в этом случае значение этой метрики в отдельные моменты может превышать 1.
OSGuestTimecpu_suffix
Отношение времени, в течение которого выполняется виртуальный CPU для гостевых операционных систем под управлением ядра Linux (см. man procfs). Это общесистемная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server. Эта метрика не представляет интереса для ClickHouse, но приводится для полноты. Значение для одного ядра CPU находится в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..число ядер].
OSGuestTimeNormalized
Значение аналогично OSGuestTime, но делится на количество ядер CPU, чтобы лежать в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и при этом получать корректную среднюю метрику использования ресурсов. Если задана QUOTA CPU Cgroup, вместо фактического числа ядер CPU может использоваться её значение, делённое на период; в этом случае значение этой метрики в отдельные моменты может превышать 1.
OSIdleTimecpu_suffix
Отношение времени, в течение которого ядро CPU простаивало (не было даже готово к выполнению процесса, ожидающего IO), с точки зрения ядра ОС. Это системная метрика: она включает все процессы на хостовой системе, а не только clickhouse-server. В нее не входит время, когда загрузка CPU была ниже максимальной по причинам, внутренним для самого CPU (загрузки памяти, остановки конвейера, ошибки предсказания переходов, выполнение другого SMT-ядра). Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..число ядер].
OSIdleTimeNormalized
Значение похоже на OSIdleTime, но делится на количество ядер CPU, чтобы находиться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере даже при различном количестве ядер и при этом получать среднюю метрику использования ресурсов. Если указано, вместо фактического количества ядер CPU может использоваться квота CPU cgroup, делённая на её период, и в этом случае значение этой метрики в отдельные моменты может превышать 1.
OSInterrupts
Количество прерываний на хосте. Это метрика на уровне всей системы: она учитывает все процессы на хосте, а не только clickhouse-server.
OSIOWaitTimecpu_suffix
Доля времени, в течение которого ядро CPU не выполняло код, но при этом ядро ОС не запускало на данном CPU никакие другие процессы, поскольку процессы ожидали операции ввода-вывода (I/O). Это системная метрика: она учитывает все процессы на хосте, а не только clickhouse-server. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..число ядер].
OSIOWaitTimeNormalized
Значение аналогично OSIOWaitTime, но делится на количество ядер CPU, чтобы лежать в диапазоне [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер различается, и при этом получать усреднённый показатель использования ресурсов. Если задано, вместо фактического количества ядер CPU может использоваться квота CPU cgroup, делённая на её период, и в этом случае значение этой метрики в некоторые моменты может превышать 1.
OSIrqTimecpu_suffix
Отношение времени, затраченного на обработку аппаратных прерываний на CPU. Это метрика на уровне всей системы: она учитывает все процессы на хостовой машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на некорректную конфигурацию аппаратного обеспечения или очень высокую сетевую нагрузку. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как их сумма и лежит в интервале [0..число ядер].
OSIrqTimeNormalized
Значение аналогично OSIrqTime, но делённое на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если число ядер на них различается, и при этом получать усреднённую метрику использования ресурсов. Если она задана, вместо фактического количества ядер CPU может использоваться QUOTA CPU Cgroup, делённая на её период, и в этом случае значение этой метрики в отдельные моменты времени может превышать 1.
OSMemoryAvailable
Объём доступной для использования программами памяти (в байтах). Очень похожа на метрику OSMemoryFreePlusCached. Это метрика на уровне всей системы: она учитывает все процессы на хостовой машине, а не только clickhouse-server.
OSMemoryBuffers
Объём памяти, используемой буферами ядра ОС, в байтах. Обычно это значение должно быть небольшим; большие значения могут указывать на некорректную конфигурацию ОС. Это системная метрика: она охватывает все процессы на хосте, а не только clickhouse-server.
OSMemoryCached
Объем памяти, используемой кэшем страниц ОС, в байтах. Как правило, почти вся доступная память используется кэшем страниц ОС — высокие значения этой метрики являются нормальными и ожидаемыми. Это системная метрика: она включает все процессы на хосте, а не только clickhouse-server.
OSMemoryFreePlusCached
Количество свободной памяти плюс память кэша страниц ОС на хост-системе, в байтах. Эта память доступна для использования программами. Значение должно быть очень близко к OSMemoryAvailable. Это системная метрика: она учитывает все процессы на хосте, а не только clickhouse-server.
OSMemoryFreeWithoutCached
Объём свободной памяти на хост-системе в байтах. Сюда не входит память, используемая кэшем страниц ОС. Память кэша страниц также доступна для использования программами, поэтому значение этого метрика может быть сбивающим с толку. Вместо этого см. метрику OSMemoryAvailable. Для удобства мы также предоставляем метрику OSMemoryFreePlusCached, которая должна быть в некоторой степени похожа на OSMemoryAvailable. См. также https://www.linuxatemyram.com/. Это системный метрик: он включает все процессы на хост-машине, а не только clickhouse-server.
OSMemorySwapCached
Объём памяти в swap, которая также загружена в оперативную память. В производственных системах swap должен быть отключён. Если значение этой метрики велико, это указывает на неверную конфигурацию. Это метрика на уровне всей системы: она учитывает все процессы на хосте, а не только clickhouse-server.
OSMemoryTotal
Общий объём памяти на хосте, в байтах.
OSNiceTimecpu_suffix
Доля времени, когда ядро CPU выполняло пользовательский код с более высоким приоритетом. Это системная метрика: она учитывает все процессы на хосте, а не только clickhouse-server. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..количество ядер].
OSNiceTimeNormalized
Значение аналогично OSNiceTime, но делится на количество ядер CPU и тем самым нормализуется к интервалу [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер на них различается, и при этом получать среднюю метрику использования ресурсов. Если указано, вместо фактического числа ядер CPU может использоваться QUOTA Cgroup для CPU, делённая на её период, и в этом случае значение этой метрики в некоторые моменты может превышать 1.
OSOpenFiles
Общее количество открытых файлов на хостовой машине. Это системная метрика на уровне всей системы: она включает все процессы на хостовой машине, а не только clickhouse-server.
OSProcessesBlocked
Количество потоков, ожидающих завершения операций ввода-вывода (man procfs). Это системная метрика: она включает все процессы на хосте, а не только clickhouse-server.
OSProcessesCreated
Количество созданных процессов. Это системная метрика: она включает все процессы на хосте, а не только clickhouse-server.
OSProcessesRunning
Количество исполняемых потоков (работающих или готовых к выполнению) с точки зрения операционной системы. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server.
OSSoftIrqTimecpu_suffix
Доля времени, затраченного на обработку программных прерываний на CPU. Это системная метрика: она учитывает все процессы на хосте, а не только clickhouse-server. Высокое значение этой метрики может указывать на неэффективно работающее программное обеспечение в системе. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..число ядер].
OSSoftIrqTimeNormalized
Значение аналогично OSSoftIrqTime, но делится на количество процессорных ядер, чтобы находиться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер отличается, и при этом получать среднюю метрику использования ресурсов. Если указано, вместо фактического количества процессорных ядер может использоваться квота Cgroup по CPU, делённая на её период, и в этом случае значение этой метрики в отдельные моменты может превышать 1.
OSStealTimecpu_suffix
Отношение времени, которое CPU проводит в других операционных системах при работе в виртуализированной среде. Это системная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server. Не каждая виртуализированная среда предоставляет эту метрику, и большинство — нет. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам и лежит в интервале [0..num cores].
OSStealTimeNormalized
Значение аналогично OSStealTime, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от их числа. Это позволяет усреднять значения этого метрика по нескольким серверам кластера, даже если количество ядер неоднородно, и при этом получать средний показатель использования ресурсов. Если задана квота Cgroup по CPU (QUOTA), вместо фактического количества ядер CPU может использоваться она, делённая на её период, и в этом случае значение этой метрики в отдельные моменты времени может превышать 1.
OSSystemTimecpu_suffix
Отношение времени, в течение которого ядро CPU выполняло код ядра операционной системы (system). Это системная метрика: она учитывает все процессы на хост‑машине, а не только clickhouse-server. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..число ядер].
OSSystemTimeNormalized
Значение аналогично OSSystemTime, но нормируется по количеству ядер CPU, чтобы лежать в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер различается, и при этом получать средний показатель использования ресурсов. Если указано, вместо фактического числа ядер CPU может использоваться квота CPU cgroup, делённая на её период, и в таком случае значение этой метрики может в отдельные моменты времени превышать 1.
OSThreadsRunnable
Общее количество потоков в состоянии «runnable», как их видит планировщик ядра операционной системы.
OSThreadsTotal
Общее количество потоков, как его видит планировщик ядра операционной системы.
OSUptime
Время непрерывной работы хост-сервера (машины, на которой запущен ClickHouse), в секундах.
OSUserTimecpu_suffix
Доля времени, в течение которого ядро CPU выполняло код в пространстве пользователя. Это метрика на уровне всей системы; она включает все процессы на хостовой машине, а не только clickhouse-server. Сюда также входит время, когда CPU был недоиспользован по причинам, связанным с самим CPU (загрузки из памяти, простои конвейера, ошибочные предсказания переходов, выполнение другого SMT‑потока). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..количество ядер].
OSUserTimeNormalized
Значение аналогично OSUserTime, но делится на количество ядер CPU, чтобы находиться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и при этом получать усреднённый показатель использования ресурсов. Если указано, вместо фактического количества ядер CPU может использоваться квота Cgroup CPU, делённая на её период, и в этом случае значение этой метрики в отдельные моменты времени может превышать 1.
PageCacheMaxBytes
Текущий предел размера кэша страниц в пространстве пользователя, в байтах.
PostgreSQLRejectedConnections
Количество отклонённых подключений по протоколу совместимости с PostgreSQL.
PostgreSQLThreads
Количество потоков на сервере протокола совместимости PostgreSQL.
ProcessSignalQueueLimit
Общий лимит очереди сигналов (при достижении значения ProcessSignalQueueSize возможны ошибки CANNOT_CREATE_TIMER)
ProcessSignalQueueSize
Размер очереди сигналов (сигналы в ожидании, таймеры для сбора данных профилирования запросов)
PrometheusRejectedConnections
Количество отклонённых подключений к конечной точке Prometheus. Примечание: конечные точки Prometheus также доступны через стандартные порты HTTP/HTTPS.
PrometheusThreads
Количество потоков на сервере эндпоинта Prometheus. Примечание: эндпоинты Prometheus также могут использоваться через обычные порты HTTP/HTTPS.
PSI_type_stall_type
Время простоя в микросекундах с момента последнего измерения. Документацию по этим метрикам и их интерпретации см. по адресу: https://docs.kernel.org/accounting/psi.html
QueriesMemoryUsage
Общий объём памяти, который в данный момент используют все выполняющиеся на сервере запросы, в байтах. Полезно для соотнесения нагрузки на память с количеством одновременно выполняющихся запросов.
QueriesPeakMemoryUsage
Сумма пикового потребления памяти запросами для всех пользователей, отслеживаемых в ProcessList, в байтах. Пик для каждого пользователя — это максимальное значение, достигнутое его трекером памяти; оно сбрасывается, когда у пользователя нет выполняющихся запросов. Таким образом, это агрегированное значение текущих отслеживаемых пользовательских пиков, а не единый общесерверный пик всех запросов с момента запуска.
ReplicasMaxAbsoluteDelay
Максимальная разница в секундах между самой свежей реплицированной частью и самой свежей частью данных, которую ещё предстоит реплицировать, по таблицам типа Replicated. Очень большое значение указывает на реплику без данных.
ReplicasMaxInsertsInQueue
Максимальное количество операций INSERT в очереди (ещё не реплицированных) во всех Replicated-таблицах.
ReplicasMaxMergesInQueue
Максимальное количество операций слияния в очереди (ещё не выполненных) во всех таблицах Replicated.
ReplicasMaxQueueSize
Максимальный размер очереди (по количеству операций, таких как get, merge) во всех реплицируемых таблицах.
ReplicasMaxRelativeDelay
Максимальная разница между задержкой реплики и задержкой наиболее актуальной реплики той же таблицы во всех таблицах типа Replicated.
ReplicasSumInsertsInQueue
Сумма операций INSERT в очереди (ожидающих репликации) по всем реплицированным таблицам.
ReplicasSumMergesInQueue
Суммарное количество операций слияния в очереди (ещё не применённых) по всем реплицированным таблицам.
ReplicasSumQueueSize
Суммарный размер очереди (в количестве операций типа get, merge) по всем реплицированным таблицам.
TCPRejectedConnections
Количество отклонённых соединений по протоколу TCP (без TLS).
TCPSecureRejectedConnections
Число отклонённых TCP-соединений (с TLS).
TCPSecureThreads
Количество потоков в сервере протокола TCP (с поддержкой TLS).
TCPThreads
Количество потоков на сервере протокола TCP (без TLS).
Temperaturei
Температура соответствующего устройства в ℃. Датчик может сообщить нереалистичное значение. Источник: /sys/class/thermal
Temperature_hwmon_name
Температура в ℃, считываемая соответствующим аппаратным монитором. Датчик может возвращать нереалистичное значение. Источник: /sys/class/hwmon
Temperature_hwmon_name_sensor_name
Температура в ℃, считываемая соответствующим аппаратным монитором и датчиком. Датчик может возвращать нереалистичное значение. Источник: /sys/class/hwmon
TotalBytesOfMergeTreeTables
Общий объем (в байтах, в сжатом виде, включая данные и индексы), хранящийся во всех таблицах семейства MergeTree.
TotalBytesOfMergeTreeTablesSystem
Общее количество байт (в сжатом виде, включая данные и индексы), хранящихся в таблицах семейства MergeTree в системной базе данных.
TotalIndexGranularityBytesInMemory
Общий объем памяти (в байтах), занимаемый гранулами индекса (учитываются только активные части).
TotalIndexGranularityBytesInMemoryAllocated
Общий объём памяти (в байтах), зарезервированный для индексных гранул (учитываются только активные части).
TotalPartsOfMergeTreeTables
Общее количество частей во всех таблицах семейства MergeTree. Значения свыше 10 000 ухудшают время запуска сервера и могут указывать на неудачный выбор ключа партиции.
TotalPartsOfMergeTreeTablesSystem
Общее количество частей в таблицах семейства MergeTree в системной базе данных.
TotalPrimaryKeyBytesInMemory
Общее количество памяти (в байтах), используемой под значения первичного ключа (учитываются только активные части).
TotalPrimaryKeyBytesInMemoryAllocated
Общий объем памяти (в байтах), выделенной под значения первичного ключа (учитываются только активные части).
TotalProjectionIndexGranularityBytesInMemory
Общий объём памяти (в байтах), занимаемый гранулярностью индекса проекции (учитываются только активные части).
TotalProjectionIndexGranularityBytesInMemoryAllocated
Общий объём памяти (в байтах), выделенный под гранулярность индекса проекции (учитываются только активные части).
TotalProjectionPrimaryKeyBytesInMemory
Общий объём памяти (в байтах), занимаемый значениями первичного ключа проекций (учитываются только активные части).
TotalProjectionPrimaryKeyBytesInMemoryAllocated
Общий объём памяти (в байтах), выделенный для значений первичного ключа проекции (учитываются только активные части).
TotalRowsOfMergeTreeTables
Общее количество строк (записей), хранящихся во всех таблицах семейства движков MergeTree.
TotalRowsOfMergeTreeTablesSystem
Общее количество строк (записей), хранящихся в таблицах семейства MergeTree в системной базе данных.
TrackedMemory
Объём памяти, отслеживаемый ClickHouse (должен быть равен метрике MemoryTracking), в байтах.
Время работы сервера
Время работы сервера в секундах. Включает время, затраченное на инициализацию сервера до начала принятия подключений.
Максимальное число отображений памяти
Максимальное число отображений памяти, которое может иметь процесс (/proc/sys/vm/max_map_count).
VMNumMaps
Текущее количество отображений памяти процесса (/proc/self/maps). Если оно близко к максимальному значению (VMMaxMapCount), следует увеличить лимит vm.max_map_count в /etc/sysctl.conf
ZooKeeperClientLastZXIDSeen
Последний ZXID, зафиксированный в текущем сеансе клиента ZooKeeper. Это значение монотонно увеличивается по мере того, как клиент наблюдает транзакции из ZooKeeper.
См. также
- Monitoring — Базовые концепции мониторинга ClickHouse.
- system.metrics — Содержит мгновенно вычисляемые метрики.
- system.events — Содержит счётчики произошедших событий.
- system.metric_log — Содержит историю значений метрик из таблиц
system.metricsиsystem.events.