Мониторинг кластера, нод и баз данных

Мониторинг кластера, нод и баз данных PostgreSQL

В облачных базах данных PostgreSQL можно отслеживать состояние кластера в панели управления:

смотреть информацию об использовании нод кластера и о нагрузке на базы данных в виде графиков в панели управления;
смотреть статус кластера;
получать уведомления о заполненности диска.

Метрики нод кластера и баз данных можно также экспортировать в формате Prometheus.

Посмотреть состояние нод кластера⁠

В панели управления перейдите в раздел Облачная платформа → Базы данных.
Откройте страницу кластера → вкладка Мониторинг.
Нажмите Мониторинг серверов кластера.
Посмотрите доступные метрики нод кластера.

Метрики нод кластера в панели управления⁠

vCPU	На сколько процентов загружены ядра нод кластера
Load Average	Среднее значение загрузки системы за период времени. Показывает, какое количество процессов обрабатывается ядрами кластера. Показатель представлен в виде трех значений — за одну минуту, пять минут и 15 минут. Эти значения должны быть не больше, чем количество ядер на ноде
Память	Занятая память без учета кэша и буферов операционной системы в процентах или гигабайтах
Диск	Занятое место на диске в процентах или гигабайтах

Посмотреть состояние баз данных⁠

В панели управления перейдите в раздел Облачная платформа → Базы данных.
Откройте страницу кластера → вкладка Мониторинг.
Нажмите Мониторинг баз данных.
Посмотрите доступные метрики баз данных.

Метрики баз данных в панели управления⁠

Подключения	Количество подключений для каждой базы данных кластера и суммарное количество подключений ко всем базам данных
Время выполнения самого долгого запроса	Время выполнения самого долгого запроса за период времени
Транзакции	Количество транзакций в секунду в каждой базе данных кластера
Операции со строками	Количество операций в выбранной базе данных в секунду: tup_deleted — количество строк, удалённое запросами в базе данных в секунду; tup_fetched — количество строк, извлеченное запросами в базе данных в секунду; tup_inserted — количество строк, вставленное запросами в базе данных в секунду; tup_returned — количество строк, возвращенное запросами в базе данных в секунду; tup_updated — количество строк, измененное запросами в базе данных в секунду.
Попадание в кэш	Какой процент данных в запросе был прочитан из кэша — отношение `blks_hit` к сумме `blks_hit` и `blks_read`
Locks	Количество блокировок в каждой базе данных кластера
Deadlocks	Количество взаимных блокировок в каждой базе данных
Метрики пулера соединений	Метрики пулера соединений PgBouncer для выбранной базы данных: количество подключений клиентов к пулу; количество активных подключений к ноде; время ожидания ответа от ноды; максимальное время ожидания клиента в очереди.

Посмотреть статус кластера⁠

В панели управления перейдите в раздел Облачная платформа → Базы данных.
Посмотрите статус в строке кластера → столбец Статус.

ACTIVE	Кластер доступен
CREATING	Кластер создается
UPDATING	К кластеру применяются изменения
RESIZING	Кластер масштабируется
ERROR	Произошла ошибка, создайте тикет
DISK FULL	Диск заполнен, кластер работает только на чтение. Чтобы кластер работал на чтение и запись, очистите диск или масштабируйте кластер и выберите конфигурацию с бóльшим размером диска
DEGRADED	Часть нод кластера недоступна
DELETING	Кластер удаляется

Уведомления о заполненности диска⁠

Если диск кластера будет заполнен на 80%, уведомление появится в панели управления и будет отправлено на электронную почту Владельца аккаунта и тех пользователей, которые подписаны на категорию уведомлений Услуги и сервисы.

Если диск кластера будет заполнен на 95% и более, кластер перейдет в статус DISK_FULL и будет работать только на чтение. Чтобы кластер работал на чтение и запись, очистите диск или масштабируйте кластер и выберите конфигурацию с бóльшим размером диска.

Экспортировать метрики в формате Prometheus⁠

Вы можете экспортировать метрики в формате Prometheus и затем самостоятельно настроить мониторинг и алерты для кластеров баз данных. Историческая информация для кластеров недоступна — метрики запрашиваются только в режиме реального времени.

Чтобы экспортировать метрики, нужно получить токен мониторинга. Токен дает доступ к метрикам всех кластеров в одном пуле проекта.

В панели управления перейдите в раздел Облачная платформа → Базы данных.
Откройте страницу кластера → вкладка Мониторинг.
В блоке Метрики в формате Prometheus нажмите Управлять токенами.
Нажмите Создать.
Введите имя токена.
Нажмите Создать. Токен будет сгенерирован автоматически.
Добавьте в конфигурационный файл Prometheus:
```
scrape_configs:
 - job_name: get-metrics-from-dbaas
   scrape_interval: 1m
   static_configs:
     - targets:
       - '<pool>.dbaas.selcloud.ru'
   scheme: https
   authorization:
     type: Bearer
     credentials: <monitoring_token>
```
Укажите:
- <pool> — пул, в котором действует токен, например ru-3. Адрес (URL) зависит от региона и пула, можно посмотреть в списке URL;
- <monitoring_token> — значение токена мониторинга.
Источник метрик появится по адресу http://<localhost>:9090/targets.

Укажите <localhost> — IP-адрес, на котором установлен Prometheus.

Посмотрите доступные метрики в формате Prometheus.

Метрики в формате Prometheus⁠

Метрики в формате Prometheus предоставляются для всех кластеров. Конкретный кластер можно найти по идентификатору кластера базы данных в лейбле ds_id.

Метрики уровня инфраструктуры
Метрики уровня приложения

dbaas_memory_percent	Занятая память без учета кэша и буферов операционной системы (RAM) в процентах
dbaas_memory_bytes	Занятая память без учета кэша и буферов операционной системы (RAM) в байтах
dbaas_cpu	Использование ядер процессора (CPU) на нодах кластера базы данных в процентах
dbaas_cpu_iowait	Время ожидания ввода/вывода в процентах
dbaas_disk_percent	Занятое место на диске в процентах
dbaas_disk_bytes	Занятое место на диске в байтах
dbaas_disk_read_iops	Количество операций чтения в секунду
dbaas_disk_write_iops	Количество операций записи в секунду
dbaas_disk_read_bytes	Скорость чтения данных с диска в байтах в секунду
dbaas_disk_write_bytes	Скорость записи данных на диск в байтах в секунду
dbaas_node_load1	Среднее значение загрузки системы за одну минуту. Показывает, какое количество процессов обрабатывается ядрами кластера
dbaas_node_load5	Среднее значение загрузки системы за пять минут. Показывает, какое количество процессов обрабатывается ядрами кластера
dbaas_node_load15	Среднее значение загрузки системы за 15 минут. Показывает, какое количество процессов обрабатывается ядрами кластера
network_receive_bits	Количество бит, принятых через сетевой интерфейс
network_transmit_bits	Количество бит, отправленных через сетевой интерфейс
network_receive_packets	Количество пакетов, принятых через сетевой интерфейс в секунду
network_transmit_packets	Количество пакетов, отправленных через сетевой интерфейс в секунду

dbaas_connections	Количество активных соединений с процессом PostgreSQL. Например, можно использовать лейблы: `ds_name` — имя кластера базы данных; `datname` — имя базы данных.
dbaas_total_connections	Общее количество установленных соединений с процессом PostgreSQL
dbaas_max_tx_duration	Время выполнения самого долгого запроса в секундах
dbaas_xact_commit_rollback	Количество транзакций в секунду в каждой базе данных кластера. Например, можно использовать лейблы: `ds_name` — имя кластера базы данных; `datname` — имя базы данных.
dbaas_tup_deleted	Количество строк в секунду, удалённое запросами в базе данных
dbaas_tup_fetched	Количество строк в секунду, извлеченное запросами в базе данных
dbaas_tup_inserted	Количество строк в секунду, вставленное запросами в базе данных
dbaas_tup_returned	Количество строк в секунду, возвращенное запросами в базе данных
dbaas_tup_updated	Количество строк в секунду, измененное запросами в базе данных
dbaas_xact_commit	Количество зафиксированных транзакций в секунду в базе данных
dbaas_xact_rollback	Количество транзакций в секунду в базе данных, для которых был выполнен откат
dbaas_cache_hit_ratio	Процент данных в запросе, которые были прочитаны из кэша — отношение `blks_hit` к сумме `blks_hit` и `blks_read`
dbaas_deadlocks	Количество взаимных блокировок в секунду в каждой базе данных. Например, можно использовать лейблы: `ds_name` — имя кластера базы данных; `datname` — имя базы данных.
dbaas_locks	Количество блокировок в секунду в каждой базе данных кластера. Например, можно использовать лейблы: `ds_name` — имя кластера базы данных; `datname` — имя базы данных.
dbaas_pg_pgss_query_texts_size_bytes	Размер файла со статистикой от `pg_stat_statements` в байтах
dbaas_pg_total_wals_size_bytes	Размер каталога с WAL-файлами в байтах
dbaas_pg_tmp_size_bytes	Размер временных файлов PostgreSQL в байтах
dbaas_pgbouncer_pools_client_maxwait_seconds	Максимальное время ожидания клиента в очереди в секундах
dbaas_pgbouncer_pools_client_waiting_connections	Количество подключений клиентов, где запрос отправлен, но соединения с нодой ещё нет
dbaas_pgbouncer_stats_client_wait_seconds_total	Время ожидания ответа от ноды в микросекундах
dbaas_pgbouncer_pools_client_active_connections	Количество подключений клиентов, связанных с серверными соединениями или простаивающих без запросов. Например, можно использовать лейблы: `ds_id` — идентификатор кластера базы данных; `data_base` — имя базы данных.
dbaas_pgbouncer_pools_server_active_connections	Количество серверных соединений, связанных с клиентами

Мониторинг кластера, нод и баз данных PostgreSQL

Посмотреть состояние нод кластера⁠​

Метрики нод кластера в панели управления⁠​

Посмотреть состояние баз данных⁠​

Метрики баз данных в панели управления⁠​

Посмотреть статус кластера⁠​

Уведомления о заполненности диска⁠​

Экспортировать метрики в формате Prometheus⁠​

Метрики в формате Prometheus⁠​