Применение статистического анализа для определения причин деградации производительности СУБД — часть 2

от автора

Продолжение Применение статистического анализа для определения причин деградации производительности СУБД

Часть 2 — ложное оповещение о деградации производительности

Нужно ли открывать инцидент о деградации производительности СУБД ?

Нужно ли открывать инцидент о деградации производительности СУБД ?

На первый взгляд имеется, что-то похожее на классическую аномалию:

  • Сдвиг

    Сдвиг в данных временного ряда

    Сдвиг в данных временного ряда

    Задача обнаружения сдвига в данных неплохо исследована, поскольку встречается в обработке сигналов.

Источник: Обнаружение аномалий в данных сетевого мониторинга методами статистики / Хабр (habr.com)

Порядок анализа

1.Статистические показатели производительности СУБД

14:05 — 14:41 — Высокая производительность

Статистика 14:05-14:11

Статистика 14:05-14:11

Важная деталь: распределение производительности и нагрузки на СУБД — симметричное. Нагрузка — постоянная.

14:41 — 15:11 — Изменение производительности

Статистика 14:41-15:11

Статистика 14:41-15:11

Важная деталь: Нагрузка — постоянная.

15:11 — 15:45 — Низкая производительность

Важная деталь: распределение производительности и нагрузки на СУБД — симметричное. Нагрузка — постоянная.

Выводы

  1. Нагрузка на СУБД в период низкой производительности СУБД (15:11-15:45) — не изменилась

  2. В период изменения производительности СУБД (14L41-15:11) — обратная корреляция между количество активных сессий и производительностью СУБД — отсутствует. Или другими словами — снижение нагрузки на СУБД коррелируется со снижением производительности СУБД.

  3. Распределение производительности СУБД в период высокой нагрузки (14:05-14:41) и низкой нагрузки (15:11-15:45) — симметричное .

Распределение производительности СУБД в период 14:05-14:41

Распределение производительности СУБД в период 14:05-14:41
Частотная диаграмма распределения производительности СУБД в период 14:05-14:41

Частотная диаграмма распределения производительности СУБД в период 14:05-14:41
Распределение производительности СУБД в период 15:11-15:45

Распределение производительности СУБД в период 15:11-15:45
Частотная диаграмма распределения производительности СУБД в период 15:11-15:45

Частотная диаграмма распределения производительности СУБД в период 15:11-15:45

2.Анализ ожиданий и производительности СУБД

14:05 — 14:41 — Высокая производительность

Ожидания и корреляция по SQL запросам в период 14:05 - 14:41

Ожидания и корреляция по SQL запросам в период 14:05 — 14:41

14:41 — 15:11 — Изменение производительности

Ожидания и корреляция по SQL запросам в период 14:41-15:11

Ожидания и корреляция по SQL запросам в период 14:41-15:11

15:11 — 15:45 — Низкая производительность

Ожидания и корреляция по SQL запросам в период 15:11-15:45

Ожидания и корреляция по SQL запросам в период 15:11-15:45

Выводы

  1. Корреляция и состав ожиданий в период высокой(14:05-14:41) и низкой(15:11-15:41) — производительности — полностью не совпадает

  2. Общий вес по событиям ожидания в период низкой(15:11-15:41) производительности существенно ниже , чем в период высокой (14:05-14:41) .

Вывод и общие итоги

Снижение производительности СУБД в период 15:11 — 15:45 вызвано изменением характера запросов к СУБД и не является инцидентом по деградации производительности СУБД .

Использование статистического анализа позволило резко снизить время на поиск возможным причин инцидента производительности .

Симметричное распределение производительности СУБД можно с некоторой долей уверенности считать признаком штатной работы СУБД.


ссылка на оригинал статьи https://habr.com/ru/articles/844268/