Ускоряем PostgreSQL с помощью Tuned

от автора

Администраторам баз данных всегда хочется, чтобы их СУБД работали быстрее. Всегда кажется, что можно прооптимизировать определенные настройки, и запросы начнут отрабатывать быстрее.

Есть множество различных параметров и настроек, которые позволяют оптимизировать работу БД PostgreSQL. В этой статье мы не будем пытаться охватить их все и поговорим об оптимизации параметров операционной и файловой систем, а также памяти на самом сервере СУБД.

Оптимизируем ОС

Далее мы будем предполагать, что наш PostgreSQL развернут под Linux. В моих примерах будет использоваться Ubuntu, но это не принципиально.

Начнем с оптимизации ОС. Конечно, можно вручную вносить изменения /etc/sysctl, но лучше воспользоваться специализированными утилитами, например, tuned. Установим эту утилиту.

$ sudo apt update

$ sudo apt install tuned

И запустим:

$ sudo systemctl enable --now tuned

Утилита tuned поставляется с множеством предопределенных профилей. Вы можете получить их список с помощью команды:

tuned-adm list

Вы можете запустить следующую команду, чтобы узнать, какой профиль порекомендует настроенный демон tuned после оценки вашей системы: 

tuned-adm recommend

Используйте приведенную ниже команду, чтобы увидеть предварительно настроенное значение:

tuned-adm active

В моем примере используется виртуальная машина под Ubuntu, и утилита соответственно предложила профиль virtual-guest. Однако очень часто настройки по умолчанию могут замедлить работу самой СУБД PostgreSQL, например, они могут предпочесть энергосбережение, что, естественно, замедлит работу процессоров. Аналогичные аргументы справедливы и для настройки сети и интерфейсов ввода-вывода.

Поэтому, если мы хотим оптимизировать работу базы данных на нашем сервере, то нам лучше всего не полагаться на уже готовые профили, а создать наш собственный профиль производительности PostgreSQL.

Создаем новый профиль

Создать новый профиль можно довольно просто. Файлы с профилями tuned хранятся в /etc/tuned, соответственно, нам потребуются права root. Создадим в /etc/tuned каталог pg_test, а в нем — файл tuned.conf:

sudo mkdir /etc/tuned/pg_test

cd pg_test

sudo nano tuned.conf

[main]  summary=Tuned profile for PostgreSQL Instances  [bootloader]  cmdline=transparent_hugepage=never  [cpu]  governor=performance energy_perf_bias=performance min_perf_pct=100  [sysctl]  vm.swappiness = 10 vm.dirty_expire_centisecs = 500 vm.dirty_writeback_centisecs = 250 vm.dirty_ratio = 10 vm.dirty_background_ratio = 3 vm.overcommit_memory=0 net.ipv4.tcp_timestamps=0  [vm]  transparent_hugepages=never

Строки, содержащие [ и ], называются настроенными плагинами и используются для взаимодействия с соответствующей частью системы. Давайте подробнее рассмотрим эти параметры и значения:

Плагин [main] содержит сводную информацию и может также включать значения из других настроенных профилей с помощью инструкций include, хотя в нашем примере такие конструкции не используются.

Плагин [cpu] включает в себя настройки и мощности процессора.

Плагин [sysctl] включает в себя значения, которые взаимодействуют с procfs.

Плагины [vm] и [bootloader] включают/отключают прозрачные большие страницы памяти (плагин bootloader поможет нам взаимодействовать с параметрами командной строки GRUB). Большие страницы — это группа из следующих друг за другом страниц виртуальной памяти, объединенных в одну большую.

В результате использования нашего профиля мы хотим достичь следующих результатов. Во-первых, процессоры не будут переходить в режим энергосбережения и наша СУБД PostgreSQL не будет страдать от случайного снижения производительности. Во-вторых, операционная система будет меньше использовать файл подкачки. Параметр vm.swappiness влияет на работу системы со swap. Он задает процент свободной оперативной памяти, при котором начинается использование подкачки. Значение vm.swappiness по умолчанию — 60. У нас указано 10.

В-третьих, ядро поможет Postgres обрабатывать измененные (dirty) данные на диск. Используемые vm.dirty_ratio и vm.dirty_background_ratio — это параметры для настройки работы подсистемы виртуальной памяти ядра Linux и записи изменённых (dirty) данных на диск.

vm.dirty_ratio указывает количество страниц, при достижении которого выполняющий запись процесс сам начнёт записывать изменённые данные из памяти на диск.

vm.dirty_background_ratio определяет количество страниц, при достижении которого фоновые потоки для записи данных в ядре начнут записывать изменённые данные из памяти на диск.

Также, мы отключаем временные метки TCP, чтобы избежать или, по крайней мере, уменьшить всплески, вызванные их генерацией.

И наконец, отключение прозрачных огромных страниц transparent_hugepages=never значительно повышает производительность PostgreSQL в целом.

Разобрав, какие именно изменения мы хотим внести в настройки операционной системы, давайте применим их. Для этого выполним следующую команду:

sudo tuned-adm profile pg_test

Выполнение этой команды может занять некоторое время.

Для того, чтобы завершить нашу борьбу с прозрачными большими страницами, выполним команду и перезагрузимся:

sudo grub-mkconfig -o /boot/grub/grub.cfg

sudo systemctl start reboot.target

Не забудьте убедиться, что система успешно пережила перезагрузку.

Оптимизация файловой системы

Итак, мы разобрались с операционной системой, но еще надо оптимизировать файловую систему для повышения производительности. PostgreSQL не использует время (временную метку, при которой к файлу осуществлялся последний доступ) для файлов данных, поэтому их отключение сэкономит циклы работы процессора.

Давайте откроем файл /etc/fstab и добавим noatime рядом со значением по умолчанию для диска, на котором хранятся данные PostgreSQL и файлы WAL.

 /dev/mapper/pgdata-01-data /pgdata xfs defaults,noatime 1 1

Активируем изменения с помощью команды:

 mount -o remount,noatime,nodiratime /pgdata

Эти рекомендации хороши для начала, но вам нужно следить как за операционной системой, так и за PostgreSQL, для того, чтобы в дальнейшем выполнять тонкую настройку.

Оптимизация файловой системы

Ранее мы уже отключили для повышения производительности прозрачные большие страницы. Теперь давайте разберемся с большими страницами в целом.

По умолчанию размер страницы в Linux равен 4 КБ. Обычный экземпляр PostgreSQL может требовать много гигабайт памяти, что приводит к потенциальным проблемам с производительностью из-за небольшого размера страницы. Кроме того, поскольку эти страницы будут фрагментированы, их отображение для больших наборов данных требует дополнительного времени.

Включение больших страниц в Linux повысит производительность PostgreSQL, поскольку в нем будут выделяться большие блоки памяти в целом.

По умолчанию в Linux не включены большие страницы, что также подходит для работы PostgreSQL, так как по умолчанию в конфигурационном файле СУБД используется значение huge_pages try, что означает «использовать большие страницы, если они доступны в ОС, в противном случае нет».

Настройка больших страниц для PostgreSQL зависит от двух аспектов: настройки операционной системы и настройки PostgreSQL.

Сначала выясните, сколько больших страниц требуется вашей системе для PostgreSQL. Когда запускается экземпляр PostgreSQL, postmaster создает файл postmaster.pid в $PGDATA. Там вы можете найти pid основного процесса: 

$ head -n 1 $PGDATA/postmaster.pid

902

Далее давайте найдем пиковое значение использования виртуальной памяти VmPeak для данного инстанса:

$ grep -i vmpeak /proc/902/status

Обратите внимание, на то, что если у вас на одном сервере запущено более одного экземпляра PostgreSQL, на следующем шаге рассчитайте сумму всех пиковых значений.

Узнаем Hugepagesize:

$ grep -i hugepagesize /proc/meminfo

Наконец, давайте подсчитаем количество больших страниц, которые понадобятся нашим экземпляру(ам):

222596 / 2048 = 108,68

В случае с моей виртуалкой потребовалось относительно немного страниц, но на боевой системе это соотношение может быть гораздо больше. Если вы слишком сильно увеличите это значение, процессы, которым требуется мало страниц и места в операционной системе, не смогут запуститься. Это может даже привести к сбою загрузки операционной системы или сбою запуска других экземпляров PostgreSQL на том же сервере.

Теперь отредактируйте tuned.conf, созданный ранее, и добавьте следующую строку в раздел [sysctl]:

 vm.nr_hugepages=110

Затем примените изменения:

sudo tuned-adm profile pg_test

Далее в файле настроек СУБД postgresql.conf можно разрешить использование больших страниц, указав:

 huge_pages=on

После этого не забудьте перезапустить PostgreSQL.

Для того, чтобы завершить наши настройки, нам необходимо, чтобы демон tuned запускался перед демоном PostgreSQL. Для этого выполним:

 sudo systemctl edit postgresql-13.service

И добавим в файл две строки:

 [Unit]

After=tuned.service

Затем:

sudo systemctl daemon-reload

Заключение

В этой статье мы рассмотрели основные моменты, связанные с оптимизацией работы операционной и файловой системы на сервере СУБД PostgreSQL. Помимо этого, для оптимизации работы БД можно выполнить также ряд других настроек, о которых пойдет речь в последующих статьях.


Больше актуальных навыков по инфраструктуре приложений вы можете получить в рамках практических онлайн-курсов от экспертов отрасли. Также приглашаем на ближайшие открытые уроки по PostgreSQL:


ссылка на оригинал статьи https://habr.com/ru/articles/859270/