Ниже будет описан опыт настройки отказоустойчивой системы Master-Slave с использованием собственных ресурсов PostgresSQL — Asynchronous Replication + pgBouncer + PGHA — в формате вольного перевода с комментариями одного поста и руководства по установке.
pgHA
pgHA — программа написанная на Perl, код которой представлен в файле failoverd.pl, который и является основой инструмента. Использует в своей работе pgbouncer и собственную репликацию PostgresSQL; мониторит ведущую бд и в случае ее недоступности открывает вспомогательную бд на запись, останавливая репликацию. По крайней мере с версии 9.3 устанавливается вместе с PostgresSQL, скачать можно здесь. Процесс установки описан в файле README, который лежит в ./9.3/pgha/doc/.
На habrahabr, судя по всему, самым популярным инструментом для организации отказоустойчивости является pgpool. К сожалению существующий единичный опыт не позволяет сравнить эти два инструмента.
Настройка
Данная система требует наличия трех машин: ведущего сервера (master), вспомогательного (slave) и узла масштабирования. Можно обойтись без последнего.
1. Настройка репликации
Про настройку нативной репликации уже написано в очень многих статьях, под этим предлогом я просто сошлюсь на некоторые:
- www.rummandba.com/2013/08/postgresql-92-streaming-replication.html
- habrahabr.ru/post/106872/
- habrahabr.ru/post/188096/
2. Настройка pgBouncer
pgBouncer — легкий пулер, менеджер соединений для PostgreSQL. Здесь используется как входная точка доступа, которая перенаправляет запросы к главной бд или вспомогательной в зависимости от файла настроек. Устанавливается вместе с PostgresSQL 9.3.
- Начать настройку нужно с создания пользователя bouncer и пароля к нему на сервере — узле масштабирования, или на любой другой машине которая будет следить за состоянием ведущего сервера.
- Далее подготовить 2 файла pgbouncer.ini.orig и pgbouncer.ini.failover. Это файлы настройки pgbouncer и по сути отличаются лишь IP хостами бд: в файле .orig указан IP и порт ведущей бд, в .failover — вспомогательной. Примеры можно найти здесь.
— не забудьте создать пустой log файл и указать путь к нему
— еще нужно создать файл userlist.txt с пользователями под которыми будут делаться запросы через pgbouncer и не забыть указать путь к нему (поле auth_file), пример можно найти в ./9.3/share/doc/pgbouncer или здесь
— выбрать пользователей из созданных, которые будут обладать правами админа в отношении к pgbouncer и указать их в поле admin_users
— также нужно указать порт на котором будет находиться pgbouncer (listen_port) и далее, предварительно ознакомившись с другими заполненными полями и внеся где хочется изменения, можно обращаться к pgbouncer как к обычной бд… после запуска. - Создать файл pgbouncer.ini и скопировать в него содержимое файла pgbouncer.ini.orig. Это рабочий файл и в него далее будут копироваться файлы pgbouncer.ini.orig или pgbouncer.ini.failover в зависимости от ситуации. Создать пустой файл pgbouncer.ini_old, он будет использоваться pgha.
- Запустить pgbouncer от лица пользователя bouncer:
pgbouncer -d /путь/pgbouncer.ini
3. Настройка pgHA
- pgHA использует некоторые Perl модули, которые требуется предварительно установить. Перед этим нужно установить CPAN:
yum install perl-CPAN perl -MCPAN -e 'install Module::Build::Compat' perl -MCPAN -e 'install Config::IniFiles' perl -MCPAN -e 'install DBI' perl -MCPAN -e 'install DBD::Pg' perl -MCPAN -e 'install Log::Log4perl' perl -MCPAN -e 'install Proc::Daemon' perl -MCPAN -e 'install Net::Ping' perl -MCPAN -e 'install Nagios::Plugin'
При этом может возникать безвредная ошибка: yaml' not installed will not store persistent state. Если раздражает, можно сделать:
cpan install Bundle::CPAN reload cpan exit
- Далее следует подготовить файл настроек для pgHA, примеры которого можно найти в папке ./9.3/pgHA/cfg/ или здесь: файлы example.conf и scottmVm.conf, лучше ориентироваться на второй:
— pidFile может лежать в любом месте, нужно убедиться в доступности выбранного пути.
— logConfig находится в ./9.3/pgHA/cfg/log4perl.conf и содержит настройки логирования
— для triggerFile нужно указать файл указанный в recovery.conf
— раздел [failover] пока лучше удалить, чуть ниже будет упомянуто и о нем
— в разделе [app01] содержатся настройки pgbouncer, в том числе в конце файла описаны команды которые в случае отказа ведущей базы удаляют все соединения к ней и затем перезапускают pgbouncer для работы с новой главной бд:# Which databases should be part of failover fence_lock_dbs=postgres # pgBouncer command to pause / fence the db's fence_lock_command=kill # pgBouncer command to reload the config file fence_move_command=reload # pgBouncer command to unlock the db's fence_unlock_command=resume dbcheck="select 1"
— в разделе [app01] в поле pgbouncer_db_user должен стоять один из admin_users указанных в pgbouncer.ini
— следует ознакомиться и с остальными параметрами - Затем создать пустой log файл pgHA.log в папке /opt/pgHA/log/. Именно этот путь использует по умолчанию pgHA.
- На ведущем сервере создать таблицу описанную в файле ./9.3/pgha/cfg/status_table.sql, или здесь в бд указанной в поле dbname в разделе [master].
- Сгенерировать ssh ключ пользователя от имени которого будет запускаться pgHA и переслать его пользователю bouncer:
—ssh-keygen -t rsa
(создать пустой пароль)
— скопировать содержимое ~/.ssh/id_rsa.pub
— на машине с пользователем bouncer от его лица выполнить команды:
mkdir ~/.ssh
chmod 0700 .ssh
vi authorized_keys
(вставить ранее скопированное содержимое id_rsa.pub, закрыть с сохранением)
chmod 0600 .ssh/authorized_keys
- Запустить pgHA.
./failoverd.pl -c /путь/файлНастроекPgHA.conf --auto
Файл failoverd.pl лежит в папке ./9.3/pgHA/bin. - Если пункт 6 прошел без ошибок, остановить pgHA
./failoverd.pl -c /путь/файлНастроекPgHA.conf --stop
В данном состоянии pgHA автоматического failover не случится. Нужно открыть файл failoverd.pl, закомментировать строчку 443 и откомментировать 442 согласно коду представленному здесь. Должно получиться:# Start the failoverd monitoring process elsif ( $startWorker ) { print "ntInitializing... n"; . . . # Once we have verified that the system is online, we need # to set the failover 'spring'. $logger->info("==Startup==: Arming Failover mechanism"); print "t === Arming Failover mechanism === n"; if ( SetSpring(%Config,$logger) != 1 ) # if ( 0 ) { $logger->info("Cannot set failover configuration, exiting..."); print "Cannot set failover configuration, exiting...n"; exit(1); } . . .
Теперь при отказе ведущей базы pgHA остановит репликацию, откроет вспомогательную базу на запись, перезапустит pgbouncer с настройками для роботы с новой главной бд и завершит свою работу. Возвращать систему в исходное состояние требуется в ручную.
- Запустить pgHA. Тестить.
P.S.
В разделе [failover] указываются команды, которые исполняются во время failover. Таким образом можно, например, не менять код в failoverd.pl, а создать скрипт — который меняет файл настроек pgbouncer и перезагружает его — и указать на него.
Данное решение не уменьшает скорость работы программ, использующих базу данных, и при хорошей настройке pgbouncer может ее увеличить. Плюсом также считаю открытость кода pgHA — его можно дополнять, чтобы научить, например, попыткам перезагрузить ведущую базу перед failover, возобновлять репликацию, менять шрифт в терминале и т.д.
Решение для postgres 8.4 представлено в вышеупомянутом блоге.
Автор: chochu