Муқаддима ба системаи нусхабардории wal-g PostgreSQL

ВАЛ-Г воситаи оддӣ ва муассир барои нусхабардории PostgreSQL ба абрҳо мебошад. Дар робита ба вазифаи асосии худ, он вориси асбоби маъмул аст ВАЛ-Е, аммо дар Go аз нав навишта шудааст. Аммо дар WAL-G як хусусияти нави муҳим вуҷуд дорад - нусхаҳои делта. нусхаҳои дельта ВАЛ-Г саҳифаҳои файлҳоеро, ки аз версияи қаблии нусхабардорӣ тағйир ёфтаанд, нигоҳ доред. WAL-G технологияҳои зиёдеро барои параллелизатсияи нусхабардорӣ татбиқ мекунад. WAL-G нисбат ба WAL-E хеле тезтар аст.

Муфассалтар дар бораи чӣ гуна кор кардани wal-g дар мақола пайдо кардан мумкин аст: Мо нусхабардориро overclock мекунем. Лексияи Яндекс

Протоколи нигаҳдории S3 барои нигоҳ доштани маълумот маъмул шудааст. Яке аз бартариҳои S3 ин қобилияти дастрасӣ тавассути API мебошад, ки ба шумо имкон медиҳад ҳамкории чандирро бо нигаҳдорӣ, аз ҷумла дастрасии оммавии хондан ташкил кунед, дар ҳоле ки навсозии иттилоот дар анбор танҳо аз ҷониби шахсони ваколатдор сурат мегирад.

Якчанд татбиқи нигаҳдории давлатӣ ва хусусӣ мавҷуданд, ки протоколи S3-ро истифода мебаранд. Имрӯз мо як ҳалли маъмулро барои ташкили нигаҳдории хурд - Minio дида мебароем.

Як сервери PostgreSQL барои санҷиши wal-g хуб аст ва Minio ҳамчун ивазкунандаи S3 истифода мешавад.

Server Minio

насби Minio

yum -y install yum-plugin-copr
yum copr enable -y lkiesow/minio
yum install -y minio

Таҳрири AccessKey ва SecretKey дар /etc/minio/minio.conf

vi /etc/minio/minio.conf

Агар шумо пеш аз Minio nginx-ро истифода набаред, пас шумо бояд тағир диҳед

--address 127.0.0.1:9000

--address 0.0.0.0:9000

Оғози Minio

systemctl start minio

Ба интерфейси веби Minio равед http://ip-адрес-сервера-minio:9000 ва сатил эҷод кунед (масалан, pg-backups).

Сервери DB

WAL-G дар rpm аз ҷониби ман ҷамъ карда мешавад (Антон Пацев). Github, Fedora COPR.

Кӣ системаи RPM-ро надорад, расмиро истифода баред таълим тавассути насб.

Дар баробари бинарии wal-g, rpm дорои скриптҳое мебошад, ки тағирёбандаҳоро аз файли /etc/wal-gd/server-s3.conf ворид мекунанд.

backup-fetch.sh
backup-list.sh
backup-push.sh
wal-fetch.sh
wal-g-run.sh
wal-push.sh

Валгро насб кунед.

yum -y install yum-plugin-copr
yum copr enable -y antonpatsev/wal-g
yum install -y wal-g

Санҷиши версияи wal-g.

wal-g --version
wal-g version v0.2.14

/etc/wal-gd/server-s3.conf-ро ба ниёзҳои худ таҳрир кунед.

Файлҳои конфигуратсия ва файлҳои маълумоте, ки аз ҷониби кластери пойгоҳи додаҳо истифода мешаванд, маъмулан дар директорияи додаҳои кластер якҷоя нигоҳ дошта мешаванд, ки маъмулан бо номи кластер номида мешаванд. PGDATA

#!/bin/bash

export PG_VER="9.6"

export WALE_S3_PREFIX="s3://pg-backups" # бакет, который мы создали в S3
export AWS_ACCESS_KEY_ID="xxxx" # AccessKey из /etc/minio/minio.conf 
export AWS_ENDPOINT="http://ip-адрес-сервера-minio:9000"
export AWS_S3_FORCE_PATH_STYLE="true"
export AWS_SECRET_ACCESS_KEY="yyyy" # SecretKey из /etc/minio/minio.conf

export PGDATA=/var/lib/pgsql/$PG_VER/data/
export PGHOST=/var/run/postgresql/.s.PGSQL.5432 # Сокет для подключения к PostgreSQL

export WALG_UPLOAD_CONCURRENCY=2 # Кол-во потоков для закачки 
export WALG_DOWNLOAD_CONCURRENCY=2 # Кол-во потоков для скачивания
export WALG_UPLOAD_DISK_CONCURRENCY=2 # Кол-во потоков на диске для закачки
export WALG_DELTA_MAX_STEPS=7
export WALG_COMPRESSION_METHOD=brotli # Какой метод сжатия использовать.

Ҳангоми конфигуратсияи WAL-G, шумо WALG_DELTA_MAX_STEPS - шумораи қадамҳоеро, ки нусхабардории дельта аз нусхаи асосӣ ҳадди аксар аст, муайян мекунед ва сиёсати нусхабардории дельтаро муайян мекунед. Ё шумо аз дельтаи охирини мавҷуда нусхабардорӣ мекунед, ё аз нусхаи пурраи аслӣ дельта месозед. Ин барои он зарур аст, ки агар як ҷузъи пойгоҳи додаҳо дар пойгоҳи додаи шумо ҳамеша тағир ёбад, ҳамон як маълумот доимо тағйир меёбад.

Насб кардани пойгоҳи додаҳо.

yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.
noarch.rpm
yum install -y postgresql96 postgresql96-server mc

Мо базаи маълумотро оғоз мекунем.

/usr/pgsql-9.6/bin/postgresql96-setup initdb
Initializing database ... OK

Агар шумо дар сервери 1 озмоиш карда истода бошед, пас шумо бояд параметри wal_level-ро барои бойгонӣ барои PostgreSQL камтар аз версияи 10 ва репликаро барои PostgreSQL версияи 10 ва калонтар аз нав танзим кунед.

wal_level = archive

Биёед бо истифода аз худи PostgreSQL ҳар 60 сония архивҳои WAL-ро нусхабардорӣ кунем. Дар маҳсулот шумо арзиши дигари archive_timeout хоҳед дошт.

archive_mode = on
archive_command = '/usr/local/bin/wal-push.sh %p'
archive_timeout = 60 # Каждые 60 секунд будет выполнятся команда archive_command.

Оғози PostgreSQL

systemctl start postgresql-9.6

Дар консоли алоҳида, мо ба гузоришҳои PostgreSQL барои хатогиҳо назар мекунем: (тағйир додани postgresql-Wed.log ба ҷорӣ).

tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Биёед ба psql равем.

su - postgres
psql

Дар psql пойгоҳи додаҳо эҷод кунед

Дар test1 базаи маълумот ҷадвал эҷод кунед.

create database test1;

Ба санҷиши пойгоҳи додаҳо гузаред.

postgres=# c test1;

Мо ҷадвали indexing_table эҷод мекунем.

test1=# CREATE TABLE indexing_table(created_at TIMESTAMP WITH TIME ZONE DEFAULT NOW());

Илова кардани маълумот.

Мо ба ворид кардани маълумот шурӯъ мекунем. Мо 10-20 дақиқа интизорем.

#!/bin/bash
# postgres
while true; do
psql -U postgres -d test1 -c "INSERT INTO indexing_table(created_at) VALUES (CURRENT_TIMESTAMP);"
sleep 60;
done

Боварӣ ҳосил кунед, ки нусхаи пурраи нусхабардорӣ кунед.

su - postgres
/usr/local/bin/backup-push.sh

Мо ба сабтҳои ҷадвал дар тести базаи маълумот назар мекунем

select * from indexing_table;
2020-01-29 09:41:25.226198+
2020-01-29 09:42:25.336989+
2020-01-29 09:43:25.356069+
2020-01-29 09:44:25.37381+
2020-01-29 09:45:25.392944+
2020-01-29 09:46:25.412327+
2020-01-29 09:47:25.432564+
2020-01-29 09:48:25.451985+
2020-01-29 09:49:25.472653+
2020-01-29 09:50:25.491974+
2020-01-29 09:51:25.510178+

Сатр вақти ҷорӣ аст.

Рӯйхати нусхаҳои пурраро бубинед

/usr/local/bin/backup-list.sh

Санҷиши барқарорсозӣ

Барқарорсозии пурра бо як ғелонда ҳама дастрас WAL.

Қатъи Postgresql.

Ҳама чизро аз ҷузвдони /var/lib/pgsql/9.6/data нест кунед.

Скрипти /usr/local/bin/backup-fetch.sh -ро ҳамчун корбари postgres иҷро кунед.

su - postgres
/usr/local/bin/backup-fetch.sh

Истихроҷи нусхабардорӣ анҷом ёфт.

Recovery.conf -ро ба ҷузвдони /var/lib/pgsql/9.6/data бо мундариҷаи зерин илова кунед.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'

Мо PostgreSQL-ро оғоз мекунем. PostgreSQL раванди барқароркуниро аз WAL-ҳои бойгонӣ оғоз мекунад ва танҳо пас аз он пойгоҳи додаҳо кушода мешавад.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Барқароркунӣ барои як муддати муайян.

Агар мо хоҳем, ки базаи маълумотро то дақиқаи муайян барқарор кунем, пас параметри recovery_target_time -ро ба recovery.conf илова мекунем - мо нишон медиҳем, ки дар кадом вақт базаи маълумотро барқарор кунем.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'
recovery_target_time = '2020-01-29 09:46:25'

Пас аз барқароршавӣ, ба ҷадвали indexing_table нигаред

 2020-01-29 09:41:25.226198+00
 2020-01-29 09:42:25.336989+00
 2020-01-29 09:43:25.356069+00
 2020-01-29 09:44:25.37381+00
 2020-01-29 09:45:25.392944+00

Мо PostgreSQL-ро оғоз мекунем. PostgreSQL раванди барқароркуниро аз WAL-ҳои бойгонӣ оғоз мекунад ва танҳо пас аз он пойгоҳи додаҳо кушода мешавад.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

санҷиши

Эҷоди пойгоҳи додаҳои 1 ГБ тавре, ки дар ин ҷо тавсиф шудааст https://gist.github.com/ololobus/5b25c432f208d7eb31051a5f238dffff

Дархости андозаи сатил пас аз тавлиди 1 ГБ маълумот.

postgres=# SELECT pg_size_pretty(pg_database_size('test1'));
pg_size_pretty
----------------
1003 MB

s4cmd як воситаи ройгони сатри фармон барои кор бо маълумоте, ки дар нигаҳдории Amazon S3 ҷойгир аст. Утилита бо забони барномасозии python навишта шудааст ва бинобар ин онро ҳам дар системаҳои оператсионии Windows ва ҳам Linux истифода бурдан мумкин аст.

Насб кардани s4cmd

pip install s4cmd

LZ4

s4cmd --endpoint-url=http://ip-адрес-сервера-minio:9000 --access-key=xxxx --secret-key=yyyy du -r s3://pg-backups
840540822       s3://pg-backups/wal_005/
840 МБ в формате lz4 только WAL логов

Полный бекап с lz4 - 1GB данных
time backup_push.sh
real 0m18.582s

Размер S3 бакета после полного бекапа

581480085       s3://pg-backups/basebackups_005/
842374424   s3://pg-backups/wal_005
581 МБ занимает полный бекап

ЛЗМА

После генерации 1ГБ данных
338413694       s3://pg-backups/wal_005/
338 мб логов в формате lzma

Время генерации полного бекапа
time backup_push.sh
real    5m25.054s

Размер бакета в S3
270310495       s3://pg-backups/basebackups_005/
433485092   s3://pg-backups/wal_005/

270 мб занимает полный бекап в формате lzma

Брошли

После генерации 1ГБ данных
459229886       s3://pg-backups/wal_005/
459 мб логов в формате brotli

Время генерации полного бекапа
real    0m23.408s

Размер бакета в S3
312960942       s3://pg-backups/basebackups_005/
459309262   s3://pg-backups/wal_005/

312 мб занимает полный бекап в формате brotli

Муқоисаи натиҷаҳо дар диаграмма.

Муқаддима ба системаи нусхабардории wal-g PostgreSQL

Тавре ки шумо мебинед, Brotli аз рӯи андоза бо LZMA муқоиса карда мешавад, аммо нусхабардорӣ дар вақти LZ4 анҷом дода мешавад.

Чати ҷомеаи русзабони PostgreSQL: https://t.me/pgsql

Лутфан, агар шумо истифода баред, ба Github ситора диҳед вал-г

Манбаъ: will.com

Илова Эзоҳ