Entwodiksyon nan sistèm nan backup wal-g PostgreSQL

WAL-G — yon zouti ki senp epi efikas pou fè bak PostgreSQL nan nwaj yo. Nan fonksyonalite debaz li yo, li se siksesè nan zouti popilè a WAL-E, men reekri nan Go. Men, WAL-G gen yon nouvo karakteristik enpòtan: kopi delta. Delta kopi WAL-G magazen paj dosye ki te chanje depi vèsyon backup anvan an. WAL-G aplike anpil teknoloji pou paralelize sovgad. WAL-G travay pi vit pase WAL-E.

Ou ka li detay sou travay Wal-g nan atik la: Nou akselere backup la. Konferans Yandex

Pwotokòl depo S3 la te vin popilè pou estoke done. Youn nan avantaj ki genyen nan S3 se kapasite nan jwenn aksè atravè API, ki pèmèt pou entèraksyon fleksib ak depo a, ki gen ladan aksè piblik li, pandan y ap mete ajou enfòmasyon nan depo a fèt sèlman pa moun ki otorize.

Gen plizyè sous louvri ak aplikasyon depo prive ki travay ak pwotokòl S3 la. Jodi a nou pral gade nan yon solisyon popilè pou òganize ti enstalasyon depo - Minio.

Pou teste wal-g, yon sèl sèvè PostgreSQL apwopriye, epi yo itilize Minio kòm yon ranplasman pou S3.

Minio sèvè

Enstale Minio

yum -y install yum-plugin-copr
yum copr enable -y lkiesow/minio
yum install -y minio

Edit AccessKey ak SecretKey nan /etc/minio/minio.conf

vi /etc/minio/minio.conf

Si w pa pral sèvi ak nginx anvan Minio, w ap bezwen chanje

--address 127.0.0.1:9000

--address 0.0.0.0:9000

Lanse Minio

systemctl start minio

Ale nan koòdone entènèt Minio http://ip-адрес-сервера-minio:9000 epi kreye yon bokit (pa egzanp, pg-backups).

Sèvè baz done

Mwen (Anton Patsev) konpile WAL-G nan rpm. Github, Fedora CPR.

Si ou pa gen yon sistèm ki baze sou RPM, sèvi ak youn ofisyèl la. enstriksyon yo pou enstalasyon.

Ansanm ak binè wal-g, rpm gen scripts ki enpòte varyab ki soti nan fichye /etc/wal-gd/server-s3.conf.

backup-fetch.sh
backup-list.sh
backup-push.sh
wal-fetch.sh
wal-g-run.sh
wal-push.sh

Enstale wal-g.

yum -y install yum-plugin-copr
yum copr enable -y antonpatsev/wal-g
yum install -y wal-g

Tcheke vèsyon an wal-g.

wal-g --version
wal-g version v0.2.14

Edite /etc/wal-gd/server-s3.conf selon bezwen ou yo.

Fichye konfigirasyon ak dosye done yo itilize pa yon gwoup baz done yo tradisyonèlman estoke ansanm nan anyè done gwoup la, ki souvan refere yo kòm PGDATA

#!/bin/bash

export PG_VER="9.6"

export WALE_S3_PREFIX="s3://pg-backups" # бакет, который мы создали в S3
export AWS_ACCESS_KEY_ID="xxxx" # AccessKey из /etc/minio/minio.conf 
export AWS_ENDPOINT="http://ip-адрес-сервера-minio:9000"
export AWS_S3_FORCE_PATH_STYLE="true"
export AWS_SECRET_ACCESS_KEY="yyyy" # SecretKey из /etc/minio/minio.conf

export PGDATA=/var/lib/pgsql/$PG_VER/data/
export PGHOST=/var/run/postgresql/.s.PGSQL.5432 # Сокет для подключения к PostgreSQL

export WALG_UPLOAD_CONCURRENCY=2 # Кол-во потоков для закачки 
export WALG_DOWNLOAD_CONCURRENCY=2 # Кол-во потоков для скачивания
export WALG_UPLOAD_DISK_CONCURRENCY=2 # Кол-во потоков на диске для закачки
export WALG_DELTA_MAX_STEPS=7
export WALG_COMPRESSION_METHOD=brotli # Какой метод сжатия использовать.

Lè w ap konfigirasyon WAL-G, ou presize WALG_DELTA_MAX_STEPS - kantite maksimòm etap ke yon backup delta ka lwen backup baz la, epi ou presize règleman kopi delta a. Swa ou fè yon kopi nan dènye delta ki egziste deja, oswa ou fè yon delta soti nan backup konplè orijinal la. Sa a se nesesè nan ka a lè menm eleman nan baz done a toujou chanje nan baz done ou a, menm done yo ap toujou ap chanje.

Enstale baz done a.

yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.
noarch.rpm
yum install -y postgresql96 postgresql96-server mc

Inisyalize baz done a.

/usr/pgsql-9.6/bin/postgresql96-setup initdb
Initializing database ... OK

Si w ap teste sou 1 sèvè, ou bezwen rekonfigire paramèt wal_level pou achiv pou vèsyon PostgreSQL ki mwens pase 10, ak kopi pou vèsyon PostgreSQL 10 ak pi wo.

wal_level = archive

Ann fè yon backup nan achiv WAL chak 60 segonn lè l sèvi avèk PostgreSQL tèt li. Sou pwodiksyon ou pral gen yon valè diferan archive_timeout.

archive_mode = on
archive_command = '/usr/local/bin/wal-push.sh %p'
archive_timeout = 60 # Каждые 60 секунд будет выполнятся команда archive_command.

Kòmanse PostgreSQL

systemctl start postgresql-9.6

Nan yon konsole separe, gade nan mòso bwa PostgreSQL yo pou erè: (chanje postgresql-Wed.log ak youn aktyèl la).

tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Nou ale nan psql.

su - postgres
psql

Nan psql nou kreye yon baz done.

Kreye yon tab nan baz done test1 la.

create database test1;

Chanje nan baz done tès la.

postgres=# c test1;

Kreye yon tab indexing_table.

test1=# CREATE TABLE indexing_table(created_at TIMESTAMP WITH TIME ZONE DEFAULT NOW());

Ajoute done.

Ann kòmanse mete done yo. Nou tann 10-20 minit.

#!/bin/bash
# postgres
while true; do
psql -U postgres -d test1 -c "INSERT INTO indexing_table(created_at) VALUES (CURRENT_TIMESTAMP);"
sleep 60;
done

Nou asire w ke ou fè yon backup konplè.

su - postgres
/usr/local/bin/backup-push.sh

Nou gade dosye ki nan tablo a nan baz done test1 la

select * from indexing_table;
2020-01-29 09:41:25.226198+
2020-01-29 09:42:25.336989+
2020-01-29 09:43:25.356069+
2020-01-29 09:44:25.37381+
2020-01-29 09:45:25.392944+
2020-01-29 09:46:25.412327+
2020-01-29 09:47:25.432564+
2020-01-29 09:48:25.451985+
2020-01-29 09:49:25.472653+
2020-01-29 09:50:25.491974+
2020-01-29 09:51:25.510178+

Fisèl la se tan aktyèl la.

Ann gade nan lis la nan sovgad konplè

/usr/local/bin/backup-list.sh

Tès rekiperasyon

Rekiperasyon konplè ak woule sou tout WAL ki disponib yo.

Sispann Postgresql.

Efase tout bagay nan katab la /var/lib/pgsql/9.6/data.

Kouri script /usr/local/bin/backup-fetch.sh kòm itilizatè a postgres.

su - postgres
/usr/local/bin/backup-fetch.sh

Fè ekstraksyon sovgad la fini.

Ajoute recovery.conf nan /var/lib/pgsql/9.6/data katab la ak sa ki annapre yo.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'

Lanse PostgreSQL. PostgreSQL pral kòmanse pwosesis rekiperasyon an nan WAL achiv yo, epi sèlman Lè sa a, baz done a pral louvri.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Rekiperasyon pou yon sèten peryòd tan.

Si nou vle retabli baz done a nan yon sèten minit, Lè sa a, nou ajoute paramèt recovery_target_time nan recovery.conf - nou presize tan an retabli baz done a.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'
recovery_target_time = '2020-01-29 09:46:25'

Apre rekiperasyon an, gade tab indexing_table la

 2020-01-29 09:41:25.226198+00
 2020-01-29 09:42:25.336989+00
 2020-01-29 09:43:25.356069+00
 2020-01-29 09:44:25.37381+00
 2020-01-29 09:45:25.392944+00

Lanse PostgreSQL. PostgreSQL pral kòmanse pwosesis rekiperasyon an nan WAL achiv yo, epi sèlman Lè sa a, baz done a pral louvri.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Tès

Jenere yon baz done 1GB jan sa dekri isit la https://gist.github.com/ololobus/5b25c432f208d7eb31051a5f238dffff

Mande gwosè bokit la apre jenere 1GB done.

postgres=# SELECT pg_size_pretty(pg_database_size('test1'));
pg_size_pretty
----------------
1003 MB

s4cmd — бесплатный инструмент командной строки для работы с данными, расположенными в хранилище Amazon S3. Утилита написана на языке программирования python, и благодаря этому может использоваться в операционных системах и Windows, Ak Linux.

Enstale s4cmd

pip install s4cmd

LZ4

s4cmd --endpoint-url=http://ip-адрес-сервера-minio:9000 --access-key=xxxx --secret-key=yyyy du -r s3://pg-backups
840540822       s3://pg-backups/wal_005/
840 МБ в формате lz4 только WAL логов

Полный бекап с lz4 - 1GB данных
time backup_push.sh
real 0m18.582s

Размер S3 бакета после полного бекапа

581480085       s3://pg-backups/basebackups_005/
842374424   s3://pg-backups/wal_005
581 МБ занимает полный бекап

LZMA

После генерации 1ГБ данных
338413694       s3://pg-backups/wal_005/
338 мб логов в формате lzma

Время генерации полного бекапа
time backup_push.sh
real    5m25.054s

Размер бакета в S3
270310495       s3://pg-backups/basebackups_005/
433485092   s3://pg-backups/wal_005/

270 мб занимает полный бекап в формате lzma

Brotli

После генерации 1ГБ данных
459229886       s3://pg-backups/wal_005/
459 мб логов в формате brotli

Время генерации полного бекапа
real    0m23.408s

Размер бакета в S3
312960942       s3://pg-backups/basebackups_005/
459309262   s3://pg-backups/wal_005/

312 мб занимает полный бекап в формате brotli

Konparezon rezilta sou graf la.

Entwodiksyon nan sistèm nan backup wal-g PostgreSQL

Kòm nou ka wè, Brotli se konparab nan gwosè ak LZMA, men se backup la fèt nan menm tan an ak LZ4.

PostgreSQL Ris Kominote Chat: https://t.me/pgsql

Tanpri bay li yon etwal sou Github si ou itilize li wal-g

Sous: www.habr.com

Achte hosting serye pou sit ki gen pwoteksyon DDoS, sèvè VPS VDS 🔥 Achte yon hébergement sit entènèt serye ak pwoteksyon DDoS, sèvè VPS VDS | ProHoster