Yntroduksje ta it wal-g PostgreSQL-backupsysteem

WAL-G is in ienfâldich en effektyf ark foar in reservekopy fan PostgreSQL nei de wolken. Wat syn wichtichste funksjonaliteit oanbelanget, is it de opfolger fan it populêre ark WAL-E, mar opnij skreaun yn Go. Mar d'r is ien wichtige nije funksje yn WAL-G - deltakopyen. Delta kopyen WAL-G bewarje siden fan bestannen dy't binne feroare sûnt de foarige reservekopyferzje. WAL-G implementeart nochal in protte technologyen foar parallelisearjen fan backups. WAL-G is folle flugger as WAL-E.

Details oer hoe't wal-g wurket kinne fûn wurde yn it artikel: Wy fersnelle de reservekopy. Yandex lêzing

It S3-opslachprotokol is populêr wurden foar it opslaan fan gegevens. Ien fan de foardielen fan S3 is de mooglikheid om tagong fia API, dat kinne jo organisearje fleksibele ynteraksje mei de opslach, ynklusyf iepenbiere lêzen tagong, wylst it bywurkjen fan ynformaasje yn de opslach bart allinnich troch autorisearre persoanen.

D'r binne ferskate iepenbiere en partikuliere opslachimplementaasjes dy't it S3-protokol brûke. Hjoed sille wy sjen nei in populêre oplossing foar it organisearjen fan lytse opslachfoarsjennings - Minio.

In inkele PostgreSQL-tsjinner is prima foar it testen fan wal-g, en Minio wurdt brûkt as ferfanging foar S3.

Minio Server

Ynstallaasje fan Minio

yum -y install yum-plugin-copr
yum copr enable -y lkiesow/minio
yum install -y minio

AccessKey en SecretKey bewurkje yn /etc/minio/minio.conf

vi /etc/minio/minio.conf

As jo ​​nginx net brûke foardat Minio, dan moatte jo feroarje

--address 127.0.0.1:9000

--address 0.0.0.0:9000

Start Minio

systemctl start minio

Gean nei de Minio-webynterface http://ip-адрес-сервера-minio:9000 en meitsje in bak (bygelyks pg-backups).

DB tsjinner

WAL-G yn rpm wurdt gearstald troch my (Anton Patsev). Github, Fedora COPR.

Wa hat gjin RPM-basearre systeem, brûk de offisjele ynstruksje op ynstallaasje.

Tegearre mei de wal-g binary, de rpm befettet skripts dy't ymportearje fariabelen út de /etc/wal-gd/server-s3.conf triem.

backup-fetch.sh
backup-list.sh
backup-push.sh
wal-fetch.sh
wal-g-run.sh
wal-push.sh

Ynstallearje wal-g.

yum -y install yum-plugin-copr
yum copr enable -y antonpatsev/wal-g
yum install -y wal-g

Kontrolearje de ferzje fan wal-g.

wal-g --version
wal-g version v0.2.14

Bewurkje /etc/wal-gd/server-s3.conf nei jo behoeften.

Konfiguraasjetriemmen en gegevensbestannen brûkt troch in databankkluster wurde tradisjoneel tegearre opslein yn 'e klustergegevensmap, gewoanwei oantsjutten as PGDATA

#!/bin/bash

export PG_VER="9.6"

export WALE_S3_PREFIX="s3://pg-backups" # бакет, который мы создали в S3
export AWS_ACCESS_KEY_ID="xxxx" # AccessKey из /etc/minio/minio.conf 
export AWS_ENDPOINT="http://ip-адрес-сервера-minio:9000"
export AWS_S3_FORCE_PATH_STYLE="true"
export AWS_SECRET_ACCESS_KEY="yyyy" # SecretKey из /etc/minio/minio.conf

export PGDATA=/var/lib/pgsql/$PG_VER/data/
export PGHOST=/var/run/postgresql/.s.PGSQL.5432 # Сокет для подключения к PostgreSQL

export WALG_UPLOAD_CONCURRENCY=2 # Кол-во потоков для закачки 
export WALG_DOWNLOAD_CONCURRENCY=2 # Кол-во потоков для скачивания
export WALG_UPLOAD_DISK_CONCURRENCY=2 # Кол-во потоков на диске для закачки
export WALG_DELTA_MAX_STEPS=7
export WALG_COMPRESSION_METHOD=brotli # Какой метод сжатия использовать.

By it ynstellen fan WAL-G, spesifisearje jo WALG_DELTA_MAX_STEPS - it oantal stappen wêrmei't de delta-reservekopy maksimaal fier is fan 'e basis-reservekopy, en spesifisearje it deltakopybelied. Of jo meitsje in kopy fan de lêste besteande delta, of jo meitsje in delta út de oarspronklike folsleine reservekopy. Dit is nedich foar it gefal as deselde databankkomponint altyd feroaret yn jo databank, deselde gegevens feroarje konstant.

Ynstallaasje fan de databank.

yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.
noarch.rpm
yum install -y postgresql96 postgresql96-server mc

Wy inisjalisearje de databank.

/usr/pgsql-9.6/bin/postgresql96-setup initdb
Initializing database ... OK

As jo ​​​​testen op 1-tsjinner, dan moatte jo de wal_level-parameter opnij konfigurearje om te argyfjen foar PostgreSQL minder dan ferzje 10, en replika foar PostgreSQL ferzje 10 en âlder.

wal_level = archive

Litte wy reservekopy meitsje fan WAL-argiven elke 60 sekonden mei PostgreSQL sels. Op prod sille jo in oare archive_timeout-wearde hawwe.

archive_mode = on
archive_command = '/usr/local/bin/wal-push.sh %p'
archive_timeout = 60 # Каждые 60 секунд будет выполнятся команда archive_command.

Litte wy PostgreSQL begjinne

systemctl start postgresql-9.6

Yn in aparte konsole sjogge wy nei de PostgreSQL-logs foar flaters: (feroarje postgresql-Wed.log nei de aktuele).

tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Litte wy nei psql gean.

su - postgres
psql

Wy meitsje in databank yn psql.

Meitsje in tabel yn 'e databank test1.

create database test1;

Wikselje nei de testdatabase.

postgres=# c test1;

Wy meitsje de tabel indexing_table.

test1=# CREATE TABLE indexing_table(created_at TIMESTAMP WITH TIME ZONE DEFAULT NOW());

It tafoegjen fan gegevens.

Lit ús begjinne gegevens ynfoegje. Wy wachtsje 10-20 minuten.

#!/bin/bash
# postgres
while true; do
psql -U postgres -d test1 -c "INSERT INTO indexing_table(created_at) VALUES (CURRENT_TIMESTAMP);"
sleep 60;
done

Soargje derfoar dat jo in folsleine reservekopy meitsje.

su - postgres
/usr/local/bin/backup-push.sh

Wy sjogge nei de records yn 'e tabel yn' e database test1

select * from indexing_table;
2020-01-29 09:41:25.226198+
2020-01-29 09:42:25.336989+
2020-01-29 09:43:25.356069+
2020-01-29 09:44:25.37381+
2020-01-29 09:45:25.392944+
2020-01-29 09:46:25.412327+
2020-01-29 09:47:25.432564+
2020-01-29 09:48:25.451985+
2020-01-29 09:49:25.472653+
2020-01-29 09:50:25.491974+
2020-01-29 09:51:25.510178+

De tekenrige is de aktuele tiid.

Sjoch de list mei folsleine backups

/usr/local/bin/backup-list.sh

Herstel testen

Folsleine herstel mei it rôljen fan alle beskikbere WAL.

Stopje Postgresql.

Wy wiskje alles út 'e map /var/lib/pgsql/9.6/data.

Run it /usr/local/bin/backup-fetch.sh skript as de postgres brûker.

su - postgres
/usr/local/bin/backup-fetch.sh

Reservekopy-ekstraksje foltôge.

Foegje recovery.conf ta oan de map /var/lib/pgsql/9.6/data mei de folgjende ynhâld.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'

Launch PostgreSQL. PostgreSQL sil it herstelproses begjinne fan 'e argyfearre WAL's, en allinich dan sil de databank iepenje.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Herstel foar in bepaalde tiid.

As wy de databank nei in bepaalde minút weromsette wolle, dan foegje wy de parameter recovery_target_time ta oan recovery.conf - wy jouwe oan op hokker tiid om de databank te herstellen.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'
recovery_target_time = '2020-01-29 09:46:25'

Nei herstel, sjoch nei de tabel indexing_table

 2020-01-29 09:41:25.226198+00
 2020-01-29 09:42:25.336989+00
 2020-01-29 09:43:25.356069+00
 2020-01-29 09:44:25.37381+00
 2020-01-29 09:45:25.392944+00

Launch PostgreSQL. PostgreSQL sil it herstelproses begjinne fan 'e argyfearre WAL's, en allinich dan sil de databank iepenje.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Testing

It generearjen fan in 1GB databank lykas hjir beskreaun https://gist.github.com/ololobus/5b25c432f208d7eb31051a5f238dffff

De emmergrutte oanfreegje nei it generearjen fan 1GB oan gegevens.

postgres=# SELECT pg_size_pretty(pg_database_size('test1'));
pg_size_pretty
----------------
1003 MB

s4cmd is in fergese kommandorigelark foar wurkjen mei gegevens yn Amazon S3-opslach. It hulpprogramma is skreaun yn 'e python-programmearringstaal, en troch dit kin it brûkt wurde yn sawol Windows as Linux bestjoeringssystemen.

Ynstallearje s4cmd

pip install s4cmd

LZ4

s4cmd --endpoint-url=http://ip-адрес-сервера-minio:9000 --access-key=xxxx --secret-key=yyyy du -r s3://pg-backups
840540822       s3://pg-backups/wal_005/
840 МБ в формате lz4 только WAL логов

Полный бекап с lz4 - 1GB данных
time backup_push.sh
real 0m18.582s

Размер S3 бакета после полного бекапа

581480085       s3://pg-backups/basebackups_005/
842374424   s3://pg-backups/wal_005
581 МБ занимает полный бекап

LZMA

После генерации 1ГБ данных
338413694       s3://pg-backups/wal_005/
338 мб логов в формате lzma

Время генерации полного бекапа
time backup_push.sh
real    5m25.054s

Размер бакета в S3
270310495       s3://pg-backups/basebackups_005/
433485092   s3://pg-backups/wal_005/

270 мб занимает полный бекап в формате lzma

Brotli

После генерации 1ГБ данных
459229886       s3://pg-backups/wal_005/
459 мб логов в формате brotli

Время генерации полного бекапа
real    0m23.408s

Размер бакета в S3
312960942       s3://pg-backups/basebackups_005/
459309262   s3://pg-backups/wal_005/

312 мб занимает полный бекап в формате brotli

Fergeliking fan resultaten op 'e grafyk.

Yntroduksje ta it wal-g PostgreSQL-backupsysteem

Sa't jo sjen kinne, is Brotli yn grutte te fergelykjen mei LZMA, mar de reservekopy wurdt útfierd yn LZ4-tiid.

Petear fan 'e Russysktalige PostgreSQL-mienskip: https://t.me/pgsql

Jou asjebleaft in stjer oan Github as jo brûke wal-g

Boarne: www.habr.com

Add a comment