Aféierung an de wal-g PostgreSQL Backup System

WAL-G ass en einfacht an effektiv Tool fir PostgreSQL op d'Wolleken ze backen. Wat seng Haaptfunktionalitéit ugeet, ass et den Ierwe vum populäre Tool WAL-E, mee ëmgeschriwwen an Go. Awer et gëtt eng wichteg nei Feature am WAL-G - Delta Kopien. Delta Kopien WAL-G Späichere Säite vu Dateien déi zënter der fréierer Backupversioun geännert hunn. WAL-G implementéiert zimlech vill Technologien fir Paralleliséierung vu Backups. WAL-G ass vill méi séier wéi WAL-E.

Detailer wéi wal-g funktionnéiert fannt Dir am Artikel: Mir overclock de Backupsatellit. Yandex Virtrag

De S3 Späicherprotokoll ass populär ginn fir Daten ze späicheren. Ee vun de Virdeeler vum S3 ass d'Fäegkeet fir Zougang iwwer API ze kréien, wat Iech erlaabt flexibel Interaktioun mat der Späichere z'organiséieren, inklusiv ëffentlech Lieszougang, während d'Aktualiséierung vun Informatioun an der Späichere nëmme vun autoriséierte Persounen geschitt.

Et gi verschidde ëffentlech a privat Späicherimplementatiounen déi de S3 Protokoll benotzen. Haut wäerte mir eng populär Léisung fir d'Organisatioun vu klenge Späicher kucken - Minio.

Een eenzegen PostgreSQL Server ass gutt fir wal-g ze testen, a Minio gëtt als Ersatz fir S3 benotzt.

Minio Server

Minio Installatioun

yum -y install yum-plugin-copr
yum copr enable -y lkiesow/minio
yum install -y minio

Änneren AccessKey a SecretKey an /etc/minio/minio.conf

vi /etc/minio/minio.conf

Wann Dir nginx net virum Minio benotzt, da musst Dir änneren

--address 127.0.0.1:9000

--address 0.0.0.0:9000

Minio starten

systemctl start minio

Gitt op d'Minio Web Interface http://ip-адрес-сервера-minio:9000 an en Eemer erstellen (zum Beispill pg-Backups).

DB Server

WAL-G am RPM ass vu mir (Anton Patsev) zesummegesat. Github, Fedora COPR.

Wien keen RPM-baséiert System huet, benotzt den offiziellen Uweisunge duerch Installatioun.

Zesumme mat der wal-g Binär enthält rpm Scripten déi Variablen aus der /etc/wal-gd/server-s3.conf Datei importéieren.

backup-fetch.sh
backup-list.sh
backup-push.sh
wal-fetch.sh
wal-g-run.sh
wal-push.sh

Installéiert Walg.

yum -y install yum-plugin-copr
yum copr enable -y antonpatsev/wal-g
yum install -y wal-g

Iwwerpréift wal-g Versioun.

wal-g --version
wal-g version v0.2.14

Änneren /etc/wal-gd/server-s3.conf op Är Besoinen.

D'Konfiguratiounsdateien an d'Datedateien, déi vun engem Datebankcluster benotzt ginn, ginn traditionell zesummen am Clusterdatenverzeichnis gelagert, allgemeng bezeechent als PGDATA

#!/bin/bash

export PG_VER="9.6"

export WALE_S3_PREFIX="s3://pg-backups" # бакет, который мы создали в S3
export AWS_ACCESS_KEY_ID="xxxx" # AccessKey из /etc/minio/minio.conf 
export AWS_ENDPOINT="http://ip-адрес-сервера-minio:9000"
export AWS_S3_FORCE_PATH_STYLE="true"
export AWS_SECRET_ACCESS_KEY="yyyy" # SecretKey из /etc/minio/minio.conf

export PGDATA=/var/lib/pgsql/$PG_VER/data/
export PGHOST=/var/run/postgresql/.s.PGSQL.5432 # Сокет для подключения к PostgreSQL

export WALG_UPLOAD_CONCURRENCY=2 # Кол-во потоков для закачки 
export WALG_DOWNLOAD_CONCURRENCY=2 # Кол-во потоков для скачивания
export WALG_UPLOAD_DISK_CONCURRENCY=2 # Кол-во потоков на диске для закачки
export WALG_DELTA_MAX_STEPS=7
export WALG_COMPRESSION_METHOD=brotli # Какой метод сжатия использовать.

Wann Dir WAL-G konfiguréiert, spezifizéiert Dir WALG_DELTA_MAX_STEPS - d'Zuel vun de Schrëtt, déi d'Delta-Backup maximal aus der Basis-Backup ass, a spezifizéiert d'Delta Kopie Politik. Entweder Dir maacht eng Kopie vum leschten existente Delta, oder Dir maacht en Delta aus dem ursprénglechen vollen Backup. Dëst ass néideg am Fall wou dee selwechte Komponent vun der Datebank ëmmer an Ärer Datebank ännert, ännere sech déiselwecht Daten dauernd.

Installatioun vun der Datebank.

yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.
noarch.rpm
yum install -y postgresql96 postgresql96-server mc

Mir initialiséieren d'Datebank.

/usr/pgsql-9.6/bin/postgresql96-setup initdb
Initializing database ... OK

Wann Dir op 1 Server testt, da musst Dir de wal_level Parameter nei konfiguréieren fir PostgreSQL manner wéi Versioun 10 ze archivéieren, a Replica fir PostgreSQL Versioun 10 a méi al.

wal_level = archive

Loosst eis Backupsatellit WAL Archiver all 60 Sekonnen benotzt PostgreSQL selwer. Op Prod hutt Dir en aneren Archive_timeout Wäert.

archive_mode = on
archive_command = '/usr/local/bin/wal-push.sh %p'
archive_timeout = 60 # Каждые 60 секунд будет выполнятся команда archive_command.

Start PostgreSQL

systemctl start postgresql-9.6

An enger separater Konsole kucke mir d'PostgreSQL Logbicher fir Feeler: (änneren postgresql-Wed.log op déi aktuell).

tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Loosst eis op psql.

su - postgres
psql

Erstellt eng Datebank an psql

Erstellt eng Tabell an der Datebank Test1.

create database test1;

Wiesselt op d'Datebank Test.

postgres=# c test1;

Mir erstellen den Dësch indexing_table.

test1=# CREATE TABLE indexing_table(created_at TIMESTAMP WITH TIME ZONE DEFAULT NOW());

Dobäizemaachen Donnéeën.

Mir fänken un d'Donnéeën anzeginn. Mir waarden op 10-20 Minutten.

#!/bin/bash
# postgres
while true; do
psql -U postgres -d test1 -c "INSERT INTO indexing_table(created_at) VALUES (CURRENT_TIMESTAMP);"
sleep 60;
done

Gitt sécher e komplette Backup ze maachen.

su - postgres
/usr/local/bin/backup-push.sh

Mir kucken d'Records an der Tabell am Datebank Test1

select * from indexing_table;
2020-01-29 09:41:25.226198+
2020-01-29 09:42:25.336989+
2020-01-29 09:43:25.356069+
2020-01-29 09:44:25.37381+
2020-01-29 09:45:25.392944+
2020-01-29 09:46:25.412327+
2020-01-29 09:47:25.432564+
2020-01-29 09:48:25.451985+
2020-01-29 09:49:25.472653+
2020-01-29 09:50:25.491974+
2020-01-29 09:51:25.510178+

De String ass déi aktuell Zäit.

Gesinn d'Lëscht vun voll Backupsatellit

/usr/local/bin/backup-list.sh

Erhuelung Testen

Voll Erhuelung mat Rolling all verfügbare WAL.

Stop Postgresql.

Alles aus dem /var/lib/pgsql/9.6/data Dossier läschen.

Run den /usr/local/bin/backup-fetch.sh Skript als de Postgres Benotzer.

su - postgres
/usr/local/bin/backup-fetch.sh

Backup Extraktioun fäerdeg.

Füügt recovery.conf an den /var/lib/pgsql/9.6/data-Ordner mat dem folgenden Inhalt.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'

Mir starten PostgreSQL. PostgreSQL fänkt den Erhuelungsprozess vun den archivéierten WALs un, a nëmmen dann wäert d'Datebank opmaachen.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Erhuelung fir eng gewëssen Zäit.

Wa mir d'Datebank bis zu enger bestëmmter Minutt restauréiere wëllen, da addéiere mer de recovery_target_time Parameter op recovery.conf - mir weisen op wéi eng Zäit d'Datebank restauréiert.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'
recovery_target_time = '2020-01-29 09:46:25'

No Erhuelung, kuckt op den Dësch indexing_table

 2020-01-29 09:41:25.226198+00
 2020-01-29 09:42:25.336989+00
 2020-01-29 09:43:25.356069+00
 2020-01-29 09:44:25.37381+00
 2020-01-29 09:45:25.392944+00

Mir starten PostgreSQL. PostgreSQL fänkt den Erhuelungsprozess vun den archivéierten WALs un, a nëmmen dann wäert d'Datebank opmaachen.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Testen

Generéiere vun enger 1GB Datebank wéi hei beschriwwen https://gist.github.com/ololobus/5b25c432f208d7eb31051a5f238dffff

Ufro vun der Eemergréisst nodeems Dir 1GB vun Daten generéiert huet.

postgres=# SELECT pg_size_pretty(pg_database_size('test1'));
pg_size_pretty
----------------
1003 MB

s4cmd ass e gratis Kommandozeil-Tool fir mat Daten ze schaffen, déi an Amazon S3 Späichere wunnen. D'Utility ass an der Python Programmiersprache geschriwwe ginn, a wéinst deem kann et souwuel a Windows wéi och Linux Betribssystemer benotzt ginn.

Installatioun s4cmd

pip install s4cmd

LZ4

s4cmd --endpoint-url=http://ip-адрес-сервера-minio:9000 --access-key=xxxx --secret-key=yyyy du -r s3://pg-backups
840540822       s3://pg-backups/wal_005/
840 МБ в формате lz4 только WAL логов

Полный бекап с lz4 - 1GB данных
time backup_push.sh
real 0m18.582s

Размер S3 бакета после полного бекапа

581480085       s3://pg-backups/basebackups_005/
842374424   s3://pg-backups/wal_005
581 МБ занимает полный бекап

LZMA

После генерации 1ГБ данных
338413694       s3://pg-backups/wal_005/
338 мб логов в формате lzma

Время генерации полного бекапа
time backup_push.sh
real    5m25.054s

Размер бакета в S3
270310495       s3://pg-backups/basebackups_005/
433485092   s3://pg-backups/wal_005/

270 мб занимает полный бекап в формате lzma

Brotli

После генерации 1ГБ данных
459229886       s3://pg-backups/wal_005/
459 мб логов в формате brotli

Время генерации полного бекапа
real    0m23.408s

Размер бакета в S3
312960942       s3://pg-backups/basebackups_005/
459309262   s3://pg-backups/wal_005/

312 мб занимает полный бекап в формате brotli

Verglach vun Resultater op der Grafik.

Aféierung an de wal-g PostgreSQL Backup System

Wéi Dir kënnt gesinn, ass Brotli a Gréisst vergläichbar mat LZMA, awer de Backup gëtt an der LZ4 Zäit gemaach.

Chat vun der russeschsproocheger PostgreSQL Gemeinschaft: https://t.me/pgsql

Gitt weg e Stär op Github wann Dir benotzt wal-g

Source: will.com

Setzt e Commentaire