Sissejuhatus wal-g PostgreSQL varundussüsteemi

WAL-G on lihtne ja tõhus tööriist PostgreSQL-i pilvedesse varundamiseks. Oma põhifunktsioonide poolest on see populaarse tööriista pärija WAL-E, kuid see on Go ümber kirjutatud. Kuid WAL-G-s on üks oluline uus funktsioon – deltakoopiad. delta koopiad WAL-G salvestab lehekülgi failidest, mis on eelmisest varundusversioonist alates muutunud. WAL-G rakendab varukoopiate paralleelseks muutmiseks üsna palju tehnoloogiaid. WAL-G on palju kiirem kui WAL-E.

Üksikasjad wal-g toimimise kohta leiate artiklist: Me kiirendame varundamise üle. Yandexi loeng

S3 salvestusprotokoll on muutunud populaarseks andmete salvestamiseks. Üks S3 eeliseid on juurdepääs API kaudu, mis võimaldab teil korraldada paindlikku suhtlust salvestusruumiga, sealhulgas avalikku lugemist, samal ajal kui teabe värskendamine salvestusruumis toimub ainult volitatud isikute poolt.

S3-protokolli kasutavad mitmed avaliku ja erasalvestuse rakendused. Täna vaatleme populaarset lahendust väikese ladustamise korraldamiseks - Minio.

Üks PostgreSQL-server sobib wal-g testimiseks ja Miniot kasutatakse S3 asendajana.

Minio server

Mini paigaldus

yum -y install yum-plugin-copr
yum copr enable -y lkiesow/minio
yum install -y minio

Redigeerige AccessKey ja SecretKey failis /etc/minio/minio.conf

vi /etc/minio/minio.conf

Kui te ei kasuta nginxi enne Miniot, peate muutma

--address 127.0.0.1:9000

--address 0.0.0.0:9000

Minio käivitamine

systemctl start minio

Minge Minio veebiliidesele http://ip-адрес-сервера-minio:9000 ja looge ämber (näiteks pg-varukoopiad).

DB server

WAL-G pöördega minutis olen kokku pannud mina (Anton Patsev). Github, Fedora COPR.

Kellel pole RPM-põhist süsteemi, kasutage ametlikku juhendamine paigaldamise teel.

Koos wal-g binaariga sisaldab rpm skripte, mis impordivad muutujaid failist /etc/wal-gd/server-s3.conf.

backup-fetch.sh
backup-list.sh
backup-push.sh
wal-fetch.sh
wal-g-run.sh
wal-push.sh

Paigaldage walg.

yum -y install yum-plugin-copr
yum copr enable -y antonpatsev/wal-g
yum install -y wal-g

Wal-g versiooni kontrollimine.

wal-g --version
wal-g version v0.2.14

Muutke faili /etc/wal-gd/server-s3.conf vastavalt oma vajadustele.

Andmebaasiklastri kasutatavad konfiguratsioonifailid ja andmefailid salvestatakse traditsiooniliselt koos klastri andmekataloogis, mida tavaliselt nimetatakse PGDATA

#!/bin/bash

export PG_VER="9.6"

export WALE_S3_PREFIX="s3://pg-backups" # бакет, который мы создали в S3
export AWS_ACCESS_KEY_ID="xxxx" # AccessKey из /etc/minio/minio.conf 
export AWS_ENDPOINT="http://ip-адрес-сервера-minio:9000"
export AWS_S3_FORCE_PATH_STYLE="true"
export AWS_SECRET_ACCESS_KEY="yyyy" # SecretKey из /etc/minio/minio.conf

export PGDATA=/var/lib/pgsql/$PG_VER/data/
export PGHOST=/var/run/postgresql/.s.PGSQL.5432 # Сокет для подключения к PostgreSQL

export WALG_UPLOAD_CONCURRENCY=2 # Кол-во потоков для закачки 
export WALG_DOWNLOAD_CONCURRENCY=2 # Кол-во потоков для скачивания
export WALG_UPLOAD_DISK_CONCURRENCY=2 # Кол-во потоков на диске для закачки
export WALG_DELTA_MAX_STEPS=7
export WALG_COMPRESSION_METHOD=brotli # Какой метод сжатия использовать.

WAL-G konfigureerimisel määrate WALG_DELTA_MAX_STEPS – sammude arvu, mille jooksul deltavarukoopia on põhivarukoopiast maksimaalne, ja määrate deltakoopia poliitika. Kas teete koopia viimasest olemasolevast deltast või teete delta algsest täielikust varukoopiast. See on vajalik juhul, kui teie andmebaasis muutub pidevalt sama andmebaasi komponent, muutuvad pidevalt samad andmed.

Andmebaasi installimine.

yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.
noarch.rpm
yum install -y postgresql96 postgresql96-server mc

Initsialiseerime andmebaasi.

/usr/pgsql-9.6/bin/postgresql96-setup initdb
Initializing database ... OK

Kui testite ühes serveris, peate uuesti konfigureerima parameetri wal_level, et arhiveerida PostgreSQL-i jaoks, mis on väiksem kui versioon 1, ja replika PostgreSQL-i versiooni 10 ja vanemate jaoks.

wal_level = archive

Varundame WAL-i arhiive iga 60 sekundi järel, kasutades PostgreSQL-i ennast. Tootmise korral on teil erinev archive_timeout väärtus.

archive_mode = on
archive_command = '/usr/local/bin/wal-push.sh %p'
archive_timeout = 60 # Каждые 60 секунд будет выполнятся команда archive_command.

PostgreSQL-i käivitamine

systemctl start postgresql-9.6

Eraldi konsoolis vaatame PostgreSQL-i logides vigu: (muutke postgresql-Wed.log praeguseks).

tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Lähme psql-i.

su - postgres
psql

Looge andmebaas psql-is

Loo andmebaasis tabel test1.

create database test1;

Lülituge andmebaasi testile.

postgres=# c test1;

Loome tabeli indekseerimise_tabel.

test1=# CREATE TABLE indexing_table(created_at TIMESTAMP WITH TIME ZONE DEFAULT NOW());

Andmete lisamine.

Alustame andmete sisestamist. Ootame 10-20 minutit.

#!/bin/bash
# postgres
while true; do
psql -U postgres -d test1 -c "INSERT INTO indexing_table(created_at) VALUES (CURRENT_TIMESTAMP);"
sleep 60;
done

Tehke kindlasti täielik varukoopia.

su - postgres
/usr/local/bin/backup-push.sh

Vaatame andmebaasi test1 tabelis olevaid kirjeid

select * from indexing_table;
2020-01-29 09:41:25.226198+
2020-01-29 09:42:25.336989+
2020-01-29 09:43:25.356069+
2020-01-29 09:44:25.37381+
2020-01-29 09:45:25.392944+
2020-01-29 09:46:25.412327+
2020-01-29 09:47:25.432564+
2020-01-29 09:48:25.451985+
2020-01-29 09:49:25.472653+
2020-01-29 09:50:25.491974+
2020-01-29 09:51:25.510178+

String on praegune kellaaeg.

Vaadake täielike varukoopiate loendit

/usr/local/bin/backup-list.sh

Taastumise testimine

Täielik taastumine koos kogu saadaoleva WAL-iga.

Peatage Postgresql.

Kustutage kõik kaustast /var/lib/pgsql/9.6/data.

Käivitage postgresi kasutajana skript /usr/local/bin/backup-fetch.sh.

su - postgres
/usr/local/bin/backup-fetch.sh

Varukoopia väljavõtmine on lõpetatud.

Lisage recovery.conf järgmise sisuga kausta /var/lib/pgsql/9.6/data.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'

Käivitame PostgreSQL-i. PostgreSQL alustab arhiveeritud WAL-idest taasteprotsessi ja alles siis avaneb andmebaas.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Taastumine teatud aja jooksul.

Kui soovime andmebaasi taastada kuni teatud minutini, siis lisame recovery.conf-i parameetri recovery_target_time – anname märku, mis kellaajal andmebaas taastada.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'
recovery_target_time = '2020-01-29 09:46:25'

Pärast taastamist vaadake tabelit indexing_table

 2020-01-29 09:41:25.226198+00
 2020-01-29 09:42:25.336989+00
 2020-01-29 09:43:25.356069+00
 2020-01-29 09:44:25.37381+00
 2020-01-29 09:45:25.392944+00

Käivitame PostgreSQL-i. PostgreSQL alustab arhiveeritud WAL-idest taasteprotsessi ja alles siis avaneb andmebaas.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Katsetamine

1 GB andmebaasi loomine, nagu siin kirjeldatud https://gist.github.com/ololobus/5b25c432f208d7eb31051a5f238dffff

Salve suuruse taotlemine pärast 1 GB andmete genereerimist.

postgres=# SELECT pg_size_pretty(pg_database_size('test1'));
pg_size_pretty
----------------
1003 MB

s4cmd on tasuta käsureatööriist Amazon S3 salvestusruumis olevate andmetega töötamiseks. Utiliit on kirjutatud pythoni programmeerimiskeeles ja tänu sellele saab seda kasutada nii Windowsi kui ka Linuxi operatsioonisüsteemides.

s4cmd installimine

pip install s4cmd

LZ4

s4cmd --endpoint-url=http://ip-адрес-сервера-minio:9000 --access-key=xxxx --secret-key=yyyy du -r s3://pg-backups
840540822       s3://pg-backups/wal_005/
840 МБ в формате lz4 только WAL логов

Полный бекап с lz4 - 1GB данных
time backup_push.sh
real 0m18.582s

Размер S3 бакета после полного бекапа

581480085       s3://pg-backups/basebackups_005/
842374424   s3://pg-backups/wal_005
581 МБ занимает полный бекап

LZMA

После генерации 1ГБ данных
338413694       s3://pg-backups/wal_005/
338 мб логов в формате lzma

Время генерации полного бекапа
time backup_push.sh
real    5m25.054s

Размер бакета в S3
270310495       s3://pg-backups/basebackups_005/
433485092   s3://pg-backups/wal_005/

270 мб занимает полный бекап в формате lzma

Brotli

После генерации 1ГБ данных
459229886       s3://pg-backups/wal_005/
459 мб логов в формате brotli

Время генерации полного бекапа
real    0m23.408s

Размер бакета в S3
312960942       s3://pg-backups/basebackups_005/
459309262   s3://pg-backups/wal_005/

312 мб занимает полный бекап в формате brotli

Tulemuste võrdlus diagrammil.

Sissejuhatus wal-g PostgreSQL varundussüsteemi

Nagu näete, on Brotli suuruselt võrreldav LZMA-ga, kuid varundamine toimub LZ4 aja jooksul.

Venekeelse PostgreSQL-i kogukonna vestlus: https://t.me/pgsql

Kui kasutate, andke Githubile tärn wal-g

Allikas: www.habr.com

Lisa kommentaar