Uvod v varnostni sistem wal-g PostgreSQL

WAL-G je preprosto in učinkovito orodje za varnostno kopiranje PostgreSQL v oblak. Po glavni funkcionalnosti je naslednik priljubljenega orodja WAL-E, vendar prepisan v Go. Toda WAL-G ima eno pomembno novo funkcijo: delta kopije. Delta kopije WAL-G shranite strani datotek, ki so bile spremenjene od prejšnje različice varnostne kopije. WAL-G implementira precej tehnologij za vzporedno izdelavo varnostnih kopij. WAL-G je veliko hitrejši od WAL-E.

Podrobnosti o delovanju wal-g najdete v članku: Pospešimo varnostno kopiranje. Yandex predavanje

Protokol za shranjevanje S3 je postal priljubljen za shranjevanje podatkov. Ena od prednosti S3 je možnost dostopa prek API-ja, ki vam omogoča organiziranje prilagodljive interakcije s shrambo, vključno z javnim dostopom za branje, medtem ko posodabljanje informacij v shrambi poteka samo s strani pooblaščenih oseb.

Obstaja več izvedb javnega in zasebnega shranjevanja, ki uporabljajo protokol S3. Danes si bomo ogledali priljubljeno rešitev za organizacijo majhnih skladišč - Minio.

En sam strežnik PostgreSQL je primeren za testiranje wal-g, Minio pa se uporablja kot zamenjava za S3.

Minio strežnik

Namestitev Minia

yum -y install yum-plugin-copr
yum copr enable -y lkiesow/minio
yum install -y minio

Urejanje AccessKey in SecretKey v /etc/minio/minio.conf

vi /etc/minio/minio.conf

Če ne boste uporabljali nginx pred Miniom, potem morate spremeniti

--address 127.0.0.1:9000

--address 0.0.0.0:9000

Zaženite Minio

systemctl start minio

Pojdite na spletni vmesnik Minio http://ip-адрес-сервера-minio:9000 in ustvarite vedro (na primer pg-backups).

strežnik DB

Sestavljam WAL-G v obratih (Anton Patsev). GitHub, Fedora COPR.

Za tiste, ki nimate sistema, ki temelji na RPM, uporabite uradnega navodilo pri namestitvi.

Skupaj z dvojiško datoteko wal-g vsebuje rpm skripte, ki uvažajo spremenljivke iz datoteke /etc/wal-gd/server-s3.conf.

backup-fetch.sh
backup-list.sh
backup-push.sh
wal-fetch.sh
wal-g-run.sh
wal-push.sh

Namestite wal-g.

yum -y install yum-plugin-copr
yum copr enable -y antonpatsev/wal-g
yum install -y wal-g

Preverjanje različice wal-g.

wal-g --version
wal-g version v0.2.14

Uredite /etc/wal-gd/server-s3.conf, da bo ustrezal vašim potrebam.

Konfiguracijske in podatkovne datoteke, ki jih uporablja gruča baze podatkov, so običajno shranjene skupaj v podatkovnem imeniku gruče, ki se običajno imenuje PGDATA

#!/bin/bash

export PG_VER="9.6"

export WALE_S3_PREFIX="s3://pg-backups" # бакет, который мы создали в S3
export AWS_ACCESS_KEY_ID="xxxx" # AccessKey из /etc/minio/minio.conf 
export AWS_ENDPOINT="http://ip-адрес-сервера-minio:9000"
export AWS_S3_FORCE_PATH_STYLE="true"
export AWS_SECRET_ACCESS_KEY="yyyy" # SecretKey из /etc/minio/minio.conf

export PGDATA=/var/lib/pgsql/$PG_VER/data/
export PGHOST=/var/run/postgresql/.s.PGSQL.5432 # Сокет для подключения к PostgreSQL

export WALG_UPLOAD_CONCURRENCY=2 # Кол-во потоков для закачки 
export WALG_DOWNLOAD_CONCURRENCY=2 # Кол-во потоков для скачивания
export WALG_UPLOAD_DISK_CONCURRENCY=2 # Кол-во потоков на диске для закачки
export WALG_DELTA_MAX_STEPS=7
export WALG_COMPRESSION_METHOD=brotli # Какой метод сжатия использовать.

Pri nastavitvi WAL-G določite WALG_DELTA_MAX_STEPS - število korakov, za katere je delta varnostna kopija maksimalno oddaljena od osnovne varnostne kopije, in določite politiko delta kopiranja. Naredite kopijo iz zadnje obstoječe delte ali naredite delto iz prvotne popolne varnostne kopije. To je potrebno za primer, ko se ista komponenta baze podatkov vedno spreminja v vaši bazi podatkov, isti podatki se nenehno spreminjajo.

Namestitev baze podatkov.

yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.
noarch.rpm
yum install -y postgresql96 postgresql96-server mc

Inicializirajmo bazo podatkov.

/usr/pgsql-9.6/bin/postgresql96-setup initdb
Initializing database ... OK

Če preizkušate na 1 strežniku, morate znova konfigurirati parameter wal_level za arhiviranje za različico PostgreSQL, manjšo od 10, in repliko za različico PostgreSQL 10 in starejše.

wal_level = archive

Varnostno kopirajmo arhive WAL vsakih 60 sekund s samim PostgreSQL. V produkciji boste imeli drugačno vrednost archive_timeout.

archive_mode = on
archive_command = '/usr/local/bin/wal-push.sh %p'
archive_timeout = 60 # Каждые 60 секунд будет выполнятся команда archive_command.

Zaženimo PostgreSQL

systemctl start postgresql-9.6

V ločeni konzoli si ogledamo dnevnike PostgreSQL za napake: (spremeni postgresql-Wed.log v trenutnega).

tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Pojdimo na psql.

su - postgres
psql

Ustvarimo bazo podatkov v psql.

Ustvarite tabelo v bazi podatkov test1.

create database test1;

Preklopite na testno bazo podatkov.

postgres=# c test1;

Ustvarite tabelo indexing_table.

test1=# CREATE TABLE indexing_table(created_at TIMESTAMP WITH TIME ZONE DEFAULT NOW());

Dodajanje podatkov.

Začnimo z vstavljanjem podatkov. Počakamo 10-20 minut.

#!/bin/bash
# postgres
while true; do
psql -U postgres -d test1 -c "INSERT INTO indexing_table(created_at) VALUES (CURRENT_TIMESTAMP);"
sleep 60;
done

Ne pozabite narediti popolne varnostne kopije.

su - postgres
/usr/local/bin/backup-push.sh

Ogledamo si vnose v tabeli v bazi test1

select * from indexing_table;
2020-01-29 09:41:25.226198+
2020-01-29 09:42:25.336989+
2020-01-29 09:43:25.356069+
2020-01-29 09:44:25.37381+
2020-01-29 09:45:25.392944+
2020-01-29 09:46:25.412327+
2020-01-29 09:47:25.432564+
2020-01-29 09:48:25.451985+
2020-01-29 09:49:25.472653+
2020-01-29 09:50:25.491974+
2020-01-29 09:51:25.510178+

Niz je trenutni čas.

Ogledamo si seznam popolnih varnostnih kopij

/usr/local/bin/backup-list.sh

Testiranje obnovitve

Popolna obnovitev s prenosom vseh razpoložljivih WAL.

Zaustavitev Postgresqla.

Izbrišemo vse iz mape /var/lib/pgsql/9.6/data.

Zaženite skript /usr/local/bin/backup-fetch.sh od uporabnika postgres.

su - postgres
/usr/local/bin/backup-fetch.sh

Ekstrahacija varnostne kopije končana.

Dodajte recovery.conf v mapo /var/lib/pgsql/9.6/data z naslednjo vsebino.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'

Zaženite PostgreSQL. PostgreSQL bo sprožil postopek obnovitve iz arhiviranega WAL-a in šele nato se bo odprla baza podatkov.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Okrevanje za določen čas.

Če želimo bazo obnoviti na določeno minuto, potem v recovery.conf dodamo parameter recovery_target_time - navedemo ob kateri uri obnoviti bazo.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'
recovery_target_time = '2020-01-29 09:46:25'

Po obnovitvi si oglejte tabelo indexing_table

 2020-01-29 09:41:25.226198+00
 2020-01-29 09:42:25.336989+00
 2020-01-29 09:43:25.356069+00
 2020-01-29 09:44:25.37381+00
 2020-01-29 09:45:25.392944+00

Zaženite PostgreSQL. PostgreSQL bo sprožil postopek obnovitve iz arhiviranega WAL-a in šele nato se bo odprla baza podatkov.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Testiranje

Ustvarimo bazo podatkov velikosti 1 GB, kot je opisano tukaj https://gist.github.com/ololobus/5b25c432f208d7eb31051a5f238dffff

Zahtevamo velikost vedra po ustvarjanju 1 GB podatkov.

postgres=# SELECT pg_size_pretty(pg_database_size('test1'));
pg_size_pretty
----------------
1003 MB

s4cmd — бесплатный инструмент командной строки для работы с данными, расположенными в хранилище Amazon S3. Утилита написана на языке программирования python, и благодаря этому может использоваться в операционных системах и WindowsIn Linux.

Namestite s4cmd

pip install s4cmd

LZ4

s4cmd --endpoint-url=http://ip-адрес-сервера-minio:9000 --access-key=xxxx --secret-key=yyyy du -r s3://pg-backups
840540822       s3://pg-backups/wal_005/
840 МБ в формате lz4 только WAL логов

Полный бекап с lz4 - 1GB данных
time backup_push.sh
real 0m18.582s

Размер S3 бакета после полного бекапа

581480085       s3://pg-backups/basebackups_005/
842374424   s3://pg-backups/wal_005
581 МБ занимает полный бекап

LZMA

После генерации 1ГБ данных
338413694       s3://pg-backups/wal_005/
338 мб логов в формате lzma

Время генерации полного бекапа
time backup_push.sh
real    5m25.054s

Размер бакета в S3
270310495       s3://pg-backups/basebackups_005/
433485092   s3://pg-backups/wal_005/

270 мб занимает полный бекап в формате lzma

Brotli

После генерации 1ГБ данных
459229886       s3://pg-backups/wal_005/
459 мб логов в формате brotli

Время генерации полного бекапа
real    0m23.408s

Размер бакета в S3
312960942       s3://pg-backups/basebackups_005/
459309262   s3://pg-backups/wal_005/

312 мб занимает полный бекап в формате brotli

Primerjava rezultatov na grafu.

Uvod v varnostni sistem wal-g PostgreSQL

Kot lahko vidimo, je Brotli po velikosti primerljiv z LZMA, vendar se varnostno kopiranje izvaja v času LZ4.

Klepet rusko govoreče skupnosti PostgreSQL: https://t.me/pgsql

Prosimo, dajte zvezdico na Githubu, če uporabljate wal-g

Vir: www.habr.com

Kupite zanesljivo gostovanje za strani z DDoS zaščito, VPS VDS strežniki 🔥 Kupite zanesljivo spletno gostovanje z zaščito DDoS, VPS VDS strežniki | ProHoster