Johdatus wal-g PostgreSQL -varmuuskopiojärjestelmään

WAL-G on yksinkertainen ja tehokas työkalu PostgreSQL-varmuuskopiointiin pilviin. Päätoimintojensa suhteen se on suositun työkalun perillinen WAL-E, mutta kirjoitettu uudelleen Go. Mutta WAL-G:ssä on yksi tärkeä uusi ominaisuus - deltakopiot. delta-kopioita WAL-G tallentaa sivut tiedostoista, jotka ovat muuttuneet edellisen varmuuskopiointiversion jälkeen. WAL-G toteuttaa melko paljon tekniikoita varmuuskopiointien rinnakkaisuudelle. WAL-G on paljon nopeampi kuin WAL-E.

Yksityiskohtaiset tiedot wal-g:n toiminnasta löytyvät artikkelista: Ylikellotamme varmuuskopioinnin. Yandex luento

S3-tallennusprotokollasta on tullut suosittu tietojen tallentamisessa. Yksi S3:n eduista on pääsy API:n kautta, jonka avulla voit järjestää joustavan vuorovaikutuksen tallennustilan kanssa, mukaan lukien julkinen lukuoikeus, kun taas tietojen päivittäminen tallennustilassa tapahtuu vain valtuutettujen henkilöiden toimesta.

On olemassa useita julkisia ja yksityisiä tallennustoteutuksia, jotka käyttävät S3-protokollaa. Tänään tarkastelemme suosittua ratkaisua pienen varaston järjestämiseen - Minio.

Yksi PostgreSQL-palvelin sopii hyvin wal-g:n testaamiseen, ja Minioa käytetään S3:n korvikkeena.

Minio-palvelin

Mini-asennus

yum -y install yum-plugin-copr
yum copr enable -y lkiesow/minio
yum install -y minio

Muokkaa AccessKeyä ja SecretKeyä tiedostossa /etc/minio/minio.conf

vi /etc/minio/minio.conf

Jos et käytä nginxiä ennen Minioa, sinun on vaihdettava

--address 127.0.0.1:9000

--address 0.0.0.0:9000

Minio käynnistetään

systemctl start minio

Siirry Mini-verkkokäyttöliittymään http://ip-адрес-сервера-minio:9000 ja luo ryhmä (esimerkiksi pg-varmuuskopiot).

DB-palvelin

WAL-G kierrosluvulla on minun (Anton Patsev) kokoama. Github, Fedora COPR.

Kenellä ei ole RPM-pohjaista järjestelmää, käytä virallista ohjeet asennuksella.

Yhdessä wal-g-binaarin kanssa rpm sisältää skriptejä, jotka tuovat muuttujia /etc/wal-gd/server-s3.conf-tiedostosta.

backup-fetch.sh
backup-list.sh
backup-push.sh
wal-fetch.sh
wal-g-run.sh
wal-push.sh

Asenna Walg.

yum -y install yum-plugin-copr
yum copr enable -y antonpatsev/wal-g
yum install -y wal-g

Tarkistetaan wal-g-versiota.

wal-g --version
wal-g version v0.2.14

Muokkaa tiedostoa /etc/wal-gd/server-s3.conf tarpeidesi mukaan.

Tietokantaklusterin käyttämät konfigurointitiedostot ja datatiedostot on perinteisesti tallennettu yhdessä klusterin tietohakemistoon, jota kutsutaan yleisesti nimellä PGDATA

#!/bin/bash

export PG_VER="9.6"

export WALE_S3_PREFIX="s3://pg-backups" # бакет, который мы создали в S3
export AWS_ACCESS_KEY_ID="xxxx" # AccessKey из /etc/minio/minio.conf 
export AWS_ENDPOINT="http://ip-адрес-сервера-minio:9000"
export AWS_S3_FORCE_PATH_STYLE="true"
export AWS_SECRET_ACCESS_KEY="yyyy" # SecretKey из /etc/minio/minio.conf

export PGDATA=/var/lib/pgsql/$PG_VER/data/
export PGHOST=/var/run/postgresql/.s.PGSQL.5432 # Сокет для подключения к PostgreSQL

export WALG_UPLOAD_CONCURRENCY=2 # Кол-во потоков для закачки 
export WALG_DOWNLOAD_CONCURRENCY=2 # Кол-во потоков для скачивания
export WALG_UPLOAD_DISK_CONCURRENCY=2 # Кол-во потоков на диске для закачки
export WALG_DELTA_MAX_STEPS=7
export WALG_COMPRESSION_METHOD=brotli # Какой метод сжатия использовать.

Kun määrität WAL-G:tä, määrität WALG_DELTA_MAX_STEPS - vaiheiden määrän, jonka delta-varmuuskopio on suurin perusvarmuuskopiosta, ja määritä delta-kopiointikäytäntö. Joko teet kopion viimeisestä olemassa olevasta deltasta tai teet deltan alkuperäisestä täydellisestä varmuuskopiosta. Tämä on tarpeen, jos tietokannan sama komponentti muuttuu jatkuvasti tietokannassasi, samat tiedot muuttuvat jatkuvasti.

Tietokannan asentaminen.

yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.
noarch.rpm
yum install -y postgresql96 postgresql96-server mc

Alustamme tietokannan.

/usr/pgsql-9.6/bin/postgresql96-setup initdb
Initializing database ... OK

Jos testaat yhdellä palvelimella, sinun on määritettävä wal_level-parametri uudelleen arkistointia varten PostgreSQL:lle, joka on pienempi kuin versio 1, ja replika PostgreSQL-versiolle 10 ja sitä vanhemmille.

wal_level = archive

Varmuuskopioidaan WAL-arkistot 60 sekunnin välein käyttämällä itse PostgreSQL:ää. Tuotantoversiossa sinulla on eri archive_timeout-arvo.

archive_mode = on
archive_command = '/usr/local/bin/wal-push.sh %p'
archive_timeout = 60 # Каждые 60 секунд будет выполнятся команда archive_command.

Käynnistetään PostgreSQL

systemctl start postgresql-9.6

Tarkastelemme erillisessä konsolissa PostgreSQL-lokeja virheiden varalta: (vaihda postgresql-Wed.log nykyiseksi).

tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Mennään psql:iin.

su - postgres
psql

Luo tietokanta psql:ssä

Luo taulukko tietokantaan testi1.

create database test1;

Vaihda tietokantatestiin.

postgres=# c test1;

Luomme taulukon indexing_table.

test1=# CREATE TABLE indexing_table(created_at TIMESTAMP WITH TIME ZONE DEFAULT NOW());

Tietojen lisääminen.

Aloitamme tietojen lisäämisen. Odotamme 10-20 minuuttia.

#!/bin/bash
# postgres
while true; do
psql -U postgres -d test1 -c "INSERT INTO indexing_table(created_at) VALUES (CURRENT_TIMESTAMP);"
sleep 60;
done

Muista tehdä täydellinen varmuuskopio.

su - postgres
/usr/local/bin/backup-push.sh

Katsomme tietokannan test1 taulukon tietueita

select * from indexing_table;
2020-01-29 09:41:25.226198+
2020-01-29 09:42:25.336989+
2020-01-29 09:43:25.356069+
2020-01-29 09:44:25.37381+
2020-01-29 09:45:25.392944+
2020-01-29 09:46:25.412327+
2020-01-29 09:47:25.432564+
2020-01-29 09:48:25.451985+
2020-01-29 09:49:25.472653+
2020-01-29 09:50:25.491974+
2020-01-29 09:51:25.510178+

Merkkijono on nykyinen aika.

Katso luettelo kaikista varmuuskopioista

/usr/local/bin/backup-list.sh

Palautustestaus

Täysi palautuminen, kun kaikki käytettävissä olevat WAL:t otetaan käyttöön.

Pysäytä Postgresql.

Poista kaikki /var/lib/pgsql/9.6/data-kansiosta.

Suorita /usr/local/bin/backup-fetch.sh-komentosarja postgres-käyttäjänä.

su - postgres
/usr/local/bin/backup-fetch.sh

Varmuuskopion purkaminen valmis.

Lisää recovery.conf seuraavan sisällön sisältävään /var/lib/pgsql/9.6/data-kansioon.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'

Aloitamme PostgreSQL:n. PostgreSQL aloittaa palautusprosessin arkistoiduista WAL-alueista, ja vasta sitten tietokanta avautuu.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Toipuminen tietyn ajan.

Jos haluamme palauttaa tietokannan tiettyyn minuuttiin asti, lisäämme recovery_target_time-parametrin recovery.conf-tiedostoon - ilmoitamme milloin tietokanta palautetaan.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'
recovery_target_time = '2020-01-29 09:46:25'

Katso palautuksen jälkeen taulukkoa indexing_table

 2020-01-29 09:41:25.226198+00
 2020-01-29 09:42:25.336989+00
 2020-01-29 09:43:25.356069+00
 2020-01-29 09:44:25.37381+00
 2020-01-29 09:45:25.392944+00

Aloitamme PostgreSQL:n. PostgreSQL aloittaa palautusprosessin arkistoiduista WAL-alueista, ja vasta sitten tietokanta avautuu.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Testaus

Luodaan 1 Gt:n tietokanta tässä kuvatulla tavalla https://gist.github.com/ololobus/5b25c432f208d7eb31051a5f238dffff

Säilön koon pyytäminen 1 Gt:n tiedon luomisen jälkeen.

postgres=# SELECT pg_size_pretty(pg_database_size('test1'));
pg_size_pretty
----------------
1003 MB

s4cmd on ilmainen komentorivityökalu Amazon S3 -tallennustilassa olevien tietojen kanssa työskentelemiseen. Apuohjelma on kirjoitettu python-ohjelmointikielellä ja sen ansiosta sitä voidaan käyttää sekä Windows- että Linux-käyttöjärjestelmissä.

Asenna s4cmd

pip install s4cmd

LZ4

s4cmd --endpoint-url=http://ip-адрес-сервера-minio:9000 --access-key=xxxx --secret-key=yyyy du -r s3://pg-backups
840540822       s3://pg-backups/wal_005/
840 МБ в формате lz4 только WAL логов

Полный бекап с lz4 - 1GB данных
time backup_push.sh
real 0m18.582s

Размер S3 бакета после полного бекапа

581480085       s3://pg-backups/basebackups_005/
842374424   s3://pg-backups/wal_005
581 МБ занимает полный бекап

LZMA

После генерации 1ГБ данных
338413694       s3://pg-backups/wal_005/
338 мб логов в формате lzma

Время генерации полного бекапа
time backup_push.sh
real    5m25.054s

Размер бакета в S3
270310495       s3://pg-backups/basebackups_005/
433485092   s3://pg-backups/wal_005/

270 мб занимает полный бекап в формате lzma

Brotli

После генерации 1ГБ данных
459229886       s3://pg-backups/wal_005/
459 мб логов в формате brotli

Время генерации полного бекапа
real    0m23.408s

Размер бакета в S3
312960942       s3://pg-backups/basebackups_005/
459309262   s3://pg-backups/wal_005/

312 мб занимает полный бекап в формате brotli

Tulosten vertailu kaaviossa.

Johdatus wal-g PostgreSQL -varmuuskopiojärjestelmään

Kuten näette, Brotli on kooltaan verrattavissa LZMA:han, mutta varmuuskopiointi suoritetaan LZ4-ajassa.

Venäjänkielisen PostgreSQL-yhteisön chat: https://t.me/pgsql

Anna Githubille tähti, jos käytät wal-g

Lähde: will.com

Lisää kommentti