Įvadas į wal-g PostgreSQL atsarginių kopijų kūrimo sistemą

WAL-G yra paprastas ir efektyvus įrankis atsarginėms PostgreSQL kopijoms kurti debesyse. Kalbant apie pagrindines funkcijas, tai yra populiaraus įrankio paveldėtojas WAL-E, bet perrašyta Go. Tačiau yra viena svarbi nauja WAL-G savybė – delta kopijos. delta kopijos WAL-G saugoti failų, kurie pasikeitė nuo ankstesnės atsarginės versijos, puslapius. WAL-G įdiegia gana daug atsarginių kopijų lygiagretinimo technologijų. WAL-G yra daug greitesnis nei WAL-E.

Išsamią informaciją apie tai, kaip veikia wal-g, rasite straipsnyje: Mes viršijame atsarginę kopiją. Yandex paskaita

S3 saugojimo protokolas tapo populiarus duomenims saugoti. Vienas iš S3 privalumų yra galimybė pasiekti per API, kuri leidžia organizuoti lanksčią sąveiką su saugykla, įskaitant viešąją skaitymo prieigą, o informaciją saugykloje atnaujina tik įgalioti asmenys.

Yra keletas viešųjų ir privačių saugyklų diegimų, kuriuose naudojamas S3 protokolas. Šiandien apžvelgsime populiarų mažos saugyklos organizavimo sprendimą - Minio.

Vienas „PostgreSQL“ serveris tinka „wal-g“ testavimui, o „Minio“ naudojamas kaip S3 pakaitalas.

Mini serveris

Mini montavimas

yum -y install yum-plugin-copr
yum copr enable -y lkiesow/minio
yum install -y minio

Redaguokite AccessKey ir SecretKey aplanke /etc/minio/minio.conf

vi /etc/minio/minio.conf

Jei nenaudosite nginx prieš Minio, turite pakeisti

--address 127.0.0.1:9000

--address 0.0.0.0:9000

„Minio“ paleidimas

systemctl start minio

Eikite į „Minio“ žiniatinklio sąsają http://ip-адрес-сервера-minio:9000 ir sukurti segmentą (pavyzdžiui, pg-atsarginės kopijos).

DB serveris

WAL-G su rpm surinkau aš (Antonas Patsevas). GitHub, Fedora COPR.

Kas neturi RPM pagrįstos sistemos, naudokite oficialią instrukcija įdiegiant.

Kartu su dvejetainiu wal-g, rpm yra scenarijų, kurie importuoja kintamuosius iš /etc/wal-gd/server-s3.conf failo.

backup-fetch.sh
backup-list.sh
backup-push.sh
wal-fetch.sh
wal-g-run.sh
wal-push.sh

Įdiegti Walg.

yum -y install yum-plugin-copr
yum copr enable -y antonpatsev/wal-g
yum install -y wal-g

Tikrinama wal-g versija.

wal-g --version
wal-g version v0.2.14

Redaguokite /etc/wal-gd/server-s3.conf pagal savo poreikius.

Duomenų bazės klasterio naudojami konfigūracijos failai ir duomenų failai tradiciškai saugomi kartu klasterio duomenų kataloge, paprastai vadinamame kaip PGDATA

#!/bin/bash

export PG_VER="9.6"

export WALE_S3_PREFIX="s3://pg-backups" # бакет, который мы создали в S3
export AWS_ACCESS_KEY_ID="xxxx" # AccessKey из /etc/minio/minio.conf 
export AWS_ENDPOINT="http://ip-адрес-сервера-minio:9000"
export AWS_S3_FORCE_PATH_STYLE="true"
export AWS_SECRET_ACCESS_KEY="yyyy" # SecretKey из /etc/minio/minio.conf

export PGDATA=/var/lib/pgsql/$PG_VER/data/
export PGHOST=/var/run/postgresql/.s.PGSQL.5432 # Сокет для подключения к PostgreSQL

export WALG_UPLOAD_CONCURRENCY=2 # Кол-во потоков для закачки 
export WALG_DOWNLOAD_CONCURRENCY=2 # Кол-во потоков для скачивания
export WALG_UPLOAD_DISK_CONCURRENCY=2 # Кол-во потоков на диске для закачки
export WALG_DELTA_MAX_STEPS=7
export WALG_COMPRESSION_METHOD=brotli # Какой метод сжатия использовать.

Konfigūruodami WAL-G, nurodote WALG_DELTA_MAX_STEPS – žingsnių skaičių, per kurį delta atsarginė kopija yra didžiausia nuo pagrindinės atsarginės kopijos, ir nurodote delta kopijavimo strategiją. Arba darote kopiją iš paskutinės esamos delta, arba sukuriate delta iš originalios visos atsarginės kopijos. Tai būtina tuo atveju, kai jūsų duomenų bazėje nuolat keičiasi tas pats duomenų bazės komponentas, nuolat keičiasi tie patys duomenys.

Duomenų bazės diegimas.

yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.
noarch.rpm
yum install -y postgresql96 postgresql96-server mc

Mes inicijuojame duomenų bazę.

/usr/pgsql-9.6/bin/postgresql96-setup initdb
Initializing database ... OK

Jei testuojate 1 serveryje, turite iš naujo sukonfigūruoti parametrą wal_level, kad būtų galima archyvuoti senesnę nei 10 versijos PostgreSQL ir 10 ar senesnės versijos PostgreSQL kopiją.

wal_level = archive

Kurkime atsargines WAL archyvų kopijas kas 60 sekundžių naudodami patį PostgreSQL. Gamybinėje versijoje turėsite skirtingą archyvo_laiko pabaigos vertę.

archive_mode = on
archive_command = '/usr/local/bin/wal-push.sh %p'
archive_timeout = 60 # Каждые 60 секунд будет выполнятся команда archive_command.

Paleidžiama PostgreSQL

systemctl start postgresql-9.6

Atskiroje konsolėje mes žiūrime į PostgreSQL žurnalus, ar nėra klaidų: (pakeiskite postgresql-Wed.log į dabartinį).

tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Eime į psql.

su - postgres
psql

Sukurkite duomenų bazę psql

Sukurkite lentelę duomenų bazėje test1.

create database test1;

Perjunkite į duomenų bazės testą.

postgres=# c test1;

Sukuriame lentelę indeksavimo_lentelė.

test1=# CREATE TABLE indexing_table(created_at TIMESTAMP WITH TIME ZONE DEFAULT NOW());

Duomenų pridėjimas.

Pradedame įvesti duomenis. Laukiame 10-20 min.

#!/bin/bash
# postgres
while true; do
psql -U postgres -d test1 -c "INSERT INTO indexing_table(created_at) VALUES (CURRENT_TIMESTAMP);"
sleep 60;
done

Būtinai pasidarykite visą atsarginę kopiją.

su - postgres
/usr/local/bin/backup-push.sh

Mes žiūrime į duomenų bazės test1 lentelės įrašus

select * from indexing_table;
2020-01-29 09:41:25.226198+
2020-01-29 09:42:25.336989+
2020-01-29 09:43:25.356069+
2020-01-29 09:44:25.37381+
2020-01-29 09:45:25.392944+
2020-01-29 09:46:25.412327+
2020-01-29 09:47:25.432564+
2020-01-29 09:48:25.451985+
2020-01-29 09:49:25.472653+
2020-01-29 09:50:25.491974+
2020-01-29 09:51:25.510178+

Eilutė yra dabartinis laikas.

Peržiūrėkite visų atsarginių kopijų sąrašą

/usr/local/bin/backup-list.sh

Atkūrimo testas

Visiškas atkūrimas naudojant visą turimą WAL.

Sustabdyti Postgresql.

Ištrinkite viską iš /var/lib/pgsql/9.6/data aplanko.

Paleiskite /usr/local/bin/backup-fetch.sh scenarijų kaip postgres vartotoją.

su - postgres
/usr/local/bin/backup-fetch.sh

Atsarginės kopijos ištraukimas baigtas.

Pridėkite recovery.conf į aplanką /var/lib/pgsql/9.6/data su tokiu turiniu.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'

Pradedame PostgreSQL. PostgreSQL pradės atkūrimo procesą iš archyvuotų WAL ir tik tada bus atidaryta duomenų bazė.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Atsigavimas tam tikram laikui.

Jei norime atkurti duomenų bazę iki tam tikros minutės, tada į recovery.conf pridedame atkūrimo_target_time parametrą – nurodome, kuriuo metu reikia atkurti duomenų bazę.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'
recovery_target_time = '2020-01-29 09:46:25'

Po atkūrimo pažiūrėkite į lentelę indexing_table

 2020-01-29 09:41:25.226198+00
 2020-01-29 09:42:25.336989+00
 2020-01-29 09:43:25.356069+00
 2020-01-29 09:44:25.37381+00
 2020-01-29 09:45:25.392944+00

Pradedame PostgreSQL. PostgreSQL pradės atkūrimo procesą iš archyvuotų WAL ir tik tada bus atidaryta duomenų bazė.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Bandymai

1 GB duomenų bazės generavimas, kaip aprašyta čia https://gist.github.com/ololobus/5b25c432f208d7eb31051a5f238dffff

Sugeneravus 1 GB duomenų, prašoma segmento dydžio.

postgres=# SELECT pg_size_pretty(pg_database_size('test1'));
pg_size_pretty
----------------
1003 MB

s4cmd yra nemokamas komandų eilutės įrankis, skirtas dirbti su duomenimis, esančiais „Amazon S3“ saugykloje. Priemonė yra parašyta python programavimo kalba, todėl ją galima naudoti tiek Windows, tiek Linux operacinėse sistemose.

Įdiegti s4cmd

pip install s4cmd

LZ4

s4cmd --endpoint-url=http://ip-адрес-сервера-minio:9000 --access-key=xxxx --secret-key=yyyy du -r s3://pg-backups
840540822       s3://pg-backups/wal_005/
840 МБ в формате lz4 только WAL логов

Полный бекап с lz4 - 1GB данных
time backup_push.sh
real 0m18.582s

Размер S3 бакета после полного бекапа

581480085       s3://pg-backups/basebackups_005/
842374424   s3://pg-backups/wal_005
581 МБ занимает полный бекап

LZMA

После генерации 1ГБ данных
338413694       s3://pg-backups/wal_005/
338 мб логов в формате lzma

Время генерации полного бекапа
time backup_push.sh
real    5m25.054s

Размер бакета в S3
270310495       s3://pg-backups/basebackups_005/
433485092   s3://pg-backups/wal_005/

270 мб занимает полный бекап в формате lzma

Brotli

После генерации 1ГБ данных
459229886       s3://pg-backups/wal_005/
459 мб логов в формате brotli

Время генерации полного бекапа
real    0m23.408s

Размер бакета в S3
312960942       s3://pg-backups/basebackups_005/
459309262   s3://pg-backups/wal_005/

312 мб занимает полный бекап в формате brotli

Rezultatų palyginimas diagramoje.

Įvadas į wal-g PostgreSQL atsarginių kopijų kūrimo sistemą

Kaip matote, „Brotli“ dydžiu yra panašus į LZMA, tačiau atsarginė kopija daroma LZ4 laiku.

Rusakalbių PostgreSQL bendruomenės pokalbis: https://t.me/pgsql

Jei naudojate, įvertinkite „Github“ žvaigždutę wal-g

Šaltinis: www.habr.com

Добавить комментарий