wal-g PostgreSQL нөөцлөх системийн танилцуулга

WAL-G нь PostgreSQL-г үүлэн дээр нөөцлөх энгийн бөгөөд үр дүнтэй хэрэгсэл юм. Үндсэн функциональ байдлын хувьд энэ нь алдартай хэрэгслийн өв залгамжлагч юм WAL-E, гэхдээ Go дээр дахин бичсэн. Гэхдээ WAL-G-д нэг чухал шинэ боломж бий - дельта хуулбарууд. дельта хуулбарууд WAL-G өмнөх нөөц хувилбараас хойш өөрчлөгдсөн файлуудын хуудсыг хадгалах. WAL-G нь нөөцлөлтийг параллель болгох маш олон технологийг хэрэгжүүлдэг. WAL-G нь WAL-E-ээс хамаагүй хурдан.

Wal-g хэрхэн ажилладаг талаар дэлгэрэнгүй мэдээллийг нийтлэлээс олж болно. Бид нөөцлөлтийг overclock хийдэг. Yandex лекц

S3 хадгалах протокол нь өгөгдөл хадгалахад түгээмэл болсон. S3-ийн давуу талуудын нэг нь API-ээр дамжуулан нэвтрэх чадвар бөгөөд энэ нь хадгалах сантай уян хатан харилцан үйлчлэл, тэр дундаа нийтийн унших хандалтыг зохион байгуулах боломжийг олгодог бөгөөд хадгалах сан дахь мэдээллийг зөвхөн эрх бүхий хүмүүс шинэчилдэг.

S3 протоколыг ашигладаг олон нийтийн болон хувийн хадгалалтын хэд хэдэн хувилбарууд байдаг. Өнөөдөр бид жижиг агуулах зохион байгуулах түгээмэл шийдлийг авч үзэх болно - Minio.

Ганц PostgreSQL сервер нь wal-g-г туршихад тохиромжтой бөгөөд Minio-г S3-ийн орлуулагч болгон ашигладаг.

Minio сервер

Минио суурилуулалт

yum -y install yum-plugin-copr
yum copr enable -y lkiesow/minio
yum install -y minio

AccessKey болон SecretKey-г /etc/minio/minio.conf дотор засна

vi /etc/minio/minio.conf

Хэрэв та Minio-ээс өмнө nginx ашиглахгүй бол өөрчлөх хэрэгтэй

--address 127.0.0.1:9000

--address 0.0.0.0:9000

Minio-г эхлүүлж байна

systemctl start minio

Minio вэб интерфэйс рүү очно уу http://ip-адрес-сервера-minio:9000 ба хувин үүсгэх (жишээ нь, pg-нөөцлөлт).

DB сервер

WAL-G rpm-ийг би угсардаг (Антон Пацев). Github, Fedora COPR.

RPM-д суурилсан системгүй хүмүүс албан тушаалтныг ашиглана уу зааварчилгаа суурилуулах замаар.

wal-g хоёртын файлтай хамт rpm нь /etc/wal-gd/server-s3.conf файлаас хувьсагчдыг импортлох скриптүүдийг агуулдаг.

backup-fetch.sh
backup-list.sh
backup-push.sh
wal-fetch.sh
wal-g-run.sh
wal-push.sh

Walg суулгана уу.

yum -y install yum-plugin-copr
yum copr enable -y antonpatsev/wal-g
yum install -y wal-g

Wal-g хувилбарыг шалгаж байна.

wal-g --version
wal-g version v0.2.14

/etc/wal-gd/server-s3.conf-г өөрийн хэрэгцээнд нийцүүлэн засварлана.

Өгөгдлийн сангийн кластерт ашигладаг тохиргооны файлууд болон өгөгдлийн файлууд нь уламжлал ёсоор кластерийн өгөгдлийн санд хадгалагддаг бөгөөд үүнийг ихэвчлэн гэж нэрлэдэг. PGDATA

#!/bin/bash

export PG_VER="9.6"

export WALE_S3_PREFIX="s3://pg-backups" # бакет, который мы создали в S3
export AWS_ACCESS_KEY_ID="xxxx" # AccessKey из /etc/minio/minio.conf 
export AWS_ENDPOINT="http://ip-адрес-сервера-minio:9000"
export AWS_S3_FORCE_PATH_STYLE="true"
export AWS_SECRET_ACCESS_KEY="yyyy" # SecretKey из /etc/minio/minio.conf

export PGDATA=/var/lib/pgsql/$PG_VER/data/
export PGHOST=/var/run/postgresql/.s.PGSQL.5432 # Сокет для подключения к PostgreSQL

export WALG_UPLOAD_CONCURRENCY=2 # Кол-во потоков для закачки 
export WALG_DOWNLOAD_CONCURRENCY=2 # Кол-во потоков для скачивания
export WALG_UPLOAD_DISK_CONCURRENCY=2 # Кол-во потоков на диске для закачки
export WALG_DELTA_MAX_STEPS=7
export WALG_COMPRESSION_METHOD=brotli # Какой метод сжатия использовать.

WAL-G-г тохируулахдаа та WALG_DELTA_MAX_STEPS - үндсэн нөөцлөлтөөс гурвалжин нөөцлөлт хийх хамгийн их алхамуудын тоог зааж, дельта хуулбарлах бодлогыг зааж өгнө. Та хамгийн сүүлд байгаа дельтагаас хуулбар хийх эсвэл анхны бүрэн нөөцлөлтөөс дельта хийх боломжтой. Мэдээллийн сангийн нэг бүрэлдэхүүн хэсэг нь таны мэдээллийн санд байнга өөрчлөгдөж байдаг бол ижил өгөгдөл байнга өөрчлөгдөж байдаг тохиолдолд энэ нь зайлшгүй шаардлагатай.

Өгөгдлийн санг суулгаж байна.

yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.
noarch.rpm
yum install -y postgresql96 postgresql96-server mc

Бид мэдээллийн санг эхлүүлдэг.

/usr/pgsql-9.6/bin/postgresql96-setup initdb
Initializing database ... OK

Хэрэв та 1 сервер дээр тест хийж байгаа бол PostgreSQL-ийн 10-аас доош хувилбарыг архивлах, PostgreSQL-ийн 10 ба түүнээс дээш хувилбарыг хуулбарлахын тулд wal_level параметрийг дахин тохируулах шаардлагатай.

wal_level = archive

PostgreSQL ашиглан WAL архивыг 60 секунд тутамд нөөцөлцгөөе. Бүтээгдэхүүн дээр та архивын_цаг хугацаа өөр утгатай байх болно.

archive_mode = on
archive_command = '/usr/local/bin/wal-push.sh %p'
archive_timeout = 60 # Каждые 60 секунд будет выполнятся команда archive_command.

PostgreSQL-г эхлүүлж байна

systemctl start postgresql-9.6

Тусдаа консол дээр бид PostgreSQL-н алдааны бүртгэлийг хардаг: (postgresql-Wed.log-г одоогийнх болгож өөрчлөх).

tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

psql руу орцгооё.

su - postgres
psql

psql дээр мэдээллийн сан үүсгэх

Өгөгдлийн сангийн test1 дээр хүснэгт үүсгэ.

create database test1;

Өгөгдлийн сангийн тест рүү шилжих.

postgres=# c test1;

Бид хүснэгтийн индексжүүлэх_хүснэгтийг үүсгэдэг.

test1=# CREATE TABLE indexing_table(created_at TIMESTAMP WITH TIME ZONE DEFAULT NOW());

Өгөгдөл нэмж байна.

Бид өгөгдөл оруулж эхэлдэг. Бид 10-20 минут хүлээж байна.

#!/bin/bash
# postgres
while true; do
psql -U postgres -d test1 -c "INSERT INTO indexing_table(created_at) VALUES (CURRENT_TIMESTAMP);"
sleep 60;
done

Бүрэн нөөцлөлт хийхээ мартуузай.

su - postgres
/usr/local/bin/backup-push.sh

Бид мэдээллийн баазын тест1 дэх хүснэгтийн бичлэгүүдийг харна

select * from indexing_table;
2020-01-29 09:41:25.226198+
2020-01-29 09:42:25.336989+
2020-01-29 09:43:25.356069+
2020-01-29 09:44:25.37381+
2020-01-29 09:45:25.392944+
2020-01-29 09:46:25.412327+
2020-01-29 09:47:25.432564+
2020-01-29 09:48:25.451985+
2020-01-29 09:49:25.472653+
2020-01-29 09:50:25.491974+
2020-01-29 09:51:25.510178+

Мөр нь одоогийн цаг юм.

Бүрэн нөөцлөлтийн жагсаалтыг үзнэ үү

/usr/local/bin/backup-list.sh

Сэргээх туршилт

Боломжтой бүх WAL-ийг эргүүлснээр бүрэн сэргэлт.

Postgresql-г зогсоо.

/var/lib/pgsql/9.6/data хавтаснаас бүгдийг устгана уу.

/usr/local/bin/backup-fetch.sh скриптийг postgres хэрэглэгчийн хувьд ажиллуул.

su - postgres
/usr/local/bin/backup-fetch.sh

Нөөц олборлолт дууссан.

Дараах контент бүхий /var/lib/pgsql/9.6/data хавтсанд recovery.conf-г нэмнэ үү.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'

Бид PostgreSQL-г эхлүүлнэ. PostgreSQL нь архивлагдсан WAL-аас сэргээх процессыг эхлүүлэх бөгөөд зөвхөн дараа нь мэдээллийн сан нээгдэнэ.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Тодорхой хугацаанд нөхөн сэргээх.

Хэрэв бид мэдээллийн баазыг тодорхой минут хүртэл сэргээхийг хүсвэл recovery.conf руу Recovery_target_time параметрийг нэмнэ - бид мэдээллийн санг хэдэн цагт сэргээхийг зааж өгнө.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'
recovery_target_time = '2020-01-29 09:46:25'

Сэргээгдсэний дараа индексжүүлэх_хүснэгтийг харна уу

 2020-01-29 09:41:25.226198+00
 2020-01-29 09:42:25.336989+00
 2020-01-29 09:43:25.356069+00
 2020-01-29 09:44:25.37381+00
 2020-01-29 09:45:25.392944+00

Бид PostgreSQL-г эхлүүлнэ. PostgreSQL нь архивлагдсан WAL-аас сэргээх процессыг эхлүүлэх бөгөөд зөвхөн дараа нь мэдээллийн сан нээгдэнэ.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Тест хийх

Энд тайлбарласны дагуу 1 ГБ мэдээллийн сан үүсгэж байна https://gist.github.com/ololobus/5b25c432f208d7eb31051a5f238dffff

1 ГБ дата үүсгэсний дараа хувингийн хэмжээг хүсч байна.

postgres=# SELECT pg_size_pretty(pg_database_size('test1'));
pg_size_pretty
----------------
1003 MB

s4cmd бол Amazon S3 хадгалах санд байгаа өгөгдөлтэй ажиллах үнэгүй командын мөрийн хэрэгсэл юм. Уг хэрэгсэл нь python програмчлалын хэл дээр бичигдсэн бөгөөд үүний ачаар үүнийг Windows болон Linux үйлдлийн системд ашиглах боломжтой.

s4cmd суулгаж байна

pip install s4cmd

LZ4

s4cmd --endpoint-url=http://ip-адрес-сервера-minio:9000 --access-key=xxxx --secret-key=yyyy du -r s3://pg-backups
840540822       s3://pg-backups/wal_005/
840 МБ в формате lz4 только WAL логов

Полный бекап с lz4 - 1GB данных
time backup_push.sh
real 0m18.582s

Размер S3 бакета после полного бекапа

581480085       s3://pg-backups/basebackups_005/
842374424   s3://pg-backups/wal_005
581 МБ занимает полный бекап

LZMA

После генерации 1ГБ данных
338413694       s3://pg-backups/wal_005/
338 мб логов в формате lzma

Время генерации полного бекапа
time backup_push.sh
real    5m25.054s

Размер бакета в S3
270310495       s3://pg-backups/basebackups_005/
433485092   s3://pg-backups/wal_005/

270 мб занимает полный бекап в формате lzma

Brotli

После генерации 1ГБ данных
459229886       s3://pg-backups/wal_005/
459 мб логов в формате brotli

Время генерации полного бекапа
real    0m23.408s

Размер бакета в S3
312960942       s3://pg-backups/basebackups_005/
459309262   s3://pg-backups/wal_005/

312 мб занимает полный бекап в формате brotli

График дээрх үр дүнгийн харьцуулалт.

wal-g PostgreSQL нөөцлөх системийн танилцуулга

Таны харж байгаагаар Brotli хэмжээ LZMA-тай харьцуулж болох боловч нөөцлөлтийг LZ4 хугацаанд гүйцэтгэдэг.

Орос хэлээр ярьдаг PostgreSQL нийгэмлэгийн чат: https://t.me/pgsql

Хэрэв та ашигладаг бол Github-д од өгөөрэй вал-г

Эх сурвалж: www.habr.com

сэтгэгдэл нэмэх