wal-g PostgreSQL காப்புப் பிரதி அமைப்புக்கான அறிமுகம்

வால்-ஜி PostgreSQL ஐ மேகங்களுக்கு காப்புப் பிரதி எடுப்பதற்கான எளிய மற்றும் பயனுள்ள கருவியாகும். அதன் முக்கிய செயல்பாட்டின் அடிப்படையில், இது பிரபலமான கருவியின் வாரிசு வால்-ஈ, ஆனால் கோவில் மீண்டும் எழுதப்பட்டது. ஆனால் WAL-G - டெல்டா பிரதிகளில் ஒரு முக்கியமான புதிய அம்சம் உள்ளது. டெல்டா பிரதிகள் வால்-ஜி முந்தைய காப்புப் பதிப்பிலிருந்து மாற்றப்பட்ட கோப்புகளின் பக்கங்களைச் சேமிக்கவும். WAL-G ஆனது காப்புப்பிரதிகளை இணைப்பதற்கு நிறைய தொழில்நுட்பங்களை செயல்படுத்துகிறது. WAL-G என்பது WAL-E ஐ விட வேகமானது.

வால்-ஜி எவ்வாறு செயல்படுகிறது என்பதற்கான விவரங்களை கட்டுரையில் காணலாம்: காப்புப்பிரதியை ஓவர்லாக் செய்கிறோம். யாண்டெக்ஸ் விரிவுரை

S3 சேமிப்பக நெறிமுறையானது தரவைச் சேமிப்பதில் பிரபலமானது. S3 இன் நன்மைகளில் ஒன்று API வழியாக அணுகும் திறன் ஆகும், இது பொது வாசிப்பு அணுகல் உட்பட சேமிப்பகத்துடன் நெகிழ்வான தொடர்புகளை ஒழுங்கமைக்க உங்களை அனுமதிக்கிறது, அதே நேரத்தில் சேமிப்பகத்தில் தகவல்களைப் புதுப்பிப்பது அங்கீகரிக்கப்பட்ட நபர்களால் மட்டுமே நிகழ்கிறது.

S3 நெறிமுறையில் செயல்படும் சேமிப்பகங்களின் பொது மற்றும் தனியார் செயலாக்கங்கள் பல உள்ளன. சிறிய சேமிப்பகத்தை ஒழுங்கமைப்பதற்கான பிரபலமான தீர்வை இன்று பார்ப்போம் - மினியோ.

ஒற்றை PostgreSQL சேவையகம் wal-g ஐச் சோதிப்பதற்கு நன்றாக இருக்கிறது, மேலும் S3க்கு மாற்றாக Minio பயன்படுத்தப்படுகிறது.

மினியோ சர்வர்

மினியோ நிறுவல்

yum -y install yum-plugin-copr
yum copr enable -y lkiesow/minio
yum install -y minio

AccessKey மற்றும் SecretKeyஐ /etc/minio/minio.conf இல் திருத்தவும்

vi /etc/minio/minio.conf

Minio க்கு முன் நீங்கள் nginx ஐப் பயன்படுத்தவில்லை என்றால், நீங்கள் மாற்ற வேண்டும்

--address 127.0.0.1:9000

--address 0.0.0.0:9000

மினியோவை அறிமுகப்படுத்துகிறது

systemctl start minio

மினியோ வலை இடைமுகத்திற்குச் செல்லவும் http://ip-адрес-сервера-minio:9000 மற்றும் ஒரு வாளியை உருவாக்கவும் (உதாரணமாக, pg-backups).

டிபி சர்வர்

rpm இல் WAL-G ஆனது என்னால் (அன்டன் பாட்சேவ்) அசெம்பிள் செய்யப்பட்டது. கிட்ஹப், ஃபெடோரா சிஓபிஆர்.

RPM அடிப்படையிலான அமைப்பு இல்லாதவர்கள், அதிகாரப்பூர்வத்தைப் பயன்படுத்தவும் அறிவுறுத்தல்கள் நிறுவல் மூலம்.

wal-g பைனரியுடன், rpm ஆனது /etc/wal-gd/server-s3.conf கோப்பிலிருந்து மாறிகளை இறக்குமதி செய்யும் ஸ்கிரிப்ட்களைக் கொண்டுள்ளது.

backup-fetch.sh
backup-list.sh
backup-push.sh
wal-fetch.sh
wal-g-run.sh
wal-push.sh

வால்-ஜியை நிறுவவும்.

yum -y install yum-plugin-copr
yum copr enable -y antonpatsev/wal-g
yum install -y wal-g

வால்-ஜி பதிப்பைச் சரிபார்க்கிறது.

wal-g --version
wal-g version v0.2.14

உங்கள் தேவைகளுக்கு /etc/wal-gd/server-s3.conf ஐ திருத்தவும்.

தரவுத்தள கிளஸ்டரால் பயன்படுத்தப்படும் கட்டமைப்பு கோப்புகள் மற்றும் தரவு கோப்புகள் பாரம்பரியமாக கிளஸ்டர் தரவு கோப்பகத்தில் ஒன்றாக சேமிக்கப்படும், பொதுவாக குறிப்பிடப்படுகிறது PGDATA

#!/bin/bash

export PG_VER="9.6"

export WALE_S3_PREFIX="s3://pg-backups" # бакет, который мы создали в S3
export AWS_ACCESS_KEY_ID="xxxx" # AccessKey из /etc/minio/minio.conf 
export AWS_ENDPOINT="http://ip-адрес-сервера-minio:9000"
export AWS_S3_FORCE_PATH_STYLE="true"
export AWS_SECRET_ACCESS_KEY="yyyy" # SecretKey из /etc/minio/minio.conf

export PGDATA=/var/lib/pgsql/$PG_VER/data/
export PGHOST=/var/run/postgresql/.s.PGSQL.5432 # Сокет для подключения к PostgreSQL

export WALG_UPLOAD_CONCURRENCY=2 # Кол-во потоков для закачки 
export WALG_DOWNLOAD_CONCURRENCY=2 # Кол-во потоков для скачивания
export WALG_UPLOAD_DISK_CONCURRENCY=2 # Кол-во потоков на диске для закачки
export WALG_DELTA_MAX_STEPS=7
export WALG_COMPRESSION_METHOD=brotli # Какой метод сжатия использовать.

WAL-G ஐ உள்ளமைக்கும் போது, ​​நீங்கள் WALG_DELTA_MAX_STEPS ஐக் குறிப்பிடுகிறீர்கள் - அடிப்படை காப்புப்பிரதியிலிருந்து டெல்டா காப்புப் பிரதி அதிகபட்சமாக இருக்கும் படிகளின் எண்ணிக்கை மற்றும் டெல்டா நகல் கொள்கையைக் குறிப்பிடவும். கடைசியாக இருக்கும் டெல்டாவிலிருந்து நகலை உருவாக்கலாம் அல்லது அசல் முழு காப்புப்பிரதியிலிருந்து டெல்டாவை உருவாக்கலாம். உங்கள் தரவுத்தளத்தில் தரவுத்தளத்தின் ஒரே கூறு எப்போதும் மாறும்போது, ​​அதே தரவு தொடர்ந்து மாறும்போது இது அவசியம்.

தரவுத்தளத்தை நிறுவுதல்.

yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.
noarch.rpm
yum install -y postgresql96 postgresql96-server mc

நாங்கள் தரவுத்தளத்தை துவக்குகிறோம்.

/usr/pgsql-9.6/bin/postgresql96-setup initdb
Initializing database ... OK

நீங்கள் 1 சேவையகத்தில் சோதனை செய்கிறீர்கள் என்றால், PostgreSQL க்கு பதிப்பு 10 ஐ விடக் குறைவாகவும், PostgreSQL பதிப்பு 10 மற்றும் அதற்குப் பழையவற்றிற்கான பிரதியையும் காப்பகப்படுத்த wal_level அளவுருவை மறுகட்டமைக்க வேண்டும்.

wal_level = archive

PostgreSQL ஐப் பயன்படுத்தி ஒவ்வொரு 60 வினாடிகளுக்கும் WAL காப்பகங்களை காப்புப் பிரதி எடுப்போம். தயாரிப்பில், நீங்கள் வேறுபட்ட காப்பக_நேரமுடிவு மதிப்பைப் பெறுவீர்கள்.

archive_mode = on
archive_command = '/usr/local/bin/wal-push.sh %p'
archive_timeout = 60 # Каждые 60 секунд будет выполнятся команда archive_command.

PostgreSQL ஐத் தொடங்குகிறது

systemctl start postgresql-9.6

ஒரு தனி கன்சோலில், பிழைகளுக்கான PostgreSQL பதிவுகளைப் பார்க்கிறோம்: (postgresql-Wed.logஐ தற்போதையதாக மாற்றவும்).

tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

psql க்கு செல்வோம்.

su - postgres
psql

psql இல் ஒரு தரவுத்தளத்தை உருவாக்கவும்

தரவுத்தளத்தில் ஒரு அட்டவணையை உருவாக்கவும் test1.

create database test1;

தரவுத்தள சோதனைக்கு மாறவும்.

postgres=# c test1;

அட்டவணை indexing_table ஐ உருவாக்குகிறோம்.

test1=# CREATE TABLE indexing_table(created_at TIMESTAMP WITH TIME ZONE DEFAULT NOW());

தரவு சேர்த்தல்.

நாங்கள் தரவைச் செருகத் தொடங்குகிறோம். நாங்கள் 10-20 நிமிடங்கள் காத்திருக்கிறோம்.

#!/bin/bash
# postgres
while true; do
psql -U postgres -d test1 -c "INSERT INTO indexing_table(created_at) VALUES (CURRENT_TIMESTAMP);"
sleep 60;
done

முழு காப்புப்பிரதியை உருவாக்குவதை உறுதிப்படுத்திக் கொள்ளுங்கள்.

su - postgres
/usr/local/bin/backup-push.sh

டேட்டாபேஸ் test1ல் உள்ள அட்டவணையில் உள்ள பதிவுகளைப் பார்க்கிறோம்

select * from indexing_table;
2020-01-29 09:41:25.226198+
2020-01-29 09:42:25.336989+
2020-01-29 09:43:25.356069+
2020-01-29 09:44:25.37381+
2020-01-29 09:45:25.392944+
2020-01-29 09:46:25.412327+
2020-01-29 09:47:25.432564+
2020-01-29 09:48:25.451985+
2020-01-29 09:49:25.472653+
2020-01-29 09:50:25.491974+
2020-01-29 09:51:25.510178+

சரம் தற்போதைய நேரம்.

முழு காப்புப்பிரதிகளின் பட்டியலைப் பார்க்கவும்

/usr/local/bin/backup-list.sh

மீட்பு சோதனை

கிடைக்கக்கூடிய அனைத்து WALகளையும் உருட்டுவதன் மூலம் முழு மீட்பு.

Postgresql ஐ நிறுத்துங்கள்.

/var/lib/pgsql/9.6/data கோப்புறையிலிருந்து அனைத்தையும் நீக்கவும்.

/usr/local/bin/backup-fetch.sh ஸ்கிரிப்டை postgres பயனராக இயக்கவும்.

su - postgres
/usr/local/bin/backup-fetch.sh

காப்புப் பிரித்தெடுத்தல் முடிந்தது.

பின்வரும் உள்ளடக்கத்துடன் /var/lib/pgsql/9.6/data கோப்புறையில் recovery.conf ஐச் சேர்க்கவும்.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'

நாங்கள் PostgreSQL ஐத் தொடங்குகிறோம். PostgreSQL காப்பகப்படுத்தப்பட்ட WAL களில் இருந்து மீட்பு செயல்முறையைத் தொடங்கும், அதன் பிறகுதான் தரவுத்தளம் திறக்கும்.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

ஒரு குறிப்பிட்ட காலத்திற்கு மீட்பு.

ஒரு குறிப்பிட்ட நிமிடம் வரை தரவுத்தளத்தை மீட்டெடுக்க விரும்பினால், recovery_target_time அளவுருவை recovery.conf இல் சேர்க்கிறோம் - தரவுத்தளத்தை எந்த நேரத்தில் மீட்டெடுக்க வேண்டும் என்பதைக் குறிப்பிடுகிறோம்.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'
recovery_target_time = '2020-01-29 09:46:25'

மீட்டெடுத்த பிறகு, அட்டவணை indexing_table ஐப் பார்க்கவும்

 2020-01-29 09:41:25.226198+00
 2020-01-29 09:42:25.336989+00
 2020-01-29 09:43:25.356069+00
 2020-01-29 09:44:25.37381+00
 2020-01-29 09:45:25.392944+00

நாங்கள் PostgreSQL ஐத் தொடங்குகிறோம். PostgreSQL காப்பகப்படுத்தப்பட்ட WAL களில் இருந்து மீட்பு செயல்முறையைத் தொடங்கும், அதன் பிறகுதான் தரவுத்தளம் திறக்கும்.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

சோதனை

இங்கே விவரிக்கப்பட்டுள்ளபடி 1GB தரவுத்தளத்தை உருவாக்குகிறது https://gist.github.com/ololobus/5b25c432f208d7eb31051a5f238dffff

1ஜிபி டேட்டாவை உருவாக்கிய பிறகு பக்கெட் அளவைக் கோருகிறது.

postgres=# SELECT pg_size_pretty(pg_database_size('test1'));
pg_size_pretty
----------------
1003 MB

s4cmd என்பது Amazon S3 சேமிப்பகத்தில் உள்ள தரவுகளுடன் வேலை செய்வதற்கான இலவச கட்டளை வரி கருவியாகும். பயன்பாடு பைதான் நிரலாக்க மொழியில் எழுதப்பட்டுள்ளது, இதன் காரணமாக இது விண்டோஸ் மற்றும் லினக்ஸ் இயக்க முறைமைகளில் பயன்படுத்தப்படலாம்.

s4cmd ஐ நிறுவுகிறது

pip install s4cmd

LZ4

s4cmd --endpoint-url=http://ip-адрес-сервера-minio:9000 --access-key=xxxx --secret-key=yyyy du -r s3://pg-backups
840540822       s3://pg-backups/wal_005/
840 МБ в формате lz4 только WAL логов

Полный бекап с lz4 - 1GB данных
time backup_push.sh
real 0m18.582s

Размер S3 бакета после полного бекапа

581480085       s3://pg-backups/basebackups_005/
842374424   s3://pg-backups/wal_005
581 МБ занимает полный бекап

LZMA

После генерации 1ГБ данных
338413694       s3://pg-backups/wal_005/
338 мб логов в формате lzma

Время генерации полного бекапа
time backup_push.sh
real    5m25.054s

Размер бакета в S3
270310495       s3://pg-backups/basebackups_005/
433485092   s3://pg-backups/wal_005/

270 мб занимает полный бекап в формате lzma

Brotli

После генерации 1ГБ данных
459229886       s3://pg-backups/wal_005/
459 мб логов в формате brotli

Время генерации полного бекапа
real    0m23.408s

Размер бакета в S3
312960942       s3://pg-backups/basebackups_005/
459309262   s3://pg-backups/wal_005/

312 мб занимает полный бекап в формате brotli

விளக்கப்படத்தில் உள்ள முடிவுகளின் ஒப்பீடு.

wal-g PostgreSQL காப்புப் பிரதி அமைப்புக்கான அறிமுகம்

நீங்கள் பார்க்க முடியும் என, Brotli அளவு LZMA உடன் ஒப்பிடத்தக்கது, ஆனால் காப்புப்பிரதி LZ4 நேரத்தில் செய்யப்படுகிறது.

ரஷ்ய மொழி பேசும் PostgreSQL சமூகத்தின் அரட்டை: https://t.me/pgsql

நீங்கள் பயன்படுத்தினால், Github க்கு ஒரு நட்சத்திரத்தைக் கொடுங்கள் வால்-ஜி

ஆதாரம்: www.habr.com

கருத்தைச் சேர்