የwal-g PostgreSQL የመጠባበቂያ ስርዓት መግቢያ

ዋል-ጂ PostgreSQLን ወደ ደመናዎች ለመደገፍ ቀላል እና ውጤታማ መሳሪያ ነው። ከዋና ተግባራቱ አንጻር የታዋቂው መሣሪያ ወራሽ ነው ዋል-ኢ፣ ግን በ Go ውስጥ እንደገና ተፃፈ። ግን በWAL-G ውስጥ አንድ አስፈላጊ አዲስ ባህሪ አለ - ዴልታ ቅጂዎች። ዴልታ ቅጂዎች ዋል-ጂ ከቀዳሚው የመጠባበቂያ ቅጂ ስሪት ጀምሮ የተቀየሩ የፋይሎች ገጾችን ያከማቹ። WAL-G ምትኬዎችን ለማስታረቅ በጣም ብዙ ቴክኖሎጂዎችን ይጠቀማል። ዋል-ጂ ከWAL-E በጣም ፈጣን ነው።

የ wal-g እንዴት እንደሚሰራ ዝርዝሮች በጽሁፉ ውስጥ ይገኛሉ፡- ምትኬን ከልክ በላይ እንጨምራለን. የ Yandex ንግግር

የS3 ማከማቻ ፕሮቶኮል መረጃን ለማከማቸት ታዋቂ ሆኗል። ከ S3 ጥቅሞች ውስጥ አንዱ በኤፒአይ የመግባት ችሎታ ነው፣ ​​ይህም ከማከማቻው ጋር ተለዋዋጭ መስተጋብርን ለማደራጀት ያስችላል፣ የህዝብ ንባብ መዳረሻን ጨምሮ፣ በማከማቻው ውስጥ ያለው መረጃ ማዘመን በተፈቀደላቸው ሰዎች ብቻ ነው።

የS3 ፕሮቶኮሉን የሚጠቀሙ በርካታ የህዝብ እና የግል ማከማቻ አተገባበርዎች አሉ። ዛሬ ትናንሽ ማከማቻዎችን ለማደራጀት ታዋቂ መፍትሄን እንመለከታለን - ሚኒዮ.

ነጠላ የ PostgreSQL አገልጋይ ዋል-ጂን ለመሞከር ጥሩ ነው፣ እና ሚኒዮ ለS3 ምትክ ሆኖ ያገለግላል።

ሚኒዮ አገልጋይ

ሚኒ መጫን

yum -y install yum-plugin-copr
yum copr enable -y lkiesow/minio
yum install -y minio

በ /etc/minio/minio.conf ውስጥ AccessKey እና SecretKeyን ያርትዑ

vi /etc/minio/minio.conf

ከ Minio በፊት nginx ን የማይጠቀሙ ከሆነ መለወጥ ያስፈልግዎታል

--address 127.0.0.1:9000

--address 0.0.0.0:9000

ሚኒዮንን በማስጀመር ላይ

systemctl start minio

ወደ ሚኒዮ ድር በይነገጽ ይሂዱ http://ip-адрес-сервера-minio:9000 እና ባልዲ (ለምሳሌ, pg-backups) ይፍጠሩ.

ዲቢ አገልጋይ

ዋል-ጂ በደቂቅ ፍጥነት በእኔ (አንቶን ፓትሴቭ) ተሰብስቧል። የፊልሙ, Fedora COPR.

በ RPM ላይ የተመሰረተ ስርዓት የሌለው ማን ነው, ኦፊሴላዊውን ይጠቀሙ መመሪያ በመጫን.

ከዋል-ግ ሁለትዮሽ ጋር፣ rpm ተለዋዋጮችን ከ/etc/wal-gd/server-s3.conf ፋይል የሚያስመጡ ስክሪፕቶችን ይዟል።

backup-fetch.sh
backup-list.sh
backup-push.sh
wal-fetch.sh
wal-g-run.sh
wal-push.sh

ዋልግ ጫን።

yum -y install yum-plugin-copr
yum copr enable -y antonpatsev/wal-g
yum install -y wal-g

የwal-g ስሪትን በመፈተሽ ላይ።

wal-g --version
wal-g version v0.2.14

/etc/wal-gd/server-s3.conf ወደ ፍላጎቶችዎ ያርትዑ።

በዳታቤዝ ክላስተር የሚጠቀሙባቸው የማዋቀሪያ ፋይሎች እና የውሂብ ፋይሎች በባህላዊ መንገድ በክላስተር ዳታ መዝገብ ውስጥ ይቀመጣሉ፣ በተለምዶ በሚባለው PGDATA

#!/bin/bash

export PG_VER="9.6"

export WALE_S3_PREFIX="s3://pg-backups" # бакет, который мы создали в S3
export AWS_ACCESS_KEY_ID="xxxx" # AccessKey из /etc/minio/minio.conf 
export AWS_ENDPOINT="http://ip-адрес-сервера-minio:9000"
export AWS_S3_FORCE_PATH_STYLE="true"
export AWS_SECRET_ACCESS_KEY="yyyy" # SecretKey из /etc/minio/minio.conf

export PGDATA=/var/lib/pgsql/$PG_VER/data/
export PGHOST=/var/run/postgresql/.s.PGSQL.5432 # Сокет для подключения к PostgreSQL

export WALG_UPLOAD_CONCURRENCY=2 # Кол-во потоков для закачки 
export WALG_DOWNLOAD_CONCURRENCY=2 # Кол-во потоков для скачивания
export WALG_UPLOAD_DISK_CONCURRENCY=2 # Кол-во потоков на диске для закачки
export WALG_DELTA_MAX_STEPS=7
export WALG_COMPRESSION_METHOD=brotli # Какой метод сжатия использовать.

WAL-G ን ሲያዋቅሩ WALG_DELTA_MAX_STEPS ይገልፃሉ - የዴልታ ምትኬ ከፍተኛው ከመሠረታዊ ምትኬ የሚወስደው የእርምጃዎች ብዛት እና የዴልታ ቅጂ ፖሊሲን ይግለጹ። ከመጨረሻው ነባር ዴልታ ቅጂ ሠርተሃል፣ ወይም ከመጀመሪያው ሙሉ መጠባበቂያ ዴልታ ትሠራለህ። በመረጃ ቋቱ ውስጥ አንድ አይነት የውሂብ ጎታ ሁል ጊዜ በሚለዋወጥበት ጊዜ ተመሳሳይ ውሂብ በየጊዜው እየተቀየረ ከሆነ ይህ አስፈላጊ ነው።

የውሂብ ጎታውን በመጫን ላይ.

yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.
noarch.rpm
yum install -y postgresql96 postgresql96-server mc

የውሂብ ጎታውን እናስጀምራለን.

/usr/pgsql-9.6/bin/postgresql96-setup initdb
Initializing database ... OK

በ1 አገልጋይ ላይ እየሞከርክ ከሆነ የwal_level መለኪያውን ከስሪት 10 በታች ለ PostgreSQL እና ለPostgreSQL እትም 10 እና ከዚያ በላይ ቅጂ ለማድረግ እንደገና ማዋቀር አለብህ።

wal_level = archive

PostgreSQLን በመጠቀም በየ60 ሰከንድ የWAL ማህደሮችን ምትኬ እናስቀምጥ። በምርት ላይ፣ የተለየ የማህደር_ጊዜ ማብቂያ ዋጋ ይኖርዎታል።

archive_mode = on
archive_command = '/usr/local/bin/wal-push.sh %p'
archive_timeout = 60 # Каждые 60 секунд будет выполнятся команда archive_command.

PostgreSQL በመጀመር ላይ

systemctl start postgresql-9.6

በተለየ ኮንሶል ውስጥ፣ ለስህተቶች የ PostgreSQL ምዝግብ ማስታወሻዎችን እንመለከታለን፡ (postgresql-Wed.log ወደ የአሁኑ ይቀይሩ)።

tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

ወደ psql እንሂድ.

su - postgres
psql

በpsql ውስጥ የውሂብ ጎታ ይፍጠሩ

በመረጃ ቋት ፈተና ውስጥ ሠንጠረዥ ይፍጠሩ።

create database test1;

ወደ የውሂብ ጎታ ሙከራ ቀይር።

postgres=# c test1;

የሰንጠረዡን ማውጫ_ጠረጴዛ እንፈጥራለን።

test1=# CREATE TABLE indexing_table(created_at TIMESTAMP WITH TIME ZONE DEFAULT NOW());

ውሂብ በማከል ላይ.

ውሂብ ማስገባት እንጀምራለን. ለ 10-20 ደቂቃዎች እየጠበቅን ነው.

#!/bin/bash
# postgres
while true; do
psql -U postgres -d test1 -c "INSERT INTO indexing_table(created_at) VALUES (CURRENT_TIMESTAMP);"
sleep 60;
done

ሙሉ ምትኬ መስራትዎን እርግጠኛ ይሁኑ።

su - postgres
/usr/local/bin/backup-push.sh

በመረጃ ቋት ፈተና1 ውስጥ በሰንጠረዡ ውስጥ ያሉትን መዝገቦች እንመለከታለን

select * from indexing_table;
2020-01-29 09:41:25.226198+
2020-01-29 09:42:25.336989+
2020-01-29 09:43:25.356069+
2020-01-29 09:44:25.37381+
2020-01-29 09:45:25.392944+
2020-01-29 09:46:25.412327+
2020-01-29 09:47:25.432564+
2020-01-29 09:48:25.451985+
2020-01-29 09:49:25.472653+
2020-01-29 09:50:25.491974+
2020-01-29 09:51:25.510178+

ሕብረቁምፊው የአሁኑ ጊዜ ነው።

የሙሉ ምትኬዎችን ዝርዝር ይመልከቱ

/usr/local/bin/backup-list.sh

የመልሶ ማግኛ ሙከራ

ሁሉንም የሚገኙትን WAL በማንከባለል ሙሉ ማገገም።

Postgresql አቁም

ሁሉንም ነገር ከ/var/lib/pgsql/9.6/የውሂብ አቃፊ ሰርዝ።

የ/usr/local/bin/backup-fetch.sh ስክሪፕት እንደ ፖስትግሬስ ተጠቃሚ ያሂዱ።

su - postgres
/usr/local/bin/backup-fetch.sh

ምትኬ ማውጣት ተጠናቅቋል።

Recovery.conf ወደ /var/lib/pgsql/9.6/ዳታ ማህደር ከሚከተለው ይዘት ጋር አክል።

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'

PostgreSQL እንጀምራለን. PostgreSQL በማህደር ከተቀመጡት WALs የመልሶ ማግኛ ሂደቱን ይጀምራል እና ከዚያ በኋላ ብቻ የውሂብ ጎታ ይከፈታል።

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

ለተወሰነ ጊዜ ማገገም.

የውሂብ ጎታውን እስከ አንድ ደቂቃ ድረስ ወደነበረበት መመለስ ከፈለግን የ Recovery_target_time መለኪያን ወደ recovery.conf እንጨምራለን - የውሂብ ጎታውን በምን ሰዓት እንደሚመልስ እንጠቁማለን።

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'
recovery_target_time = '2020-01-29 09:46:25'

ካገገሙ በኋላ የሰንጠረዡን ማውጫ_ጠረጴዛ ይመልከቱ

 2020-01-29 09:41:25.226198+00
 2020-01-29 09:42:25.336989+00
 2020-01-29 09:43:25.356069+00
 2020-01-29 09:44:25.37381+00
 2020-01-29 09:45:25.392944+00

PostgreSQL እንጀምራለን. PostgreSQL በማህደር ከተቀመጡት WALs የመልሶ ማግኛ ሂደቱን ይጀምራል እና ከዚያ በኋላ ብቻ የውሂብ ጎታ ይከፈታል።

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

ሙከራ

እዚህ እንደተገለጸው 1GB ዳታቤዝ በማመንጨት ላይ https://gist.github.com/ololobus/5b25c432f208d7eb31051a5f238dffff

1 ጂቢ ውሂብ ካመነጨ በኋላ የባልዲውን መጠን በመጠየቅ ላይ።

postgres=# SELECT pg_size_pretty(pg_database_size('test1'));
pg_size_pretty
----------------
1003 MB

s4cmd በአማዞን S3 ማከማቻ ውስጥ ከሚኖሩ መረጃዎች ጋር ለመስራት ነፃ የትእዛዝ መስመር መሳሪያ ነው። መገልገያው የተፃፈው በ python ፕሮግራሚንግ ቋንቋ ነው ፣ እና በዚህ ምክንያት በሁለቱም በዊንዶውስ እና ሊኑክስ ኦፕሬቲንግ ሲስተሞች ውስጥ ጥቅም ላይ ሊውል ይችላል።

s4cmd በመጫን ላይ

pip install s4cmd

LZ4

s4cmd --endpoint-url=http://ip-адрес-сервера-minio:9000 --access-key=xxxx --secret-key=yyyy du -r s3://pg-backups
840540822       s3://pg-backups/wal_005/
840 МБ в формате lz4 только WAL логов

Полный бекап с lz4 - 1GB данных
time backup_push.sh
real 0m18.582s

Размер S3 бакета после полного бекапа

581480085       s3://pg-backups/basebackups_005/
842374424   s3://pg-backups/wal_005
581 МБ занимает полный бекап

LZMA

После генерации 1ГБ данных
338413694       s3://pg-backups/wal_005/
338 мб логов в формате lzma

Время генерации полного бекапа
time backup_push.sh
real    5m25.054s

Размер бакета в S3
270310495       s3://pg-backups/basebackups_005/
433485092   s3://pg-backups/wal_005/

270 мб занимает полный бекап в формате lzma

ብሊሊ

После генерации 1ГБ данных
459229886       s3://pg-backups/wal_005/
459 мб логов в формате brotli

Время генерации полного бекапа
real    0m23.408s

Размер бакета в S3
312960942       s3://pg-backups/basebackups_005/
459309262   s3://pg-backups/wal_005/

312 мб занимает полный бекап в формате brotli

በገበታው ላይ የውጤቶች ንጽጽር.

የwal-g PostgreSQL የመጠባበቂያ ስርዓት መግቢያ

እንደሚመለከቱት, Brotli በመጠን ከ LZMA ጋር ይነጻጸራል, ነገር ግን መጠባበቂያው በ LZ4 ጊዜ ውስጥ ይከናወናል.

የሩሲያኛ ተናጋሪ PostgreSQL ማህበረሰብ ውይይት፡- https://t.me/pgsql

ከተጠቀሙ እባክዎን ለ Github ኮከብ ይስጡት። ዋል-ግ

ምንጭ: hab.com

አስተያየት ያክሉ