Cyflwyniad i system wrth gefn wal-g PostgreSQL

WAL-G yn arf syml ac effeithiol ar gyfer gwneud copi wrth gefn PostgreSQL i'r cymylau. O ran ei brif swyddogaeth, mae'n etifedd yr offeryn poblogaidd WAL-E, ond wedi'i ailysgrifennu yn Go. Ond mae un nodwedd newydd bwysig yn WAL-G - copïau delta. copïau delta WAL-G storio tudalennau o ffeiliau sydd wedi newid ers y fersiwn wrth gefn blaenorol. Mae WAL-G yn gweithredu cryn dipyn o dechnolegau ar gyfer cyfochri copïau wrth gefn. Mae WAL-G yn llawer cyflymach na WAL-E.

Ceir manylion am sut mae wal-g yn gweithio yn yr erthygl: Rydym yn gor-glocio'r copi wrth gefn. Darlith Yandex

Mae protocol storio S3 wedi dod yn boblogaidd ar gyfer storio data. Un o fanteision S3 yw'r gallu i gael mynediad trwy API, sy'n eich galluogi i drefnu rhyngweithio hyblyg â'r storfa, gan gynnwys mynediad darllen cyhoeddus, tra bod diweddaru gwybodaeth yn y storfa yn digwydd gan bersonau awdurdodedig yn unig.

Mae yna nifer o weithrediadau storio cyhoeddus a phreifat sy'n defnyddio'r protocol S3. Heddiw, byddwn yn edrych ar ateb poblogaidd ar gyfer trefnu storfa fach - Mini.

Mae un gweinydd PostgreSQL yn iawn ar gyfer profi wal-g, a defnyddir Minio yn lle S3.

Gweinydd mini

Gosodiad mini

yum -y install yum-plugin-copr
yum copr enable -y lkiesow/minio
yum install -y minio

Golygu AccessKey a SecretKey yn /etc/minio/minio.conf

vi /etc/minio/minio.conf

Os na fyddwch yn defnyddio nginx cyn Minio, yna mae angen i chi newid

--address 127.0.0.1:9000

--address 0.0.0.0:9000

Lansio Mini

systemctl start minio

Ewch i ryngwyneb gwe Mini http://ip-адрес-сервера-minio:9000 a chreu bwced (er enghraifft, pg-ups).

gweinydd DB

Mae WAL-G yn rpm yn cael ei ymgynnull gennyf i (Anton Patsev). Github, Fedora COPR.

Pwy sydd heb system sy'n seiliedig ar RPM, defnyddiwch y swyddog cyfarwyddyd trwy osod.

Ynghyd â'r deuaidd wal-g, mae rpm yn cynnwys sgriptiau sy'n mewnforio newidynnau o'r ffeil /etc/wal-gd/server-s3.conf.

backup-fetch.sh
backup-list.sh
backup-push.sh
wal-fetch.sh
wal-g-run.sh
wal-push.sh

Gosod walg.

yum -y install yum-plugin-copr
yum copr enable -y antonpatsev/wal-g
yum install -y wal-g

Gwirio fersiwn wal-g.

wal-g --version
wal-g version v0.2.14

Golygu /etc/wal-gd/server-s3.conf i'ch anghenion.

Yn draddodiadol, mae'r ffeiliau ffurfweddu a'r ffeiliau data a ddefnyddir gan glwstwr cronfa ddata yn cael eu storio gyda'i gilydd yn y cyfeiriadur data clwstwr, y cyfeirir ato'n gyffredin fel PGDATA

#!/bin/bash

export PG_VER="9.6"

export WALE_S3_PREFIX="s3://pg-backups" # бакет, который мы создали в S3
export AWS_ACCESS_KEY_ID="xxxx" # AccessKey из /etc/minio/minio.conf 
export AWS_ENDPOINT="http://ip-адрес-сервера-minio:9000"
export AWS_S3_FORCE_PATH_STYLE="true"
export AWS_SECRET_ACCESS_KEY="yyyy" # SecretKey из /etc/minio/minio.conf

export PGDATA=/var/lib/pgsql/$PG_VER/data/
export PGHOST=/var/run/postgresql/.s.PGSQL.5432 # Сокет для подключения к PostgreSQL

export WALG_UPLOAD_CONCURRENCY=2 # Кол-во потоков для закачки 
export WALG_DOWNLOAD_CONCURRENCY=2 # Кол-во потоков для скачивания
export WALG_UPLOAD_DISK_CONCURRENCY=2 # Кол-во потоков на диске для закачки
export WALG_DELTA_MAX_STEPS=7
export WALG_COMPRESSION_METHOD=brotli # Какой метод сжатия использовать.

Wrth ffurfweddu WAL-G, rydych yn nodi WALG_DELTA_MAX_STEPS - nifer y camau y mae'r copi wrth gefn delta ar eu huchaf o'r copi wrth gefn sylfaenol, ac yn nodi'r polisi copi delta. Naill ai rydych chi'n gwneud copi o'r delta olaf sy'n bodoli, neu rydych chi'n gwneud delta o'r copi wrth gefn llawn gwreiddiol. Mae hyn yn angenrheidiol rhag ofn pan fo'r un gydran o'r gronfa ddata bob amser yn newid yn eich cronfa ddata, mae'r un data yn newid yn gyson.

Gosod y gronfa ddata.

yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.
noarch.rpm
yum install -y postgresql96 postgresql96-server mc

Rydym yn cychwyn y gronfa ddata.

/usr/pgsql-9.6/bin/postgresql96-setup initdb
Initializing database ... OK

Os ydych chi'n profi ar 1 gweinydd, yna mae angen i chi ad-drefnu'r paramedr wal_level i archifo ar gyfer PostgreSQL llai na fersiwn 10, ac atgynhyrchiad ar gyfer fersiwn PostgreSQL 10 a hŷn.

wal_level = archive

Gadewch i ni wneud copi wrth gefn o archifau WAL bob 60 eiliad gan ddefnyddio PostgreSQL ei hun. Ar gynnyrch, bydd gennych werth archif_amser terfyn gwahanol.

archive_mode = on
archive_command = '/usr/local/bin/wal-push.sh %p'
archive_timeout = 60 # Каждые 60 секунд будет выполнятся команда archive_command.

Dechrau PostgreSQL

systemctl start postgresql-9.6

Mewn consol ar wahân, edrychwn ar y logiau PostgreSQL am wallau: (newid postgresql-Wed.log i'r un cyfredol).

tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Gadewch i ni fynd i psql.

su - postgres
psql

Creu cronfa ddata yn psql

Creu tabl yn y prawf cronfa ddata1.

create database test1;

Newidiwch i'r prawf cronfa ddata.

postgres=# c test1;

Rydyn ni'n creu'r tabl indexing_table.

test1=# CREATE TABLE indexing_table(created_at TIMESTAMP WITH TIME ZONE DEFAULT NOW());

Ychwanegu data.

Rydym yn dechrau mewnosod data. Rydym yn aros am 10-20 munud.

#!/bin/bash
# postgres
while true; do
psql -U postgres -d test1 -c "INSERT INTO indexing_table(created_at) VALUES (CURRENT_TIMESTAMP);"
sleep 60;
done

Byddwch yn siwr i wneud copi wrth gefn llawn.

su - postgres
/usr/local/bin/backup-push.sh

Edrychwn ar y cofnodion yn y tabl yn y prawf cronfa ddata1

select * from indexing_table;
2020-01-29 09:41:25.226198+
2020-01-29 09:42:25.336989+
2020-01-29 09:43:25.356069+
2020-01-29 09:44:25.37381+
2020-01-29 09:45:25.392944+
2020-01-29 09:46:25.412327+
2020-01-29 09:47:25.432564+
2020-01-29 09:48:25.451985+
2020-01-29 09:49:25.472653+
2020-01-29 09:50:25.491974+
2020-01-29 09:51:25.510178+

Y llinyn yw'r amser presennol.

Gweler y rhestr o gopïau wrth gefn llawn

/usr/local/bin/backup-list.sh

Profi adferiad

Adferiad llawn gyda treigl holl WAL sydd ar gael.

Stopiwch Postgresql.

Dileu popeth o'r ffolder /var/lib/pgsql/9.6/data.

Rhedeg y sgript /usr/local/bin/backup-fetch.sh fel defnyddiwr postgres.

su - postgres
/usr/local/bin/backup-fetch.sh

Echdynnu copi wrth gefn wedi'i gwblhau.

Ychwanegu recovery.conf i'r ffolder /var/lib/pgsql/9.6/data gyda'r cynnwys canlynol.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'

Rydyn ni'n dechrau PostgreSQL. Bydd PostgreSQL yn cychwyn y broses adfer o'r WALs archif, a dim ond wedyn y bydd y gronfa ddata yn agor.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Adferiad am amser penodol.

Os ydym am adfer y gronfa ddata hyd at funud penodol, yna rydym yn ychwanegu'r paramedr recovery_target_time i recovery.conf - rydym yn nodi pryd i adfer y gronfa ddata.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'
recovery_target_time = '2020-01-29 09:46:25'

Ar ôl adferiad, edrychwch ar y tabl indexing_table

 2020-01-29 09:41:25.226198+00
 2020-01-29 09:42:25.336989+00
 2020-01-29 09:43:25.356069+00
 2020-01-29 09:44:25.37381+00
 2020-01-29 09:45:25.392944+00

Rydyn ni'n dechrau PostgreSQL. Bydd PostgreSQL yn cychwyn y broses adfer o'r WALs archif, a dim ond wedyn y bydd y gronfa ddata yn agor.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Profi

Cynhyrchu cronfa ddata 1GB fel y disgrifir yma https://gist.github.com/ololobus/5b25c432f208d7eb31051a5f238dffff

Gofyn am faint y bwced ar ôl cynhyrchu 1GB o ddata.

postgres=# SELECT pg_size_pretty(pg_database_size('test1'));
pg_size_pretty
----------------
1003 MB

s4cmd — бесплатный инструмент командной строки для работы с данными, расположенными в хранилище Amazon S3. Утилита написана на языке программирования python, и благодаря этому может использоваться в операционных системах и WindowsAc Linux.

Gosod s4cmd

pip install s4cmd

LZ4

s4cmd --endpoint-url=http://ip-адрес-сервера-minio:9000 --access-key=xxxx --secret-key=yyyy du -r s3://pg-backups
840540822       s3://pg-backups/wal_005/
840 МБ в формате lz4 только WAL логов

Полный бекап с lz4 - 1GB данных
time backup_push.sh
real 0m18.582s

Размер S3 бакета после полного бекапа

581480085       s3://pg-backups/basebackups_005/
842374424   s3://pg-backups/wal_005
581 МБ занимает полный бекап

LZMA

После генерации 1ГБ данных
338413694       s3://pg-backups/wal_005/
338 мб логов в формате lzma

Время генерации полного бекапа
time backup_push.sh
real    5m25.054s

Размер бакета в S3
270310495       s3://pg-backups/basebackups_005/
433485092   s3://pg-backups/wal_005/

270 мб занимает полный бекап в формате lzma

Brotli

После генерации 1ГБ данных
459229886       s3://pg-backups/wal_005/
459 мб логов в формате brotli

Время генерации полного бекапа
real    0m23.408s

Размер бакета в S3
312960942       s3://pg-backups/basebackups_005/
459309262   s3://pg-backups/wal_005/

312 мб занимает полный бекап в формате brotli

Cymharu'r canlyniadau ar y siart.

Cyflwyniad i system wrth gefn wal-g PostgreSQL

Fel y gwelwch, mae Brotli yn debyg o ran maint i LZMA, ond mae'r copi wrth gefn yn cael ei berfformio mewn amser LZ4.

Sgwrs o'r gymuned PostgreSQL sy'n siarad Rwsieg: https://t.me/pgsql

Rhowch seren i Github os ydych chi'n defnyddio wal-g

Ffynhonnell: hab.com

Prynu gwesteio dibynadwy ar gyfer gwefannau sydd â diogelwch DDoS, gweinyddwyr VPS VDS 🔥 Prynu cynnal gwefannau dibynadwy gyda diogelwch DDoS, gweinyddion VPS VDS | ProHoster