Réamhrá don chóras cúltaca wal-g PostgreSQL

WAL-G Is uirlis shimplí agus éifeachtach é chun tacaíocht a thabhairt do PostgreSQL do na scamaill. I dtéarmaí a phríomhfheidhmíochta, tá sé ina oidhre ​​ar an uirlis tóir WAL-E, ach athscríofa in Go. Ach tá gné nua thábhachtach amháin i WAL-G - cóipeanna deilt. cóipeanna deilt WAL-G stóráil leathanaigh de chomhaid a d'athraigh ón leagan cúltaca roimhe seo. Cuireann WAL-G go leor teicneolaíochtaí i bhfeidhm chun cúltacaí comhthreomhara a dhéanamh. Tá WAL-G i bhfad níos tapúla ná WAL-E.

Tá sonraí faoin gcaoi a n-oibríonn wal-g le fáil san alt: Táimid overclock an cúltaca. Yandex léacht

Tá an-tóir ar phrótacal stórála S3 chun sonraí a stóráil. Ceann de na buntáistí a bhaineann le S3 ná an cumas rochtain a fháil trí API, a ligeann duit idirghníomhú solúbtha a eagrú leis an stóráil, lena n-áirítear rochtain inléite poiblí, agus nach ndéanann daoine údaraithe ach faisnéis sa stóráil a nuashonrú.

Tá roinnt feidhmeanna stórála poiblí agus príobháideacha ann a úsáideann prótacal S3. Sa lá atá inniu beimid ag féachaint ar réiteach tóir maidir le stóráil bheag a eagrú - Minio.

Tá freastalaí amháin PostgreSQL ceart go leor chun wal-g a thástáil, agus úsáidtear Minio mar ionadach ar S3.

Freastalaí Mini

Suiteáil minio

yum -y install yum-plugin-copr
yum copr enable -y lkiesow/minio
yum install -y minio

Cuir AccessKey agus SecretKey in eagar in /etc/minio/minio.conf

vi /etc/minio/minio.conf

Mura n-úsáidfidh tú nginx roimh Minio, ansin is gá duit a athrú

--address 127.0.0.1:9000

--address 0.0.0.0:9000

Minio á sheoladh

systemctl start minio

Téigh go dtí an comhéadan gréasáin Mini http://ip-адрес-сервера-minio:9000 agus buicéad a chruthú (mar shampla, pg-backups).

Freastalaí DB

Tá WAL-G i rpm curtha le chéile agamsa (Anton Patsev). Github, Fedora COPR.

Cé nach bhfuil córas RPM-bhunaithe aige, bain úsáid as an oifigeach teagasc trí shuiteáil.

Mar aon leis an dénártha wal-g, tá scripteanna rpm a allmhairíonn athróga ón gcomhad /etc/wal-gd/server-s3.conf.

backup-fetch.sh
backup-list.sh
backup-push.sh
wal-fetch.sh
wal-g-run.sh
wal-push.sh

Suiteáil walg.

yum -y install yum-plugin-copr
yum copr enable -y antonpatsev/wal-g
yum install -y wal-g

Leagan wal-g a sheiceáil.

wal-g --version
wal-g version v0.2.14

Cuir /etc/wal-gd/server-s3.conf in eagar de réir do chuid riachtanas.

Go traidisiúnta déantar na comhaid chumraíochta agus na comhaid sonraí a úsáideann braisle bunachar sonraí a stóráil le chéile san eolaire sonraí braisle, ar a dtugtar de ghnáth PGDATA

#!/bin/bash

export PG_VER="9.6"

export WALE_S3_PREFIX="s3://pg-backups" # бакет, который мы создали в S3
export AWS_ACCESS_KEY_ID="xxxx" # AccessKey из /etc/minio/minio.conf 
export AWS_ENDPOINT="http://ip-адрес-сервера-minio:9000"
export AWS_S3_FORCE_PATH_STYLE="true"
export AWS_SECRET_ACCESS_KEY="yyyy" # SecretKey из /etc/minio/minio.conf

export PGDATA=/var/lib/pgsql/$PG_VER/data/
export PGHOST=/var/run/postgresql/.s.PGSQL.5432 # Сокет для подключения к PostgreSQL

export WALG_UPLOAD_CONCURRENCY=2 # Кол-во потоков для закачки 
export WALG_DOWNLOAD_CONCURRENCY=2 # Кол-во потоков для скачивания
export WALG_UPLOAD_DISK_CONCURRENCY=2 # Кол-во потоков на диске для закачки
export WALG_DELTA_MAX_STEPS=7
export WALG_COMPRESSION_METHOD=brotli # Какой метод сжатия использовать.

Agus WAL-G á chumrú agat, sonraíonn tú WALG_DELTA_MAX_STEPS - líon na gcéimeanna a bhfuil an cúltaca deilt uasta ón mbunchúltaca, agus sonróidh tú an polasaí cóip deilte. Déanann tú cóip den deilt deiridh atá ann cheana féin, nó déanann tú deilt ón cúltaca iomlán bunaidh. Tá sé seo riachtanach i gcás nuair a bhíonn an chomhpháirt chéanna den bhunachar sonraí ag athrú i gcónaí i do bhunachar sonraí, go bhfuil na sonraí céanna ag athrú i gcónaí.

Suiteáil an bunachar sonraí.

yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.
noarch.rpm
yum install -y postgresql96 postgresql96-server mc

Cuirimid tús leis an mbunachar sonraí.

/usr/pgsql-9.6/bin/postgresql96-setup initdb
Initializing database ... OK

Má tá tú ag tástáil ar fhreastalaí 1, ní mór duit an paraiméadar wal_level a athchumrú chun cartlann a dhéanamh do PostgreSQL níos lú ná leagan 10, agus macasamhail do PostgreSQL leagan 10 agus níos sine.

wal_level = archive

Déanaimis cúltaca de chartlanna WAL gach 60 soicind ag baint úsáide as PostgreSQL féin. Ar tháirgí, beidh luach eile archive_timeout agat.

archive_mode = on
archive_command = '/usr/local/bin/wal-push.sh %p'
archive_timeout = 60 # Каждые 60 секунд будет выполнятся команда archive_command.

Ag tosú PostgreSQL

systemctl start postgresql-9.6

I gconsól ar leith, féachaimid ar logaí PostgreSQL le haghaidh earráidí: (athraigh postgresql-Wed.log go dtí an ceann reatha).

tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

A ligean ar dul go dtí psql.

su - postgres
psql

Cruthaigh bunachar sonraí i psql

Cruthaigh tábla sa bhunachar sonraí tástála1.

create database test1;

Téigh go dtí an tástáil bunachar sonraí.

postgres=# c test1;

Cruthaímid an tábla indexing_table.

test1=# CREATE TABLE indexing_table(created_at TIMESTAMP WITH TIME ZONE DEFAULT NOW());

Sonraí á gcur leis.

Tosaímid ag cur sonraí isteach. Táimid ag fanacht 10-20 nóiméad.

#!/bin/bash
# postgres
while true; do
psql -U postgres -d test1 -c "INSERT INTO indexing_table(created_at) VALUES (CURRENT_TIMESTAMP);"
sleep 60;
done

Bí cinnte cúltaca iomlán a dhéanamh.

su - postgres
/usr/local/bin/backup-push.sh

Breathnaímid ar na taifid sa tábla sa triail bhunachar sonraí1

select * from indexing_table;
2020-01-29 09:41:25.226198+
2020-01-29 09:42:25.336989+
2020-01-29 09:43:25.356069+
2020-01-29 09:44:25.37381+
2020-01-29 09:45:25.392944+
2020-01-29 09:46:25.412327+
2020-01-29 09:47:25.432564+
2020-01-29 09:48:25.451985+
2020-01-29 09:49:25.472653+
2020-01-29 09:50:25.491974+
2020-01-29 09:51:25.510178+

Is é an téad an t-am reatha.

Féach ar an liosta de na cúltacaí iomlána

/usr/local/bin/backup-list.sh

Tástáil aisghabhála

Aisghabháil iomlán le rolladh gach WAL atá ar fáil.

Stop Postgresql.

Scrios gach rud ón bhfillteán /var/lib/pgsql/9.6/data.

Rith an script /usr/local/bin/backup-fetch.sh mar úsáideoir postgres.

su - postgres
/usr/local/bin/backup-fetch.sh

Eastóscadh cúltaca críochnaithe.

Cuir recovery.conf leis an bhfillteán /var/lib/pgsql/9.6/data leis an ábhar seo a leanas.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'

Cuirimid tús le PostgreSQL. Cuirfidh PostgreSQL tús leis an bpróiseas aisghabhála ó na WALanna cartlainne, agus is ansin a osclóidh an bunachar sonraí.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Aisghabháil ar feadh tréimhse áirithe.

Más mian linn an bunachar sonraí a chur ar ais suas go dtí nóiméad áirithe, ansin cuirimid an paraiméadar recovery_target_time chuig recovery.conf - cuirimid in iúl cén t-am chun an bunachar sonraí a chur ar ais.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'
recovery_target_time = '2020-01-29 09:46:25'

Tar éis aisghabháil, féach ar an tábla indexing_table

 2020-01-29 09:41:25.226198+00
 2020-01-29 09:42:25.336989+00
 2020-01-29 09:43:25.356069+00
 2020-01-29 09:44:25.37381+00
 2020-01-29 09:45:25.392944+00

Cuirimid tús le PostgreSQL. Cuirfidh PostgreSQL tús leis an bpróiseas aisghabhála ó na WALanna cartlainne, agus is ansin a osclóidh an bunachar sonraí.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Tástáil

Bunachar sonraí 1GB a ghiniúint mar a thuairiscítear anseo https://gist.github.com/ololobus/5b25c432f208d7eb31051a5f238dffff

Méid an bhuicéid a iarraidh tar éis 1GB sonraí a ghiniúint.

postgres=# SELECT pg_size_pretty(pg_database_size('test1'));
pg_size_pretty
----------------
1003 MB

Is uirlis líne ordaithe saor in aisce é s4cmd chun oibriú le sonraí a chónaíonn i stóráil Amazon S3. Tá an fóntais scríofa sa teanga ríomhchláraithe python, agus mar gheall air seo is féidir é a úsáid i gcórais oibriúcháin Windows agus Linux araon.

Suiteáil s4cmd

pip install s4cmd

LZ4

s4cmd --endpoint-url=http://ip-адрес-сервера-minio:9000 --access-key=xxxx --secret-key=yyyy du -r s3://pg-backups
840540822       s3://pg-backups/wal_005/
840 МБ в формате lz4 только WAL логов

Полный бекап с lz4 - 1GB данных
time backup_push.sh
real 0m18.582s

Размер S3 бакета после полного бекапа

581480085       s3://pg-backups/basebackups_005/
842374424   s3://pg-backups/wal_005
581 МБ занимает полный бекап

LZMA

После генерации 1ГБ данных
338413694       s3://pg-backups/wal_005/
338 мб логов в формате lzma

Время генерации полного бекапа
time backup_push.sh
real    5m25.054s

Размер бакета в S3
270310495       s3://pg-backups/basebackups_005/
433485092   s3://pg-backups/wal_005/

270 мб занимает полный бекап в формате lzma

Brotli

После генерации 1ГБ данных
459229886       s3://pg-backups/wal_005/
459 мб логов в формате brotli

Время генерации полного бекапа
real    0m23.408s

Размер бакета в S3
312960942       s3://pg-backups/basebackups_005/
459309262   s3://pg-backups/wal_005/

312 мб занимает полный бекап в формате brotli

Comparáid idir na torthaí ar an gcairt.

Réamhrá don chóras cúltaca wal-g PostgreSQL

Mar a fheiceann tú, tá Brotli inchomparáide i méid le LZMA, ach déantar an cúltaca in am LZ4.

Comhrá an phobail PostgreSQL ina labhraítear Rúisis: https://t.me/pgsql

Tabhair réalta do Github má úsáideann tú wal-g

Foinse: will.com

Add a comment