Εισαγωγή στο σύστημα δημιουργίας αντιγράφων ασφαλείας wal-g PostgreSQL

WAL-G είναι ένα απλό και αποτελεσματικό εργαλείο για τη δημιουργία αντιγράφων ασφαλείας της PostgreSQL στα σύννεφα. Όσον αφορά την κύρια λειτουργικότητά του, είναι ο κληρονόμος του δημοφιλούς εργαλείου ΞΥΛΙΑ, αλλά ξαναγράφεται στο Go. Αλλά υπάρχει ένα σημαντικό νέο χαρακτηριστικό στο WAL-G - τα αντίγραφα delta. αντίγραφα δέλτα WAL-G αποθηκεύστε σελίδες αρχείων που έχουν αλλάξει από την προηγούμενη έκδοση αντιγράφων ασφαλείας. Το WAL-G εφαρμόζει πολλές τεχνολογίες για την παραλληλοποίηση των αντιγράφων ασφαλείας. Το WAL-G είναι πολύ πιο γρήγορο από το WAL-E.

Λεπτομέρειες για το πώς λειτουργεί το wal-g μπορείτε να βρείτε στο άρθρο: Κάνουμε overclock το αντίγραφο ασφαλείας. Διάλεξη Yandex

Το πρωτόκολλο αποθήκευσης S3 έχει γίνει δημοφιλές για την αποθήκευση δεδομένων. Ένα από τα πλεονεκτήματα του S3 είναι η δυνατότητα πρόσβασης μέσω API, το οποίο σας επιτρέπει να οργανώσετε ευέλικτη αλληλεπίδραση με τον αποθηκευτικό χώρο, συμπεριλαμβανομένης της δημόσιας πρόσβασης ανάγνωσης, ενώ η ενημέρωση των πληροφοριών στο χώρο αποθήκευσης γίνεται μόνο από εξουσιοδοτημένα άτομα.

Υπάρχουν πολλές υλοποιήσεις δημόσιας και ιδιωτικής αποθήκευσης που χρησιμοποιούν το πρωτόκολλο S3. Σήμερα θα εξετάσουμε μια δημοφιλή λύση για την οργάνωση μικρού αποθηκευτικού χώρου - Minio.

Ένας μόνο διακομιστής PostgreSQL είναι καλός για τη δοκιμή του wal-g και το Minio χρησιμοποιείται ως αντικατάσταση του S3.

Διακομιστής Minio

Εγκατάσταση Minio

yum -y install yum-plugin-copr
yum copr enable -y lkiesow/minio
yum install -y minio

Επεξεργαστείτε το AccessKey και το SecretKey στο /etc/minio/minio.conf

vi /etc/minio/minio.conf

Εάν δεν θα χρησιμοποιήσετε το nginx πριν από το Minio, τότε πρέπει να το αλλάξετε

--address 127.0.0.1:9000

--address 0.0.0.0:9000

Εκκίνηση του Minio

systemctl start minio

Μεταβείτε στη διεπαφή ιστού Minio http://ip-адрес-сервера-minio:9000 και δημιουργήστε έναν κάδο (για παράδειγμα, αντίγραφα ασφαλείας pg).

Διακομιστής DB

Το WAL-G στις στροφές συναρμολογείται από εμένα (Anton Patsev). Github, Fedora COPR.

Όποιος δεν διαθέτει σύστημα που βασίζεται σε RPM, χρησιμοποιήστε το επίσημο οδηγίες με εγκατάσταση.

Μαζί με το δυαδικό wal-g, το rpm περιέχει σενάρια που εισάγουν μεταβλητές από το αρχείο /etc/wal-gd/server-s3.conf.

backup-fetch.sh
backup-list.sh
backup-push.sh
wal-fetch.sh
wal-g-run.sh
wal-push.sh

Εγκαταστήστε το walg.

yum -y install yum-plugin-copr
yum copr enable -y antonpatsev/wal-g
yum install -y wal-g

Έλεγχος έκδοσης wal-g.

wal-g --version
wal-g version v0.2.14

Επεξεργαστείτε το /etc/wal-gd/server-s3.conf σύμφωνα με τις ανάγκες σας.

Τα αρχεία διαμόρφωσης και τα αρχεία δεδομένων που χρησιμοποιούνται από ένα σύμπλεγμα βάσης δεδομένων αποθηκεύονται παραδοσιακά μαζί στον κατάλογο δεδομένων συμπλέγματος, που συνήθως αναφέρεται ως PGDATA

#!/bin/bash

export PG_VER="9.6"

export WALE_S3_PREFIX="s3://pg-backups" # бакет, который мы создали в S3
export AWS_ACCESS_KEY_ID="xxxx" # AccessKey из /etc/minio/minio.conf 
export AWS_ENDPOINT="http://ip-адрес-сервера-minio:9000"
export AWS_S3_FORCE_PATH_STYLE="true"
export AWS_SECRET_ACCESS_KEY="yyyy" # SecretKey из /etc/minio/minio.conf

export PGDATA=/var/lib/pgsql/$PG_VER/data/
export PGHOST=/var/run/postgresql/.s.PGSQL.5432 # Сокет для подключения к PostgreSQL

export WALG_UPLOAD_CONCURRENCY=2 # Кол-во потоков для закачки 
export WALG_DOWNLOAD_CONCURRENCY=2 # Кол-во потоков для скачивания
export WALG_UPLOAD_DISK_CONCURRENCY=2 # Кол-во потоков на диске для закачки
export WALG_DELTA_MAX_STEPS=7
export WALG_COMPRESSION_METHOD=brotli # Какой метод сжатия использовать.

Κατά τη διαμόρφωση του WAL-G, καθορίζετε WALG_DELTA_MAX_STEPS - τον αριθμό βημάτων που το αντίγραφο ασφαλείας delta είναι μέγιστο από το βασικό αντίγραφο ασφαλείας και καθορίζετε την πολιτική αντιγραφής δέλτα. Είτε δημιουργείτε ένα αντίγραφο από το τελευταίο υπάρχον δέλτα είτε δημιουργείτε ένα δέλτα από το αρχικό πλήρες αντίγραφο ασφαλείας. Αυτό είναι απαραίτητο σε περίπτωση που το ίδιο στοιχείο της βάσης δεδομένων αλλάζει συνεχώς στη βάση δεδομένων σας, τα ίδια δεδομένα αλλάζουν συνεχώς.

Εγκατάσταση της βάσης δεδομένων.

yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.
noarch.rpm
yum install -y postgresql96 postgresql96-server mc

Αρχικοποιούμε τη βάση δεδομένων.

/usr/pgsql-9.6/bin/postgresql96-setup initdb
Initializing database ... OK

Εάν δοκιμάζετε σε 1 διακομιστή, τότε πρέπει να ρυθμίσετε εκ νέου την παράμετρο wal_level για αρχειοθέτηση για PostgreSQL μικρότερη από την έκδοση 10 και αντίγραφο για PostgreSQL έκδοση 10 και παλαιότερη.

wal_level = archive

Ας δημιουργήσουμε αντίγραφα ασφαλείας των αρχείων WAL κάθε 60 δευτερόλεπτα χρησιμοποιώντας την ίδια την PostgreSQL. Στην παραγωγή, θα έχετε διαφορετική τιμή archive_timeout.

archive_mode = on
archive_command = '/usr/local/bin/wal-push.sh %p'
archive_timeout = 60 # Каждые 60 секунд будет выполнятся команда archive_command.

Εκκίνηση PostgreSQL

systemctl start postgresql-9.6

Σε μια ξεχωριστή κονσόλα, εξετάζουμε τα αρχεία καταγραφής PostgreSQL για σφάλματα: (αλλάξτε το postgresql-Wed.log στο τρέχον).

tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Πάμε στο psql.

su - postgres
psql

Δημιουργία βάσης δεδομένων σε psql

Δημιουργήστε έναν πίνακα στο test1 της βάσης δεδομένων.

create database test1;

Μετάβαση στη δοκιμή βάσης δεδομένων.

postgres=# c test1;

Δημιουργούμε τον πίνακα indexing_table.

test1=# CREATE TABLE indexing_table(created_at TIMESTAMP WITH TIME ZONE DEFAULT NOW());

Προσθήκη δεδομένων.

Αρχίζουμε να εισάγουμε δεδομένα. Περιμένουμε 10-20 λεπτά.

#!/bin/bash
# postgres
while true; do
psql -U postgres -d test1 -c "INSERT INTO indexing_table(created_at) VALUES (CURRENT_TIMESTAMP);"
sleep 60;
done

Φροντίστε να δημιουργήσετε ένα πλήρες αντίγραφο ασφαλείας.

su - postgres
/usr/local/bin/backup-push.sh

Εξετάζουμε τις εγγραφές στον πίνακα στη δοκιμή βάσης δεδομένων1

select * from indexing_table;
2020-01-29 09:41:25.226198+
2020-01-29 09:42:25.336989+
2020-01-29 09:43:25.356069+
2020-01-29 09:44:25.37381+
2020-01-29 09:45:25.392944+
2020-01-29 09:46:25.412327+
2020-01-29 09:47:25.432564+
2020-01-29 09:48:25.451985+
2020-01-29 09:49:25.472653+
2020-01-29 09:50:25.491974+
2020-01-29 09:51:25.510178+

Η συμβολοσειρά είναι η τρέχουσα ώρα.

Δείτε τη λίστα με τα πλήρη αντίγραφα ασφαλείας

/usr/local/bin/backup-list.sh

Δοκιμή ανάκτησης

Πλήρης ανάκτηση με κύλιση όλων των διαθέσιμων WAL.

Σταματήστε το Postgresql.

Διαγράψτε τα πάντα από το φάκελο /var/lib/pgsql/9.6/data.

Εκτελέστε το σενάριο /usr/local/bin/backup-fetch.sh ως χρήστης του postgres.

su - postgres
/usr/local/bin/backup-fetch.sh

Η εξαγωγή αντιγράφων ασφαλείας ολοκληρώθηκε.

Προσθέστε το recovery.conf στο φάκελο /var/lib/pgsql/9.6/data με το ακόλουθο περιεχόμενο.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'

Ξεκινάμε την PostgreSQL. Η PostgreSQL θα ξεκινήσει τη διαδικασία ανάκτησης από τα αρχειοθετημένα WAL και μόνο τότε θα ανοίξει η βάση δεδομένων.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Ανάρρωση για ορισμένο χρόνο.

Εάν θέλουμε να επαναφέρουμε τη βάση δεδομένων μέχρι ένα συγκεκριμένο λεπτό, τότε προσθέτουμε την παράμετρο recovery_target_time στο recovery.conf - υποδεικνύουμε πότε θα γίνει επαναφορά της βάσης δεδομένων.

restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'
recovery_target_time = '2020-01-29 09:46:25'

Μετά την ανάκτηση, δείτε τον πίνακα indexing_table

 2020-01-29 09:41:25.226198+00
 2020-01-29 09:42:25.336989+00
 2020-01-29 09:43:25.356069+00
 2020-01-29 09:44:25.37381+00
 2020-01-29 09:45:25.392944+00

Ξεκινάμε την PostgreSQL. Η PostgreSQL θα ξεκινήσει τη διαδικασία ανάκτησης από τα αρχειοθετημένα WAL και μόνο τότε θα ανοίξει η βάση δεδομένων.

systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log

Δοκιμές

Δημιουργία βάσης δεδομένων 1 GB όπως περιγράφεται εδώ https://gist.github.com/ololobus/5b25c432f208d7eb31051a5f238dffff

Ζητείται το μέγεθος του κάδου μετά τη δημιουργία 1 GB δεδομένων.

postgres=# SELECT pg_size_pretty(pg_database_size('test1'));
pg_size_pretty
----------------
1003 MB

Το s4cmd είναι ένα δωρεάν εργαλείο γραμμής εντολών για εργασία με δεδομένα που βρίσκονται στο χώρο αποθήκευσης Amazon S3. Το βοηθητικό πρόγραμμα είναι γραμμένο στη γλώσσα προγραμματισμού python και λόγω αυτού μπορεί να χρησιμοποιηθεί τόσο σε λειτουργικά συστήματα Windows όσο και σε Linux.

Εγκατάσταση s4cmd

pip install s4cmd

LZ4

s4cmd --endpoint-url=http://ip-адрес-сервера-minio:9000 --access-key=xxxx --secret-key=yyyy du -r s3://pg-backups
840540822       s3://pg-backups/wal_005/
840 МБ в формате lz4 только WAL логов

Полный бекап с lz4 - 1GB данных
time backup_push.sh
real 0m18.582s

Размер S3 бакета после полного бекапа

581480085       s3://pg-backups/basebackups_005/
842374424   s3://pg-backups/wal_005
581 МБ занимает полный бекап

LZMA

После генерации 1ГБ данных
338413694       s3://pg-backups/wal_005/
338 мб логов в формате lzma

Время генерации полного бекапа
time backup_push.sh
real    5m25.054s

Размер бакета в S3
270310495       s3://pg-backups/basebackups_005/
433485092   s3://pg-backups/wal_005/

270 мб занимает полный бекап в формате lzma

Brotli

После генерации 1ГБ данных
459229886       s3://pg-backups/wal_005/
459 мб логов в формате brotli

Время генерации полного бекапа
real    0m23.408s

Размер бакета в S3
312960942       s3://pg-backups/basebackups_005/
459309262   s3://pg-backups/wal_005/

312 мб занимает полный бекап в формате brotli

Σύγκριση αποτελεσμάτων στο διάγραμμα.

Εισαγωγή στο σύστημα δημιουργίας αντιγράφων ασφαλείας wal-g PostgreSQL

Όπως μπορείτε να δείτε, το Brotli είναι συγκρίσιμο σε μέγεθος με το LZMA, αλλά το αντίγραφο ασφαλείας εκτελείται σε χρόνο LZ4.

Συνομιλία της ρωσόφωνης κοινότητας PostgreSQL: https://t.me/pgsql

Εάν χρησιμοποιείτε, δώστε ένα αστέρι στο Github wal-g

Πηγή: www.habr.com

Προσθέστε ένα σχόλιο