Λεπτομέρειες για το πώς λειτουργεί το wal-g μπορείτε να βρείτε στο άρθρο:
Το πρωτόκολλο αποθήκευσης S3 έχει γίνει δημοφιλές για την αποθήκευση δεδομένων. Ένα από τα πλεονεκτήματα του S3 είναι η δυνατότητα πρόσβασης μέσω API, το οποίο σας επιτρέπει να οργανώσετε ευέλικτη αλληλεπίδραση με τον αποθηκευτικό χώρο, συμπεριλαμβανομένης της δημόσιας πρόσβασης ανάγνωσης, ενώ η ενημέρωση των πληροφοριών στο χώρο αποθήκευσης γίνεται μόνο από εξουσιοδοτημένα άτομα.
Υπάρχουν πολλές υλοποιήσεις δημόσιας και ιδιωτικής αποθήκευσης που χρησιμοποιούν το πρωτόκολλο S3. Σήμερα θα εξετάσουμε μια δημοφιλή λύση για την οργάνωση μικρού αποθηκευτικού χώρου - Minio.
Ένας μόνο διακομιστής PostgreSQL είναι καλός για τη δοκιμή του wal-g και το Minio χρησιμοποιείται ως αντικατάσταση του S3.
Διακομιστής Minio
Εγκατάσταση Minio
yum -y install yum-plugin-copr
yum copr enable -y lkiesow/minio
yum install -y minio
Επεξεργαστείτε το AccessKey και το SecretKey στο /etc/minio/minio.conf
vi /etc/minio/minio.conf
Εάν δεν θα χρησιμοποιήσετε το nginx πριν από το Minio, τότε πρέπει να το αλλάξετε
--address 127.0.0.1:9000
--address 0.0.0.0:9000
Εκκίνηση του Minio
systemctl start minio
Μεταβείτε στη διεπαφή ιστού Minio
Διακομιστής DB
Το WAL-G στις στροφές συναρμολογείται από εμένα (Anton Patsev).
Όποιος δεν διαθέτει σύστημα που βασίζεται σε RPM, χρησιμοποιήστε το επίσημο
Μαζί με το δυαδικό wal-g, το rpm περιέχει σενάρια που εισάγουν μεταβλητές από το αρχείο /etc/wal-gd/server-s3.conf.
backup-fetch.sh
backup-list.sh
backup-push.sh
wal-fetch.sh
wal-g-run.sh
wal-push.sh
Εγκαταστήστε το walg.
yum -y install yum-plugin-copr
yum copr enable -y antonpatsev/wal-g
yum install -y wal-g
Έλεγχος έκδοσης wal-g.
wal-g --version
wal-g version v0.2.14
Επεξεργαστείτε το /etc/wal-gd/server-s3.conf σύμφωνα με τις ανάγκες σας.
Τα αρχεία διαμόρφωσης και τα αρχεία δεδομένων που χρησιμοποιούνται από ένα σύμπλεγμα βάσης δεδομένων αποθηκεύονται παραδοσιακά μαζί στον κατάλογο δεδομένων συμπλέγματος, που συνήθως αναφέρεται ως PGDATA
#!/bin/bash
export PG_VER="9.6"
export WALE_S3_PREFIX="s3://pg-backups" # бакет, который мы создали в S3
export AWS_ACCESS_KEY_ID="xxxx" # AccessKey из /etc/minio/minio.conf
export AWS_ENDPOINT="http://ip-адрес-сервера-minio:9000"
export AWS_S3_FORCE_PATH_STYLE="true"
export AWS_SECRET_ACCESS_KEY="yyyy" # SecretKey из /etc/minio/minio.conf
export PGDATA=/var/lib/pgsql/$PG_VER/data/
export PGHOST=/var/run/postgresql/.s.PGSQL.5432 # Сокет для подключения к PostgreSQL
export WALG_UPLOAD_CONCURRENCY=2 # Кол-во потоков для закачки
export WALG_DOWNLOAD_CONCURRENCY=2 # Кол-во потоков для скачивания
export WALG_UPLOAD_DISK_CONCURRENCY=2 # Кол-во потоков на диске для закачки
export WALG_DELTA_MAX_STEPS=7
export WALG_COMPRESSION_METHOD=brotli # Какой метод сжатия использовать.
Κατά τη διαμόρφωση του WAL-G, καθορίζετε WALG_DELTA_MAX_STEPS - τον αριθμό βημάτων που το αντίγραφο ασφαλείας delta είναι μέγιστο από το βασικό αντίγραφο ασφαλείας και καθορίζετε την πολιτική αντιγραφής δέλτα. Είτε δημιουργείτε ένα αντίγραφο από το τελευταίο υπάρχον δέλτα είτε δημιουργείτε ένα δέλτα από το αρχικό πλήρες αντίγραφο ασφαλείας. Αυτό είναι απαραίτητο σε περίπτωση που το ίδιο στοιχείο της βάσης δεδομένων αλλάζει συνεχώς στη βάση δεδομένων σας, τα ίδια δεδομένα αλλάζουν συνεχώς.
Εγκατάσταση της βάσης δεδομένων.
yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.
noarch.rpm
yum install -y postgresql96 postgresql96-server mc
Αρχικοποιούμε τη βάση δεδομένων.
/usr/pgsql-9.6/bin/postgresql96-setup initdb
Initializing database ... OK
Εάν δοκιμάζετε σε 1 διακομιστή, τότε πρέπει να ρυθμίσετε εκ νέου την παράμετρο wal_level για αρχειοθέτηση για PostgreSQL μικρότερη από την έκδοση 10 και αντίγραφο για PostgreSQL έκδοση 10 και παλαιότερη.
wal_level = archive
Ας δημιουργήσουμε αντίγραφα ασφαλείας των αρχείων WAL κάθε 60 δευτερόλεπτα χρησιμοποιώντας την ίδια την PostgreSQL. Στην παραγωγή, θα έχετε διαφορετική τιμή archive_timeout.
archive_mode = on
archive_command = '/usr/local/bin/wal-push.sh %p'
archive_timeout = 60 # Каждые 60 секунд будет выполнятся команда archive_command.
Εκκίνηση PostgreSQL
systemctl start postgresql-9.6
Σε μια ξεχωριστή κονσόλα, εξετάζουμε τα αρχεία καταγραφής PostgreSQL για σφάλματα: (αλλάξτε το postgresql-Wed.log στο τρέχον).
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log
Πάμε στο psql.
su - postgres
psql
Δημιουργία βάσης δεδομένων σε psql
Δημιουργήστε έναν πίνακα στο test1 της βάσης δεδομένων.
create database test1;
Μετάβαση στη δοκιμή βάσης δεδομένων.
postgres=# c test1;
Δημιουργούμε τον πίνακα indexing_table.
test1=# CREATE TABLE indexing_table(created_at TIMESTAMP WITH TIME ZONE DEFAULT NOW());
Προσθήκη δεδομένων.
Αρχίζουμε να εισάγουμε δεδομένα. Περιμένουμε 10-20 λεπτά.
#!/bin/bash
# postgres
while true; do
psql -U postgres -d test1 -c "INSERT INTO indexing_table(created_at) VALUES (CURRENT_TIMESTAMP);"
sleep 60;
done
Φροντίστε να δημιουργήσετε ένα πλήρες αντίγραφο ασφαλείας.
su - postgres
/usr/local/bin/backup-push.sh
Εξετάζουμε τις εγγραφές στον πίνακα στη δοκιμή βάσης δεδομένων1
select * from indexing_table;
2020-01-29 09:41:25.226198+
2020-01-29 09:42:25.336989+
2020-01-29 09:43:25.356069+
2020-01-29 09:44:25.37381+
2020-01-29 09:45:25.392944+
2020-01-29 09:46:25.412327+
2020-01-29 09:47:25.432564+
2020-01-29 09:48:25.451985+
2020-01-29 09:49:25.472653+
2020-01-29 09:50:25.491974+
2020-01-29 09:51:25.510178+
Η συμβολοσειρά είναι η τρέχουσα ώρα.
Δείτε τη λίστα με τα πλήρη αντίγραφα ασφαλείας
/usr/local/bin/backup-list.sh
Δοκιμή ανάκτησης
Πλήρης ανάκτηση με κύλιση όλων των διαθέσιμων WAL.
Σταματήστε το Postgresql.
Διαγράψτε τα πάντα από το φάκελο /var/lib/pgsql/9.6/data.
Εκτελέστε το σενάριο /usr/local/bin/backup-fetch.sh ως χρήστης του postgres.
su - postgres
/usr/local/bin/backup-fetch.sh
Η εξαγωγή αντιγράφων ασφαλείας ολοκληρώθηκε.
Προσθέστε το recovery.conf στο φάκελο /var/lib/pgsql/9.6/data με το ακόλουθο περιεχόμενο.
restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'
Ξεκινάμε την PostgreSQL. Η PostgreSQL θα ξεκινήσει τη διαδικασία ανάκτησης από τα αρχειοθετημένα WAL και μόνο τότε θα ανοίξει η βάση δεδομένων.
systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log
Ανάρρωση για ορισμένο χρόνο.
Εάν θέλουμε να επαναφέρουμε τη βάση δεδομένων μέχρι ένα συγκεκριμένο λεπτό, τότε προσθέτουμε την παράμετρο recovery_target_time στο recovery.conf - υποδεικνύουμε πότε θα γίνει επαναφορά της βάσης δεδομένων.
restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'
recovery_target_time = '2020-01-29 09:46:25'
Μετά την ανάκτηση, δείτε τον πίνακα indexing_table
2020-01-29 09:41:25.226198+00
2020-01-29 09:42:25.336989+00
2020-01-29 09:43:25.356069+00
2020-01-29 09:44:25.37381+00
2020-01-29 09:45:25.392944+00
Ξεκινάμε την PostgreSQL. Η PostgreSQL θα ξεκινήσει τη διαδικασία ανάκτησης από τα αρχειοθετημένα WAL και μόνο τότε θα ανοίξει η βάση δεδομένων.
systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log
Δοκιμές
Δημιουργία βάσης δεδομένων 1 GB όπως περιγράφεται εδώ
Ζητείται το μέγεθος του κάδου μετά τη δημιουργία 1 GB δεδομένων.
postgres=# SELECT pg_size_pretty(pg_database_size('test1'));
pg_size_pretty
----------------
1003 MB
Το s4cmd είναι ένα δωρεάν εργαλείο γραμμής εντολών για εργασία με δεδομένα που βρίσκονται στο χώρο αποθήκευσης Amazon S3. Το βοηθητικό πρόγραμμα είναι γραμμένο στη γλώσσα προγραμματισμού python και λόγω αυτού μπορεί να χρησιμοποιηθεί τόσο σε λειτουργικά συστήματα Windows όσο και σε Linux.
Εγκατάσταση s4cmd
pip install s4cmd
LZ4
s4cmd --endpoint-url=http://ip-адрес-сервера-minio:9000 --access-key=xxxx --secret-key=yyyy du -r s3://pg-backups
840540822 s3://pg-backups/wal_005/
840 МБ в формате lz4 только WAL логов
Полный бекап с lz4 - 1GB данных
time backup_push.sh
real 0m18.582s
Размер S3 бакета после полного бекапа
581480085 s3://pg-backups/basebackups_005/
842374424 s3://pg-backups/wal_005
581 МБ занимает полный бекап
LZMA
После генерации 1ГБ данных
338413694 s3://pg-backups/wal_005/
338 мб логов в формате lzma
Время генерации полного бекапа
time backup_push.sh
real 5m25.054s
Размер бакета в S3
270310495 s3://pg-backups/basebackups_005/
433485092 s3://pg-backups/wal_005/
270 мб занимает полный бекап в формате lzma
Brotli
После генерации 1ГБ данных
459229886 s3://pg-backups/wal_005/
459 мб логов в формате brotli
Время генерации полного бекапа
real 0m23.408s
Размер бакета в S3
312960942 s3://pg-backups/basebackups_005/
459309262 s3://pg-backups/wal_005/
312 мб занимает полный бекап в формате brotli
Σύγκριση αποτελεσμάτων στο διάγραμμα.
Όπως μπορείτε να δείτε, το Brotli είναι συγκρίσιμο σε μέγεθος με το LZMA, αλλά το αντίγραφο ασφαλείας εκτελείται σε χρόνο LZ4.
Συνομιλία της ρωσόφωνης κοινότητας PostgreSQL:
Εάν χρησιμοποιείτε, δώστε ένα αστέρι στο Github
Πηγή: www.habr.com