Δημιουργία ενός εξαιρετικά διαθέσιμου συμπλέγματος PostgreSQL χρησιμοποιώντας Patroni, etcd, HAProxy

Τυχαίνει, κατά τη στιγμή της εργασίας, να μην είχα αρκετή εμπειρία για να αναπτύξω και να λανσάρω αυτήν τη λύση μόνος μου. Και τότε άρχισα να ψάχνω στο Google.

Δεν ξέρω ποιο είναι το πρόβλημα, αλλά έχω διαπιστώσει ότι ακόμα κι αν κάνω τα πάντα βήμα προς βήμα όπως στο σεμινάριο, προετοιμάσω το ίδιο περιβάλλον με τον συγγραφέα, τίποτα δεν λειτουργεί ποτέ. Δεν έχω ιδέα ποιο είναι το πρόβλημα, αλλά όταν το αντιμετώπισα ξανά, αποφάσισα - θα γράψω το δικό μου σεμινάριο όταν όλα πάνε καλά. Ένα που σίγουρα θα λειτουργήσει.

Οδηγοί στο Διαδίκτυο

Τυχαίνει το Διαδίκτυο να μην υποφέρει από έλλειψη διαφόρων οδηγών, tutorials, βήμα προς βήμα και παρόμοιων πραγμάτων. Τυχαίνει να μου ανατέθηκε η ανάπτυξη μιας λύσης για την εύκολη οργάνωση και κατασκευή ενός συμπλέγματος PostgreSQL με αντοχή σε σφάλματα, οι κύριες απαιτήσεις του οποίου ήταν η ροή αναπαραγωγής από τον Κύριο διακομιστή σε όλα τα αντίγραφα και η αυτόματη εισαγωγή ενός αποθεματικού σε περίπτωση βλάβης του Κύριου διακομιστή.

Σε αυτό το στάδιο, προσδιορίστηκε η στοίβα των τεχνολογιών που χρησιμοποιήθηκαν:

  • Η PostgreSQL ως ΣΔΒΔ
  • Πατρώνη ως λύση για ομαδοποίηση
  • etcd ως κατανεμημένη αποθήκευση για το Patroni
  • HAproxy για την οργάνωση ενός ενιαίου σημείου εισόδου για εφαρμογές που χρησιμοποιούν τη βάση δεδομένων

Εγκατάσταση

Σας παρουσιάζουμε την κατασκευή ενός συμπλέγματος PostgreSQL υψηλής διαθεσιμότητας χρησιμοποιώντας Patroni, etcd, HAProxy.

Все операции выполнялись на виртуальных машинах с установленной ОС Debian 10.

κλπ

Δεν συνιστώ την εγκατάσταση του etcd στα ίδια μηχανήματα όπου θα βρίσκονται το patroni και το postgresql, καθώς η φόρτωση του δίσκου είναι πολύ σημαντική για το etcd. Αλλά για εκπαιδευτικούς σκοπούς, θα κάνουμε ακριβώς αυτό.
Ας εγκαταστήσουμε το etcd.

#!/bin/bash
apt-get update
apt-get install etcd

Προσθήκη περιεχομένου στο αρχείο /etc/default/etcd

[μέλος]

ETCD_NAME=datanode1 # όνομα κεντρικού υπολογιστή του μηχανήματός σας
ETCD_DATA_DIR=”/var/lib/etcd/default.etcd”

ΟΛΕΣ ΟΙ ΔΙΕΥΘΥΝΣΕΙΣ IP ΠΡΕΠΕΙ ΝΑ ΕΙΝΑΙ ΕΓΚΥΡΕΣ. ΟΙ ΔΙΕΥΘΥΝΣΕΙΣ LISTER PEER, CLIENT κ.λπ. ΠΡΕΠΕΙ ΝΑ ΟΡΙΣΤΗΚΑΝ ΣΤΗ ΔΙΕΥΘΥΝΣΗ IP ΤΟΥ ΥΠΟΔΟΧΟΥ ΥΠΟΔΟΧΗΣ

ETCD_LISTEN_PEER_URLS=»http://192.168.0.143:2380» # η διεύθυνση του αυτοκινήτου σας
ETCD_LISTEN_CLIENT_URLS=»http://192.168.0.143:2379,http://127.0.0.1:2379» # η διεύθυνση του αυτοκινήτου σας

[σύμπλεγμα]

ETCD_INITIAL_ADVERTISE_PEER_URLS="http://192.168.0.143:2380» # η διεύθυνση του αυτοκινήτου σας
ETCD_INITIAL_CLUSTER=»datanode1=http://192.168.0.143:2380,datanode2=http://192.168.0.144:2380,datanode3=http://192.168.0.145:2380» # διευθύνσεις όλων των μηχανών στο σύμπλεγμα etcd
ETCD_INITIAL_CLUSTER_STATE="νέο"
ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster-1"
ETCD_ADVERTISE_CLIENT_URLS=»http://192.168.0.143:2379» # η διεύθυνση του αυτοκινήτου σας

Εκτελέστε την εντολή

systemctl restart etcd

PostgreSQL 9.6 + μέλος

Το πρώτο πράγμα που πρέπει να κάνετε είναι να ρυθμίσετε τρεις εικονικές μηχανές για να εγκαταστήσετε το απαραίτητο λογισμικό σε αυτές. Μόλις ρυθμιστούν οι μηχανές, αν ακολουθήσετε το σεμινάριό μου, μπορείτε να εκτελέσετε αυτό το απλό σενάριο που θα κάνει (σχεδόν) τα πάντα για εσάς. Εκτελέστε το ως root.

Λάβετε υπόψη ότι το σενάριο χρησιμοποιεί την έκδοση 9.6 της PostgreSQL, κάτι που οφείλεται σε εσωτερικές απαιτήσεις της εταιρείας μας. Η λύση δεν έχει δοκιμαστεί σε άλλες εκδόσεις της PostgreSQL.

#!/bin/bash
apt-get install gnupg -y
echo "deb http://apt.postgresql.org/pub/repos/apt/ buster-pgdg main" >> /etc/apt/sources.list
wget --quiet -O - https://www.postgresql.org/media/keys/ACCC4CF8.asc | apt-key add -
apt-get update
apt-get install postgresql-9.6 python3-pip python3-dev libpq-dev -y
systemctl stop postgresql
pip3 install --upgrade pip
pip install psycopg2
pip install patroni[etcd]
echo "
[Unit]
Description=Runners to orchestrate a high-availability PostgreSQL
After=syslog.target network.target

[Service]
Type=simple

User=postgres
Group=postgres

ExecStart=/usr/local/bin/patroni /etc/patroni.yml

KillMode=process

TimeoutSec=30

Restart=no

[Install]
WantedBy=multi-user.targ
" > /etc/systemd/system/patroni.service
mkdir -p /data/patroni
chown postgres:postgres /data/patroni
chmod 700 /data/patroniпо
touch /etc/patroni.yml

Στη συνέχεια, στο αρχείο /etc/patroni.yml που μόλις δημιουργήσατε, πρέπει να τοποθετήσετε το ακόλουθο περιεχόμενο, αλλάζοντας φυσικά τις διευθύνσεις IP σε όλα τα σημεία στις διευθύνσεις που χρησιμοποιείτε.
Δώστε προσοχή στα σχόλια σε αυτό το yaml. Αλλάξτε τις διευθύνσεις με τις δικές σας, σε κάθε μηχάνημα στο σύμπλεγμα.

/etc/patroni.yml

scope: pgsql # должно быть одинаковым на всех нодах
namespace: /cluster/ # должно быть одинаковым на всех нодах
name: postgres1 # должно быть разным на всех нодах

restapi:
    listen: 192.168.0.143:8008 # адрес той ноды, в которой находится этот файл
    connect_address: 192.168.0.143:8008 # адрес той ноды, в которой находится этот файл

etcd:
    hosts: 192.168.0.143:2379,192.168.0.144:2379,192.168.0.145:2379 # перечислите здесь все ваши ноды, в случае если вы устанавливаете etcd на них же

# this section (bootstrap) will be written into Etcd:/<namespace>/<scope>/config after initializing new cluster
# and all other cluster members will use it as a `global configuration`
bootstrap:
    dcs:
        ttl: 100
        loop_wait: 10
        retry_timeout: 10
        maximum_lag_on_failover: 1048576
        postgresql:
            use_pg_rewind: true
            use_slots: true
            parameters:
                    wal_level: replica
                    hot_standby: "on"
                    wal_keep_segments: 5120
                    max_wal_senders: 5
                    max_replication_slots: 5
                    checkpoint_timeout: 30

    initdb:
    - encoding: UTF8
    - data-checksums
    - locale: en_US.UTF8
    # init pg_hba.conf должен содержать адреса ВСЕХ машин, используемых в кластере
    pg_hba:
    - host replication postgres ::1/128 md5
    - host replication postgres 127.0.0.1/8 md5
    - host replication postgres 192.168.0.143/24 md5
    - host replication postgres 192.168.0.144/24 md5
    - host replication postgres 192.168.0.145/24 md5
    - host all all 0.0.0.0/0 md5

    users:
        admin:
            password: admin
            options:
                - createrole
                - createdb

postgresql:
    listen: 192.168.0.143:5432 # адрес той ноды, в которой находится этот файл
    connect_address: 192.168.0.143:5432 # адрес той ноды, в которой находится этот файл
    data_dir: /data/patroni # эту директорию создаст скрипт, описанный выше и установит нужные права
    bin_dir:  /usr/lib/postgresql/9.6/bin # укажите путь до вашей директории с postgresql
    pgpass: /tmp/pgpass
    authentication:
        replication:
            username: postgres
            password: postgres
        superuser:
            username: postgres
            password: postgres
    create_replica_methods:
        basebackup:
            checkpoint: 'fast'
    parameters:
        unix_socket_directories: '.'

tags:
    nofailover: false
    noloadbalance: false
    clonefrom: false
    nosync: false

Το σενάριο πρέπει να εκτελεστεί και στα τρία μηχανήματα του συμπλέγματος και η δεδομένη διαμόρφωση πρέπει επίσης να τοποθετηθεί στο αρχείο /etc/patroni.yml σε όλα τα μηχανήματα.

Μόλις ολοκληρώσετε αυτές τις λειτουργίες σε όλα τα μηχανήματα του συμπλέγματος, εκτελέστε την ακόλουθη εντολή σε οποιοδήποτε από αυτά

systemctl start patroni
systemctl start postgresql

Περιμένετε περίπου 30 δευτερόλεπτα και, στη συνέχεια, εκτελέστε αυτήν την εντολή στους υπόλοιπους υπολογιστές του συμπλέγματος.

HAproxy

Χρησιμοποιούμε το υπέροχο HAproxy για να παρέχουμε ένα μοναδικό σημείο εισόδου. Ο κύριος διακομιστής θα είναι πάντα προσβάσιμος στη διεύθυνση του μηχανήματος όπου αναπτύσσεται το HAproxy.

Για να μην καταστήσουμε το μηχάνημα με το HAproxy ένα μοναδικό σημείο αποτυχίας, θα το εκτελέσουμε σε ένα κοντέινερ Docker, αργότερα μπορεί να εκκινηθεί σε ένα σύμπλεγμα K8 και να κάνουμε το σύμπλεγμα ανεκτικό σε σφάλματα ακόμα πιο αξιόπιστο.

Δημιουργήστε έναν κατάλογο όπου μπορείτε να αποθηκεύσετε δύο αρχεία - το Dockerfile και το haproxy.cfg. Μεταβείτε σε αυτόν.

Dockerfile

FROM ubuntu:latest

RUN apt-get update 
    && apt-get install -y haproxy rsyslog 
    && rm -rf /var/lib/apt/lists/*

RUN mkdir /run/haproxy

COPY haproxy.cfg /etc/haproxy/haproxy.cfg

CMD haproxy -f /etc/haproxy/haproxy.cfg && tail -F /var/log/haproxy.log

Προσέξτε, οι τρεις τελευταίες γραμμές του αρχείου haproxy.cfg θα πρέπει να αναφέρουν τις διευθύνσεις των μηχανημάτων σας. Το HAproxy θα επικοινωνήσει με την Patroni, στις κεφαλίδες HTTP ο κύριος διακομιστής θα επιστρέφει πάντα 200 και το αντίγραφο - 503.

haproxy.cfg

global
    maxconn 100

defaults
    log global
    mode tcp
    retries 2
    timeout client 30m
    timeout connect 4s
    timeout server 30m
    timeout check 5s

listen stats
    mode http
    bind *:7000
    stats enable
    stats uri /

listen postgres
    bind *:5000
    option httpchk
    http-check expect status 200
    default-server inter 3s fall 3 rise 2 on-marked-down shutdown-sessions
    server postgresql1 192.168.0.143:5432 maxconn 100 check port 8008
    server postgresql2 192.168.0.144:5432 maxconn 100 check port 8008
    server postgresql3 192.168.0.145:5432 maxconn 100 check port 8008

Ενώ βρισκόμαστε στον κατάλογο όπου βρίσκονται και τα δύο αρχεία μας, θα εκτελέσουμε διαδοχικά τις εντολές συσκευασίας κοντέινερ, καθώς και θα το εκκινήσουμε με την προώθηση των απαραίτητων θυρών:

docker build -t my-haproxy .
docker run -d -p5000:5000 -p7000:7000 my-haproxy 

Τώρα, ανοίγοντας τη διεύθυνση του μηχανήματός σας με το HAproxy στο πρόγραμμα περιήγησης και καθορίζοντας τη θύρα 7000, θα δείτε στατιστικά στοιχεία για το σύμπλεγμά σας.

Ο διακομιστής που είναι ο κύριος θα βρίσκεται στην κατάσταση UP και τα αντίγραφα θα βρίσκονται στην κατάσταση DOWN. Αυτό είναι φυσιολογικό, λειτουργούν στην πραγματικότητα, αλλά εμφανίζονται έτσι επειδή επιστρέφουν 503 σε αιτήματα από το HAproxy. Αυτό μας επιτρέπει να γνωρίζουμε πάντα ακριβώς ποιος από τους τρεις διακομιστές είναι ο κύριος τη δεδομένη στιγμή.

Συμπέρασμα

Είσαι καταπληκτικός! Σε μόλις 30 λεπτά έχεις αναπτύξει ένα εξαιρετικό, ανθεκτικό σε σφάλματα και αποδοτικό σύμπλεγμα βάσεων δεδομένων με ροή αναπαραγωγής και αυτόματη ανακατεύθυνση. Αν σκέφτεσαι να χρησιμοποιήσεις αυτήν τη λύση, ρίξε μια ματιά. με επίσημη τεκμηρίωση Patroni, και ειδικά με το μέρος του που αφορά το βοηθητικό πρόγραμμα patronictl, το οποίο παρέχει εύκολη πρόσβαση στη διαχείριση του συμπλέγματός σας.

Συγχαρητήρια!

Πηγή: www.habr.com

Αγοράστε αξιόπιστη φιλοξενία για ιστότοπους με προστασία DDoS, διακομιστές VPS VDS 🔥 Αγοράστε αξιόπιστη φιλοξενία ιστοσελίδων με προστασία DDoS, διακομιστές VPS VDS | ProHoster