Väga saadaoleva PostgreSQL-klastri loomine, kasutades Patroni, etcd, HAProxy

Juhtus nii, et probleemi püstitamise ajal ei olnud mul piisavalt kogemusi selle lahenduse väljatöötamiseks ja käivitamiseks üksi. Ja siis hakkasin guugeldama.

Ma ei tea, milles see konks on, aga olen juba mitmendat korda silmitsi tõsiasjaga, et isegi kui teen kõike samm-sammult nagu õpetuses, valmistan ette autoriga sama keskkonna, siis ei tööta kunagi miski. Mul pole õrna aimugi, milles asi, aga kui sellega uuesti kokku puutusin, otsustasin, et kirjutan oma õpetuse, kui kõik läheb korda. Üks, mis kindlasti töötab.

Juhendid Internetis

Juhtub nii, et Internet ei kannata puudust erinevatest juhenditest, õpetustest, samm-sammult jms. Juhtus nii, et sain ülesandeks töötada välja lahendus PostgreSQL-i tõrkeotsingu klastri mugavaks korraldamiseks ja ehitamiseks, mille peamisteks nõueteks oli replikatsiooni voogesitamine põhiserverist kõikidesse koopiatesse ja reservi automaatne varustamine põhiserveri korral. ebaõnnestumine.

Selles etapis määrati kindlaks kasutatud tehnoloogiate virn:

  • PostgreSQL kui DBMS
  • Patroni klastrilahendusena
  • etcd kui Patroni hajutatud salvestusruum
  • HAproxy andmebaasi kasutavate rakenduste jaoks ühtse sisenemispunkti korraldamiseks

Paigaldamine

Tähelepanu – väga kättesaadava PostgreSQL-klastri loomine, kasutades Patroni, etcd, HAProxy.

Kõik toimingud viidi läbi virtuaalmasinates, kuhu oli installitud Debian 10 OS.

jne

Ma ei soovita etcd installida samadele masinatele, kus asuvad patroni ja postgresql, kuna kettakoormus on etcd jaoks väga oluline. Kuid hariduslikel eesmärkidel me just seda teeme.
Installime jne.

#!/bin/bash
apt-get update
apt-get install etcd

Lisage faili /etc/default/etcd sisu

[liige]

ETCD_NAME=datanode1 # teie masina hostinimi
ETCD_DATA_DIR=”/var/lib/etcd/default.etcd”

KÕIK IP-AADRESSID PEAKSID OLEMA KEHTIVAD. LISTER PEER, CLIENT jne TULEKS SEADISTADA HOSTI IP-AADRESSI

ETCD_LISTEN_PEER_URLS="http://192.168.0.143:2380» # teie auto aadress
ETCD_LISTEN_CLIENT_URLS="http://192.168.0.143:2379,http://127.0.0.1:2379» # teie auto aadress

[klaster]

ETCD_INITIAL_ADVERTISE_PEER_URLS="http://192.168.0.143:2380» # teie auto aadress
ETCD_INITIAL_CLUSTER=»datanode1=http://192.168.0.143:2380,datanode2=http://192.168.0.144:2380,datanode3=http://192.168.0.145:2380» # kõigi etcd-klastri masinate aadressid
ETCD_INITIAL_CLUSTER_STATE="uus"
ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster-1"
ETCD_ADVERTISE_CLIENT_URLS="http://192.168.0.143:2379» # teie auto aadress

Käivitage käsk

systemctl restart etcd

PostgreSQL 9.6 + patroonid

Esimese asjana tuleb seadistada kolm virtuaalmasinat, et neile vajalik tarkvara installida. Pärast masinate installimist, kui järgite minu õpetust, saate käivitada selle lihtsa skripti, mis teeb (peaaegu) kõik teie eest ära. Käitab rootina.

Pange tähele, et skript kasutab PostgreSQL-i versiooni 9.6, see on tingitud meie ettevõtte sisenõuetest. Lahendust pole teistes PostgreSQL-i versioonides testitud.

#!/bin/bash
apt-get install gnupg -y
echo "deb http://apt.postgresql.org/pub/repos/apt/ buster-pgdg main" >> /etc/apt/sources.list
wget --quiet -O - https://www.postgresql.org/media/keys/ACCC4CF8.asc | apt-key add -
apt-get update
apt-get install postgresql-9.6 python3-pip python3-dev libpq-dev -y
systemctl stop postgresql
pip3 install --upgrade pip
pip install psycopg2
pip install patroni[etcd]
echo "
[Unit]
Description=Runners to orchestrate a high-availability PostgreSQL
After=syslog.target network.target

[Service]
Type=simple

User=postgres
Group=postgres

ExecStart=/usr/local/bin/patroni /etc/patroni.yml

KillMode=process

TimeoutSec=30

Restart=no

[Install]
WantedBy=multi-user.targ
" > /etc/systemd/system/patroni.service
mkdir -p /data/patroni
chown postgres:postgres /data/patroni
chmod 700 /data/patroniпо
touch /etc/patroni.yml

Järgmisena peate äsja loodud faili /etc/patroni.yml paigutama järgmise sisu, muutes loomulikult kõigis kohtades IP-aadressid teie kasutatavateks aadressideks.
Pöörake tähelepanu selle yamli kommentaaridele. Muutke klastri igas masinas oma aadressid.

/etc/patroni.yml

scope: pgsql # должно быть одинаковым на всех нодах
namespace: /cluster/ # должно быть одинаковым на всех нодах
name: postgres1 # должно быть разным на всех нодах

restapi:
    listen: 192.168.0.143:8008 # адрес той ноды, в которой находится этот файл
    connect_address: 192.168.0.143:8008 # адрес той ноды, в которой находится этот файл

etcd:
    hosts: 192.168.0.143:2379,192.168.0.144:2379,192.168.0.145:2379 # перечислите здесь все ваши ноды, в случае если вы устанавливаете etcd на них же

# this section (bootstrap) will be written into Etcd:/<namespace>/<scope>/config after initializing new cluster
# and all other cluster members will use it as a `global configuration`
bootstrap:
    dcs:
        ttl: 100
        loop_wait: 10
        retry_timeout: 10
        maximum_lag_on_failover: 1048576
        postgresql:
            use_pg_rewind: true
            use_slots: true
            parameters:
                    wal_level: replica
                    hot_standby: "on"
                    wal_keep_segments: 5120
                    max_wal_senders: 5
                    max_replication_slots: 5
                    checkpoint_timeout: 30

    initdb:
    - encoding: UTF8
    - data-checksums
    - locale: en_US.UTF8
    # init pg_hba.conf должен содержать адреса ВСЕХ машин, используемых в кластере
    pg_hba:
    - host replication postgres ::1/128 md5
    - host replication postgres 127.0.0.1/8 md5
    - host replication postgres 192.168.0.143/24 md5
    - host replication postgres 192.168.0.144/24 md5
    - host replication postgres 192.168.0.145/24 md5
    - host all all 0.0.0.0/0 md5

    users:
        admin:
            password: admin
            options:
                - createrole
                - createdb

postgresql:
    listen: 192.168.0.143:5432 # адрес той ноды, в которой находится этот файл
    connect_address: 192.168.0.143:5432 # адрес той ноды, в которой находится этот файл
    data_dir: /data/patroni # эту директорию создаст скрипт, описанный выше и установит нужные права
    bin_dir:  /usr/lib/postgresql/9.6/bin # укажите путь до вашей директории с postgresql
    pgpass: /tmp/pgpass
    authentication:
        replication:
            username: postgres
            password: postgres
        superuser:
            username: postgres
            password: postgres
    create_replica_methods:
        basebackup:
            checkpoint: 'fast'
    parameters:
        unix_socket_directories: '.'

tags:
    nofailover: false
    noloadbalance: false
    clonefrom: false
    nosync: false

Skript tuleb käivitada klastri kõigis kolmes masinas ja ülaltoodud konfiguratsioon tuleb paigutada ka kõigi masinate faili /etc/patroni.yml.

Kui olete need toimingud kõigis klastri masinates lõpetanud, käivitage ükskõik millisel neist järgmine käsk

systemctl start patroni
systemctl start postgresql

Oodake umbes 30 sekundit ja seejärel käivitage see käsk klastri ülejäänud masinatel.

HAproxy

Me kasutame imelist HAproxyt, et pakkuda ühtset sisestuspunkti. Peaserver on alati saadaval selle masina aadressil, kuhu HAproxy on juurutatud.

Selleks, et HAproxyga masin ei muutuks üheks tõrkepunktiks, käivitame selle Dockeri konteineris, edaspidi saab selle käivitada K8 klastris ja muuta meie tõrkevahetusklastri veelgi töökindlamaks.

Looge kataloog, kuhu saate salvestada kaks faili – Dockerfile ja haproxy.cfg. Mine selle juurde.

dockerfile

FROM ubuntu:latest

RUN apt-get update 
    && apt-get install -y haproxy rsyslog 
    && rm -rf /var/lib/apt/lists/*

RUN mkdir /run/haproxy

COPY haproxy.cfg /etc/haproxy/haproxy.cfg

CMD haproxy -f /etc/haproxy/haproxy.cfg && tail -F /var/log/haproxy.log

Olge ettevaatlik, faili haproxy.cfg kolmel viimasel real peaksid olema teie masinate aadressid. HAproxy võtab ühendust Patroniga, HTTP päistes tagastab peaserver alati 200 ja replika tagastab alati 503.

haproxy.cfg

global
    maxconn 100

defaults
    log global
    mode tcp
    retries 2
    timeout client 30m
    timeout connect 4s
    timeout server 30m
    timeout check 5s

listen stats
    mode http
    bind *:7000
    stats enable
    stats uri /

listen postgres
    bind *:5000
    option httpchk
    http-check expect status 200
    default-server inter 3s fall 3 rise 2 on-marked-down shutdown-sessions
    server postgresql1 192.168.0.143:5432 maxconn 100 check port 8008
    server postgresql2 192.168.0.144:5432 maxconn 100 check port 8008
    server postgresql3 192.168.0.145:5432 maxconn 100 check port 8008

Olles kataloogis, kus mõlemad meie failid "matavad", täitkem järjestikku konteineri pakkimise ja selle käivitamise käsud koos vajalike portide edastamisega:

docker build -t my-haproxy .
docker run -d -p5000:5000 -p7000:7000 my-haproxy 

Nüüd, kui avate brauseris HAproxyga oma masina aadressi ja määrate pordi 7000, näete oma klastri statistikat.

Server, mis on ülem, on UP olekus ja koopiad on ALAS olekus. See on normaalne, tegelikult nad töötavad, kuid paistavad nii, kuna tagastavad HAproxy päringutele 503. See võimaldab meil alati täpselt teada, milline kolmest serverist on praegune ülem.

Järeldus

Sa oled imeilus! Vaid 30 minutiga olete juurutanud suurepärase tõrketaluva ja suure jõudlusega andmebaasiklastri koos voogesituse replikatsiooni ja automaatse tagavarafunktsiooniga. Kui plaanite seda lahendust kasutada, vaadake koos ametliku Patroni dokumentatsiooniga, ja eriti selle osaga, mis puudutab utiliiti patronictl, mis pakub mugavat juurdepääsu teie klastri haldamisele.

Õnnitleme!

Allikas: www.habr.com

Lisa kommentaar