Erabilgarritasun handiko PostgreSQL kluster bat eraikitzea Patroni, etcd, HAProxy erabiliz

Gertatu zen arazoa planteatu zen unean ez nuela esperientzia nahikorik irtenbide hau bakarrik garatu eta abian jartzeko. Eta gero Google-n hasi nintzen.

Ez dakit zein den harrapaketa, baina enegarren aldiz tutoretzan bezala dena pausoz pauso egiten badut ere, egilearen ingurune berdina prestatu, orduan ezer ez dabil ezeren aurrean nago. Ez dakit zer gertatzen den, baina hau berriro topatu nuenean erabaki nuen nire tutoriala idatziko dudala dena ateratzen denean. Zalantzarik gabe funtzionatuko duena.

Gidak Interneten

Gertatzen da Internetek ez duela hainbat gida, tutorial, pausoz pauso eta antzekoen falta jasaten. Gertatu zen, hutsegiteko PostgreSQL kluster bat eroso antolatzeko eta eraikitzeko irtenbide bat garatzeko zeregina izan nuela, zeinaren eskakizun nagusiak zerbitzari nagusitik erreplika guztietara erreproduzitzea eta erreserba automatikoki hornitzea zerbitzari nagusi baten kasuan. porrota.

Etapa honetan, erabilitako teknologien pila zehaztu da:

  • PostgreSQL DBMS gisa
  • Patroni clustering irtenbide gisa
  • etcd Patroniren biltegiratze banatu gisa
  • Datu-basea erabiltzen duten aplikazioetarako sarrera-puntu bakarra antolatzeko HAproxy

Instalazio-

Zure arretarako - erabilgarritasun handiko PostgreSQL kluster bat eraikitzea Patroni, etcd, HAProxy erabiliz.

Eragiketa guztiak Debian 10 OS instalatuta zuten makina birtualetan egin ziren.

etab

Ez dut gomendatzen patroni eta postgresql kokatuko diren makina berdinetan etcd instalatzea, diskoaren karga oso garrantzitsua baita etcdrentzat. Baina hezkuntza helburuetarako, horixe egingo dugu.
Instala dezagun etcd.

#!/bin/bash
apt-get update
apt-get install etcd

Gehitu edukia /etc/default/etcd fitxategira

[kidea]

ETCD_NAME=datanode1 # zure makinaren ostalari-izena
ETCD_DATA_DIR=”/var/lib/etcd/default.etcd”

IP HELBIDE GUZTIEK BALIOA IZAN BEHAR DUTE. LISTER PEER, BEZEROA eta abar OSTALARIAREN IP HELBIDEAN EZARTU BEHAR DUTE

ETCD_LISTEN_PEER_URLS="http://192.168.0.143:2380» Zure autoaren # helbidea
ETCD_LISTEN_CLIENT_URLS="http://192.168.0.143:2379,http://127.0.0.1:2379» Zure autoaren # helbidea

[kluster]

ETCD_INITIAL_ADVERTISE_PEER_URLS="http://192.168.0.143:2380» Zure autoaren # helbidea
ETCD_INITIAL_CLUSTER=»datanode1=http://192.168.0.143:2380,datanode2=http://192.168.0.144:2380,datanode3=http://192.168.0.145:2380» Etcd klusterreko makina guztien # helbideak
ETCD_INITIAL_CLUSTER_STATE="berria"
ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster-1"
ETCD_ADVERTISE_CLIENT_URLS="http://192.168.0.143:2379» Zure autoaren # helbidea

Exekutatu komandoa

systemctl restart etcd

PostgreSQL 9.6 + babeslea

Egin behar duzun lehenengo gauza hiru makina birtual konfiguratzea da, horietan beharrezko softwarea instalatzeko. Makinak instalatu ondoren, nire tutoriala jarraitzen baduzu, (ia) dena egingo dizun script sinple hau exekutatu dezakezu. root gisa exekutatzen da.

Kontuan izan scriptak PostgreSQL 9.6 bertsioa erabiltzen duela, gure enpresaren barne-eskakizunak direla eta. Irtenbidea ez da PostgreSQL-ren beste bertsio batzuetan probatu.

#!/bin/bash
apt-get install gnupg -y
echo "deb http://apt.postgresql.org/pub/repos/apt/ buster-pgdg main" >> /etc/apt/sources.list
wget --quiet -O - https://www.postgresql.org/media/keys/ACCC4CF8.asc | apt-key add -
apt-get update
apt-get install postgresql-9.6 python3-pip python3-dev libpq-dev -y
systemctl stop postgresql
pip3 install --upgrade pip
pip install psycopg2
pip install patroni[etcd]
echo "
[Unit]
Description=Runners to orchestrate a high-availability PostgreSQL
After=syslog.target network.target

[Service]
Type=simple

User=postgres
Group=postgres

ExecStart=/usr/local/bin/patroni /etc/patroni.yml

KillMode=process

TimeoutSec=30

Restart=no

[Install]
WantedBy=multi-user.targ
" > /etc/systemd/system/patroni.service
mkdir -p /data/patroni
chown postgres:postgres /data/patroni
chmod 700 /data/patroniпо
touch /etc/patroni.yml

Ondoren, sortu berri duzun /etc/patroni.yml fitxategian, honako edukiak jarri behar dituzu, noski, leku guztietan IP helbideak erabiltzen dituzun helbideetara aldatuz.
Erreparatu yaml honetako iruzkinei. Aldatu helbideak zure kabuz klusterreko makina bakoitzean.

/etc/patroni.yml

scope: pgsql # должно быть одинаковым на всех нодах
namespace: /cluster/ # должно быть одинаковым на всех нодах
name: postgres1 # должно быть разным на всех нодах

restapi:
    listen: 192.168.0.143:8008 # адрес той ноды, в которой находится этот файл
    connect_address: 192.168.0.143:8008 # адрес той ноды, в которой находится этот файл

etcd:
    hosts: 192.168.0.143:2379,192.168.0.144:2379,192.168.0.145:2379 # перечислите здесь все ваши ноды, в случае если вы устанавливаете etcd на них же

# this section (bootstrap) will be written into Etcd:/<namespace>/<scope>/config after initializing new cluster
# and all other cluster members will use it as a `global configuration`
bootstrap:
    dcs:
        ttl: 100
        loop_wait: 10
        retry_timeout: 10
        maximum_lag_on_failover: 1048576
        postgresql:
            use_pg_rewind: true
            use_slots: true
            parameters:
                    wal_level: replica
                    hot_standby: "on"
                    wal_keep_segments: 5120
                    max_wal_senders: 5
                    max_replication_slots: 5
                    checkpoint_timeout: 30

    initdb:
    - encoding: UTF8
    - data-checksums
    - locale: en_US.UTF8
    # init pg_hba.conf должен содержать адреса ВСЕХ машин, используемых в кластере
    pg_hba:
    - host replication postgres ::1/128 md5
    - host replication postgres 127.0.0.1/8 md5
    - host replication postgres 192.168.0.143/24 md5
    - host replication postgres 192.168.0.144/24 md5
    - host replication postgres 192.168.0.145/24 md5
    - host all all 0.0.0.0/0 md5

    users:
        admin:
            password: admin
            options:
                - createrole
                - createdb

postgresql:
    listen: 192.168.0.143:5432 # адрес той ноды, в которой находится этот файл
    connect_address: 192.168.0.143:5432 # адрес той ноды, в которой находится этот файл
    data_dir: /data/patroni # эту директорию создаст скрипт, описанный выше и установит нужные права
    bin_dir:  /usr/lib/postgresql/9.6/bin # укажите путь до вашей директории с postgresql
    pgpass: /tmp/pgpass
    authentication:
        replication:
            username: postgres
            password: postgres
        superuser:
            username: postgres
            password: postgres
    create_replica_methods:
        basebackup:
            checkpoint: 'fast'
    parameters:
        unix_socket_directories: '.'

tags:
    nofailover: false
    noloadbalance: false
    clonefrom: false
    nosync: false

Scripta klusterreko hiru makinetan exekutatu behar da, eta goiko konfigurazioa /etc/patroni.yml fitxategian ere jarri behar da makina guztietan.

Eragiketa hauek klusterreko makina guztietan amaitu ondoren, exekutatu komando hau horietako edozeinetan

systemctl start patroni
systemctl start postgresql

Itxaron 30 segundo inguru, gero exekutatu komando hau klusterreko gainerako makinetan.

HAproxy

HAproxy zoragarria erabiltzen dugu sarrera puntu bakarra emateko. Zerbitzari nagusia beti egongo da eskuragarri HAproxy inplementatzen den makinaren helbidean.

HAproxy duen makina huts-puntu bakar bat izan ez dadin, Docker edukiontzi batean abiaraziko dugu; etorkizunean K8-ren klusterean abiarazi daiteke eta gure hutsegite-kluster are fidagarriagoa izan dadin.

Sortu direktorio bat non bi fitxategi gorde ditzakezun - Dockerfile eta haproxy.cfg. Joan zaitez.

Dockerfile

FROM ubuntu:latest

RUN apt-get update 
    && apt-get install -y haproxy rsyslog 
    && rm -rf /var/lib/apt/lists/*

RUN mkdir /run/haproxy

COPY haproxy.cfg /etc/haproxy/haproxy.cfg

CMD haproxy -f /etc/haproxy/haproxy.cfg && tail -F /var/log/haproxy.log

Kontuz ibili, haproxy.cfg fitxategiaren azken hiru lerroek zure makinen helbideak zerrendatu behar dituzte. HAproxy Patronirekin harremanetan jarriko da, HTTP goiburuetan zerbitzari nagusiak beti 200 itzuliko du, eta erreplikak 503.

haproxy.cfg

global
    maxconn 100

defaults
    log global
    mode tcp
    retries 2
    timeout client 30m
    timeout connect 4s
    timeout server 30m
    timeout check 5s

listen stats
    mode http
    bind *:7000
    stats enable
    stats uri /

listen postgres
    bind *:5000
    option httpchk
    http-check expect status 200
    default-server inter 3s fall 3 rise 2 on-marked-down shutdown-sessions
    server postgresql1 192.168.0.143:5432 maxconn 100 check port 8008
    server postgresql2 192.168.0.144:5432 maxconn 100 check port 8008
    server postgresql3 192.168.0.145:5432 maxconn 100 check port 8008

Gure bi fitxategiak "datzan" dagoen direktorioan egonik, exekutatu ditzagun edukiontzia paketatzeko komandoak sekuentzialki, baita abiarazi behar diren atakak birbidaltzeko:

docker build -t my-haproxy .
docker run -d -p5000:5000 -p7000:7000 my-haproxy 

Orain, arakatzailean HAproxy-rekin zure makinaren helbidea irekiz eta 7000 ataka zehaztuz, zure klusterraren estatistikak ikusiko dituzu.

Maisua den zerbitzaria GORA egoeran egongo da, eta erreplikak BEHERA egoeran. Hau normala da, egia esan, funtzionatzen dute, baina horrela agertzen dira HAproxy-ren eskaeretarako 503 itzultzen dutelako. Horri esker, beti jakin dezakegu zehazki zein den uneko maisua hiru zerbitzarietatik.

Ondorioa

Zoragarria zara! 30 minututan hutsegite-tolerantzia eta errendimendu handiko datu-base-kluster bikaina zabaldu duzu streaming-erreplika eta atzerabide automatikoarekin. Irtenbide hau erabiltzeko asmoa baduzu, begiratu Patroni dokumentazio ofizialarekin, eta batez ere patronictl erabilgarritasunari dagokion zatiarekin, zure kluster kudeatzeko sarbide erosoa eskaintzen duena.

Zorionak!

Iturria: www.habr.com

Gehitu iruzkin berria