Bygge en svært tilgjengelig PostgreSQL-klynge ved hjelp av Patroni, etcd, HAProxy

Det skjedde rett og slett at på det tidspunktet problemet ble stilt, hadde jeg ikke nok erfaring til å utvikle og lansere denne løsningen alene. Og så begynte jeg å google.

Jeg vet ikke hva fangsten er, men for femtende gang står jeg overfor det faktum at selv om jeg gjør alt trinn for trinn som i opplæringen, forbereder det samme miljøet som forfatteren, så fungerer ingenting. Jeg aner ikke hva som er i veien, men da jeg møtte dette igjen, bestemte jeg meg for at jeg skal skrive min egen opplæring når alt ordner seg. En som definitivt vil fungere.

Guider på Internett

Det hender bare at Internett ikke lider av mangel på ulike guider, opplæringsprogrammer, trinn-for-trinn og lignende. Det skjedde at jeg fikk oppgaven med å utvikle en løsning for enkelt å organisere og bygge en failover PostgreSQL-klynge, hovedkravene for dette var strømming av replikering fra masterserveren til alle replikaer og automatisk klargjøring av en reserve i tilfelle en Hovedserverfeil.

På dette stadiet ble stabelen med teknologier som ble brukt, bestemt:

  • PostgreSQL som et DBMS
  • Patroni som en klyngeløsning
  • etcd som distribuert lager for Patroni
  • HAproxy for å organisere et enkelt inngangspunkt for applikasjoner som bruker databasen

Installasjon

For din oppmerksomhet - bygg en svært tilgjengelig PostgreSQL-klynge ved hjelp av Patroni, etcd, HAProxy.

Alle operasjoner ble utført på virtuelle maskiner med Debian 10 OS installert.

osv

Jeg anbefaler ikke å installere etcd på de samme maskinene der patroni og postgresql vil være plassert, siden diskbelastning er veldig viktig for etcd. Men for pedagogiske formål vil vi gjøre nettopp det.
La oss installere etcd.

#!/bin/bash
apt-get update
apt-get install etcd

Legg til innhold i filen /etc/default/etcd

[medlem]

ETCD_NAME=datanode1 # vertsnavn på maskinen din
ETCD_DATA_DIR="/var/lib/etcd/default.etcd"

ALLE IP-ADRESSER SKAL VÆRE GYLDIGE. LISTER PEER, KLIENT osv. SKAL STILLES TIL IP-ADRESSEN TIL VERTEN

ETCD_LISTEN_PEER_URLS="http://192.168.0.143:2380» # adresse til bilen din
ETCD_LISTEN_CLIENT_URLS="http://192.168.0.143:2379,http://127.0.0.1:2379» # adresse til bilen din

[klynge]

ETCD_INITIAL_ADVERTISE_PEER_URLS="http://192.168.0.143:2380» # adresse til bilen din
ETCD_INITIAL_CLUSTER=»datanode1=http://192.168.0.143:2380,datanode2=http://192.168.0.144:2380,datanode3=http://192.168.0.145:2380» # adresser til alle maskiner i etcd-klyngen
ETCD_INITIAL_CLUSTER_STATE="ny"
ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster-1″
ETCD_ADVERTISE_CLIENT_URLS="http://192.168.0.143:2379» # adresse til bilen din

Utfør kommandoen

systemctl restart etcd

PostgreSQL 9.6 + patroni

Det første du må gjøre er å sette opp tre virtuelle maskiner for å installere nødvendig programvare på dem. Etter å ha installert maskinene, hvis du følger veiledningen min, kan du kjøre dette enkle skriptet som (nesten) vil gjøre alt for deg. Kjører som root.

Vær oppmerksom på at skriptet bruker PostgreSQL versjon 9.6, dette er på grunn av de interne kravene til selskapet vårt. Løsningen er ikke testet på andre versjoner av PostgreSQL.

#!/bin/bash
apt-get install gnupg -y
echo "deb http://apt.postgresql.org/pub/repos/apt/ buster-pgdg main" >> /etc/apt/sources.list
wget --quiet -O - https://www.postgresql.org/media/keys/ACCC4CF8.asc | apt-key add -
apt-get update
apt-get install postgresql-9.6 python3-pip python3-dev libpq-dev -y
systemctl stop postgresql
pip3 install --upgrade pip
pip install psycopg2
pip install patroni[etcd]
echo "
[Unit]
Description=Runners to orchestrate a high-availability PostgreSQL
After=syslog.target network.target

[Service]
Type=simple

User=postgres
Group=postgres

ExecStart=/usr/local/bin/patroni /etc/patroni.yml

KillMode=process

TimeoutSec=30

Restart=no

[Install]
WantedBy=multi-user.targ
" > /etc/systemd/system/patroni.service
mkdir -p /data/patroni
chown postgres:postgres /data/patroni
chmod 700 /data/patroniпо
touch /etc/patroni.yml

Deretter, i /etc/patroni.yml-filen du nettopp opprettet, må du plassere følgende innhold, selvfølgelig endre IP-adressene alle steder til adressene du bruker.
Vær oppmerksom på kommentarene i denne yaml. Endre adressene til dine egne på hver maskin i klyngen.

/etc/patroni.yml

scope: pgsql # должно быть одинаковым на всех нодах
namespace: /cluster/ # должно быть одинаковым на всех нодах
name: postgres1 # должно быть разным на всех нодах

restapi:
    listen: 192.168.0.143:8008 # адрес той ноды, в которой находится этот файл
    connect_address: 192.168.0.143:8008 # адрес той ноды, в которой находится этот файл

etcd:
    hosts: 192.168.0.143:2379,192.168.0.144:2379,192.168.0.145:2379 # перечислите здесь все ваши ноды, в случае если вы устанавливаете etcd на них же

# this section (bootstrap) will be written into Etcd:/<namespace>/<scope>/config after initializing new cluster
# and all other cluster members will use it as a `global configuration`
bootstrap:
    dcs:
        ttl: 100
        loop_wait: 10
        retry_timeout: 10
        maximum_lag_on_failover: 1048576
        postgresql:
            use_pg_rewind: true
            use_slots: true
            parameters:
                    wal_level: replica
                    hot_standby: "on"
                    wal_keep_segments: 5120
                    max_wal_senders: 5
                    max_replication_slots: 5
                    checkpoint_timeout: 30

    initdb:
    - encoding: UTF8
    - data-checksums
    - locale: en_US.UTF8
    # init pg_hba.conf должен содержать адреса ВСЕХ машин, используемых в кластере
    pg_hba:
    - host replication postgres ::1/128 md5
    - host replication postgres 127.0.0.1/8 md5
    - host replication postgres 192.168.0.143/24 md5
    - host replication postgres 192.168.0.144/24 md5
    - host replication postgres 192.168.0.145/24 md5
    - host all all 0.0.0.0/0 md5

    users:
        admin:
            password: admin
            options:
                - createrole
                - createdb

postgresql:
    listen: 192.168.0.143:5432 # адрес той ноды, в которой находится этот файл
    connect_address: 192.168.0.143:5432 # адрес той ноды, в которой находится этот файл
    data_dir: /data/patroni # эту директорию создаст скрипт, описанный выше и установит нужные права
    bin_dir:  /usr/lib/postgresql/9.6/bin # укажите путь до вашей директории с postgresql
    pgpass: /tmp/pgpass
    authentication:
        replication:
            username: postgres
            password: postgres
        superuser:
            username: postgres
            password: postgres
    create_replica_methods:
        basebackup:
            checkpoint: 'fast'
    parameters:
        unix_socket_directories: '.'

tags:
    nofailover: false
    noloadbalance: false
    clonefrom: false
    nosync: false

Skriptet må kjøres på alle tre maskinene i klyngen, og konfigurasjonen ovenfor må også plasseres i filen /etc/patroni.yml på alle maskinene.

Når du har fullført disse operasjonene på alle maskinene i klyngen, kjør følgende kommando på en av dem

systemctl start patroni
systemctl start postgresql

Vent ca. 30 sekunder, og kjør deretter denne kommandoen på de gjenværende maskinene i klyngen.

HAproxy

Vi bruker den fantastiske HAproxy for å gi et enkelt inngangspunkt. Hovedserveren vil alltid være tilgjengelig på adressen til maskinen som HAproxy er distribuert på.

For ikke å gjøre maskinen med HAproxy til et enkelt feilpunkt, vil vi lansere den i en Docker-beholder; i fremtiden kan den lanseres inn i K8s klynge og gjøre failover-klyngen vår enda mer pålitelig.

Lag en katalog der du kan lagre to filer - Dockerfile og haproxy.cfg. Gå til den.

Dockerfile

FROM ubuntu:latest

RUN apt-get update 
    && apt-get install -y haproxy rsyslog 
    && rm -rf /var/lib/apt/lists/*

RUN mkdir /run/haproxy

COPY haproxy.cfg /etc/haproxy/haproxy.cfg

CMD haproxy -f /etc/haproxy/haproxy.cfg && tail -F /var/log/haproxy.log

Vær forsiktig, de tre siste linjene i filen haproxy.cfg skal vise adressene til maskinene dine. HAproxy vil kontakte Patroni, i HTTP-hodene vil hovedserveren alltid returnere 200, og replikaen vil alltid returnere 503.

haproxy.cfg

global
    maxconn 100

defaults
    log global
    mode tcp
    retries 2
    timeout client 30m
    timeout connect 4s
    timeout server 30m
    timeout check 5s

listen stats
    mode http
    bind *:7000
    stats enable
    stats uri /

listen postgres
    bind *:5000
    option httpchk
    http-check expect status 200
    default-server inter 3s fall 3 rise 2 on-marked-down shutdown-sessions
    server postgresql1 192.168.0.143:5432 maxconn 100 check port 8008
    server postgresql2 192.168.0.144:5432 maxconn 100 check port 8008
    server postgresql3 192.168.0.145:5432 maxconn 100 check port 8008

Når vi er i katalogen der begge filene våre "ligger", la oss kjøre kommandoene for å pakke beholderen sekvensielt, samt starte den med videresending av de nødvendige portene:

docker build -t my-haproxy .
docker run -d -p5000:5000 -p7000:7000 my-haproxy 

Nå, ved å åpne adressen til maskinen din med HAproxy i nettleseren og spesifisere port 7000, vil du se statistikk på klyngen din.

Serveren som er master vil være i OPP-tilstand, og replikaene vil være i NED-tilstand. Dette er normalt, faktisk fungerer de, men de vises på denne måten fordi de returnerer 503 for forespørsler fra HAproxy. Dette lar oss alltid vite nøyaktig hvilken av de tre serverne som er gjeldende master.

Konklusjon

Du er vakker! På bare 30 minutter har du implementert en utmerket feiltolerant og høyytelses databaseklynge med streaming replikering og automatisk fallback. Hvis du planlegger å bruke denne løsningen, sjekk ut med offisiell Patroni-dokumentasjon, og spesielt med sin del om patronictl-verktøyet, som gir enkel tilgang til å administrere klyngen din.

Gratulerer!

Kilde: www.habr.com

Legg til en kommentar