Erittäin saatavilla olevan PostgreSQL-klusterin rakentaminen Patronilla, etcd:llä, HAProxylla

Sattui vain niin, että ongelman esittämishetkellä minulla ei ollut tarpeeksi kokemusta kehittää ja käynnistää tämä ratkaisu yksin. Ja sitten aloin googlettaa.

En tiedä mikä on saalis, mutta jo monennen kerran joudun kohtaamaan sen tosiasian, että vaikka tekisin kaiken askel askeleelta kuten opetusohjelmassa, valmistan saman ympäristön kuin kirjoittaja, niin mikään ei koskaan toimi. Minulla ei ole aavistustakaan mistä on kysymys, mutta kun kohtasin tämän uudelleen, päätin kirjoittaa oman opetusohjelman, kun kaikki toimii. Sellainen, joka varmasti toimii.

Oppaat Internetissä

On vain niin, että Internet ei kärsi erilaisten oppaiden, opetusohjelmien, vaiheittaisten ohjeiden ja vastaavien puutteesta. Sattui vain niin, että sain tehtäväksi kehittää ratkaisu, jolla voit järjestää ja rakentaa kätevästi vikasietoisen PostgreSQL-klusterin, jonka päävaatimukset olivat replikoinnin suoratoisto pääpalvelimelta kaikkiin replikoihin ja reservin automaattinen provisiointi pääpalvelimen tapauksessa. epäonnistuminen.

Tässä vaiheessa määritettiin käytettyjen teknologioiden pino:

  • PostgreSQL tietokantajärjestelmänä
  • Patroni klusterointiratkaisuna
  • etcd Patronin hajautettuna tallennustilana
  • HAproxy yhden syöttöpisteen järjestämiseen tietokantaa käyttäville sovelluksille

Asennus

Huomioi - erittäin saatavilla olevan PostgreSQL-klusterin rakentaminen Patronilla, etcd:llä, HAProxylla.

Kaikki toiminnot suoritettiin virtuaalisilla koneilla, joihin oli asennettu Debian 10 OS.

jne

En suosittele etcd:n asentamista samoihin koneisiin, joissa patroni ja postgresql sijaitsevat, koska levyn kuormitus on erittäin tärkeä etcd:lle. Mutta koulutustarkoituksiin teemme juuri niin.
Asennetaan jne.

#!/bin/bash
apt-get update
apt-get install etcd

Lisää sisältöä /etc/default/etcd-tiedostoon

[jäsen]

ETCD_NAME=datanode1 # koneesi isäntänimi
ETCD_DATA_DIR=”/var/lib/etcd/default.etcd”

KAIKKIEN IP-OSOITTEIDEN PITÄÄ OLLA VOIMASSA. LISTER PEER, CLIENT jne. ON ASETETTU ISÄNTÄJÄN IP-OSOITEEKSI

ETCD_LISTEN_PEER_URLS="http://192.168.0.143:2380» # autosi osoite
ETCD_LISTEN_CLIENT_URLS="http://192.168.0.143:2379,http://127.0.0.1:2379» # autosi osoite

[klusteri]

ETCD_INITIAL_ADVERTISE_PEER_URLS="http://192.168.0.143:2380» # autosi osoite
ETCD_INITIAL_CLUSTER=»datanode1=http://192.168.0.143:2380,datanode2=http://192.168.0.144:2380,datanode3=http://192.168.0.145:2380» # kaikkien etcd-klusterin koneiden osoitteet
ETCD_INITIAL_CLUSTER_STATE="uusi"
ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster-1"
ETCD_ADVERTISE_CLIENT_URLS="http://192.168.0.143:2379» # autosi osoite

Suorita komento

systemctl restart etcd

PostgreSQL 9.6 + asiakas

Ensimmäinen asia, joka sinun on tehtävä, on määrittää kolme virtuaalikonetta asentamaan niihin tarvittavat ohjelmistot. Koneiden asennuksen jälkeen, jos noudatat opetusohjelmaani, voit suorittaa tämän yksinkertaisen skriptin, joka (melkein) tekee kaiken puolestasi. Toimii root-käyttäjänä.

Huomaa, että skripti käyttää PostgreSQL-versiota 9.6, tämä johtuu yrityksemme sisäisistä vaatimuksista. Ratkaisua ei ole testattu muilla PostgreSQL-versioilla.

#!/bin/bash
apt-get install gnupg -y
echo "deb http://apt.postgresql.org/pub/repos/apt/ buster-pgdg main" >> /etc/apt/sources.list
wget --quiet -O - https://www.postgresql.org/media/keys/ACCC4CF8.asc | apt-key add -
apt-get update
apt-get install postgresql-9.6 python3-pip python3-dev libpq-dev -y
systemctl stop postgresql
pip3 install --upgrade pip
pip install psycopg2
pip install patroni[etcd]
echo "
[Unit]
Description=Runners to orchestrate a high-availability PostgreSQL
After=syslog.target network.target

[Service]
Type=simple

User=postgres
Group=postgres

ExecStart=/usr/local/bin/patroni /etc/patroni.yml

KillMode=process

TimeoutSec=30

Restart=no

[Install]
WantedBy=multi-user.targ
" > /etc/systemd/system/patroni.service
mkdir -p /data/patroni
chown postgres:postgres /data/patroni
chmod 700 /data/patroniпо
touch /etc/patroni.yml

Seuraavaksi juuri luomassasi /etc/patroni.yml-tiedostossa sinun on sijoitettava seuraava sisältö, tietysti muuttamalla IP-osoitteet kaikissa paikoissa käyttämiisi osoitteisiin.
Kiinnitä huomiota tämän yamlin kommentteihin. Muuta osoitteet omiksi klusterin jokaisessa koneessa.

/etc/patroni.yml

scope: pgsql # должно быть одинаковым на всех нодах
namespace: /cluster/ # должно быть одинаковым на всех нодах
name: postgres1 # должно быть разным на всех нодах

restapi:
    listen: 192.168.0.143:8008 # адрес той ноды, в которой находится этот файл
    connect_address: 192.168.0.143:8008 # адрес той ноды, в которой находится этот файл

etcd:
    hosts: 192.168.0.143:2379,192.168.0.144:2379,192.168.0.145:2379 # перечислите здесь все ваши ноды, в случае если вы устанавливаете etcd на них же

# this section (bootstrap) will be written into Etcd:/<namespace>/<scope>/config after initializing new cluster
# and all other cluster members will use it as a `global configuration`
bootstrap:
    dcs:
        ttl: 100
        loop_wait: 10
        retry_timeout: 10
        maximum_lag_on_failover: 1048576
        postgresql:
            use_pg_rewind: true
            use_slots: true
            parameters:
                    wal_level: replica
                    hot_standby: "on"
                    wal_keep_segments: 5120
                    max_wal_senders: 5
                    max_replication_slots: 5
                    checkpoint_timeout: 30

    initdb:
    - encoding: UTF8
    - data-checksums
    - locale: en_US.UTF8
    # init pg_hba.conf должен содержать адреса ВСЕХ машин, используемых в кластере
    pg_hba:
    - host replication postgres ::1/128 md5
    - host replication postgres 127.0.0.1/8 md5
    - host replication postgres 192.168.0.143/24 md5
    - host replication postgres 192.168.0.144/24 md5
    - host replication postgres 192.168.0.145/24 md5
    - host all all 0.0.0.0/0 md5

    users:
        admin:
            password: admin
            options:
                - createrole
                - createdb

postgresql:
    listen: 192.168.0.143:5432 # адрес той ноды, в которой находится этот файл
    connect_address: 192.168.0.143:5432 # адрес той ноды, в которой находится этот файл
    data_dir: /data/patroni # эту директорию создаст скрипт, описанный выше и установит нужные права
    bin_dir:  /usr/lib/postgresql/9.6/bin # укажите путь до вашей директории с postgresql
    pgpass: /tmp/pgpass
    authentication:
        replication:
            username: postgres
            password: postgres
        superuser:
            username: postgres
            password: postgres
    create_replica_methods:
        basebackup:
            checkpoint: 'fast'
    parameters:
        unix_socket_directories: '.'

tags:
    nofailover: false
    noloadbalance: false
    clonefrom: false
    nosync: false

Komentosarja on suoritettava kaikissa kolmessa klusterin koneessa, ja yllä oleva kokoonpano on myös sijoitettava /etc/patroni.yml-tiedostoon kaikissa koneissa.

Kun olet suorittanut nämä toiminnot kaikissa klusterin koneissa, suorita seuraava komento missä tahansa niistä

systemctl start patroni
systemctl start postgresql

Odota noin 30 sekuntia ja suorita sitten tämä komento klusterin jäljellä oleville koneille.

HAproxy

Käytämme upeaa HAproxya tarjotaksemme yhden sisääntulopisteen. Pääpalvelin on aina käytettävissä sen koneen osoitteessa, jossa HAproxy on otettu käyttöön.

Jotta HAproxylla varustetusta koneesta ei muodostuisi yhtä vikakohtaa, lanseeraamme sen Docker-säiliössä, joka voidaan jatkossa käynnistää K8:n klusteriin ja tehdä vikasietoklusteristamme entistä luotettavampi.

Luo hakemisto, johon voit tallentaa kaksi tiedostoa - Dockerfile ja haproxy.cfg. Mene siihen.

Dockerfile

FROM ubuntu:latest

RUN apt-get update 
    && apt-get install -y haproxy rsyslog 
    && rm -rf /var/lib/apt/lists/*

RUN mkdir /run/haproxy

COPY haproxy.cfg /etc/haproxy/haproxy.cfg

CMD haproxy -f /etc/haproxy/haproxy.cfg && tail -F /var/log/haproxy.log

Ole varovainen, sillä haproxy.cfg-tiedoston kolmella viimeisellä rivillä pitäisi olla koneesi osoitteet. HAproxy ottaa yhteyttä Patroniin, HTTP-otsikoissa pääpalvelin palauttaa aina 200 ja replika palauttaa aina 503.

haproxy.cfg

global
    maxconn 100

defaults
    log global
    mode tcp
    retries 2
    timeout client 30m
    timeout connect 4s
    timeout server 30m
    timeout check 5s

listen stats
    mode http
    bind *:7000
    stats enable
    stats uri /

listen postgres
    bind *:5000
    option httpchk
    http-check expect status 200
    default-server inter 3s fall 3 rise 2 on-marked-down shutdown-sessions
    server postgresql1 192.168.0.143:5432 maxconn 100 check port 8008
    server postgresql2 192.168.0.144:5432 maxconn 100 check port 8008
    server postgresql3 192.168.0.145:5432 maxconn 100 check port 8008

Kun olemme hakemistossa, jossa molemmat tiedostomme "makaavat", suoritetaan peräkkäin komennot kontin pakkaamiseksi sekä sen käynnistäminen ja tarvittavien porttien välittäminen:

docker build -t my-haproxy .
docker run -d -p5000:5000 -p7000:7000 my-haproxy 

Nyt kun avaat koneesi osoitteen HAproxylla selaimessa ja määrität portin 7000, näet klusterin tilastot.

Palvelin, joka on pääpalvelin, on YLÖS-tilassa ja kopiot DOWN-tilassa. Tämä on normaalia, itse asiassa ne toimivat, mutta ne näyttävät tältä, koska ne palauttavat 503 HAproxyn pyynnöille. Näin voimme aina tietää tarkalleen, mikä kolmesta palvelimesta on nykyinen isäntä.

Johtopäätös

Sinä olet upea! Vain 30 minuutissa olet ottanut käyttöön erinomaisen vikasietoisen ja tehokkaan tietokantaklusterin, jossa on suoratoiston replikointi ja automaattinen palautus. Jos aiot käyttää tätä ratkaisua, tarkista virallisilla Patronin asiakirjoilla, ja erityisesti sen osa koskee patronictl-apuohjelmaa, joka tarjoaa kätevän pääsyn klusterin hallintaan.

Onneksi olkoon!

Lähde: will.com

Lisää kommentti