Membangun cluster PostgreSQL dengan ketersediaan tinggi menggunakan Patroni, dlld, HAProxy

Kebetulan pada saat masalah tersebut diajukan, saya tidak memiliki cukup pengalaman untuk mengembangkan dan meluncurkan solusi ini sendirian. Dan kemudian saya mulai Googling.

Entah apa yang jadi kendalanya, tapi untuk kesekian kalinya saya dihadapkan pada kenyataan bahwa meskipun saya melakukan semuanya selangkah demi selangkah seperti di tutorial, menyiapkan lingkungan yang sama dengan penulis, maka tidak ada yang berhasil. Saya tidak tahu apa masalahnya, tetapi ketika saya mengalami hal ini lagi, saya memutuskan untuk menulis tutorial saya sendiri ketika semuanya sudah beres. Salah satu yang pasti akan berhasil.

Panduan di Internet

Kebetulan Internet tidak kekurangan berbagai panduan, tutorial, langkah demi langkah dan sejenisnya. Kebetulan saya ditugaskan untuk mengembangkan solusi untuk mengatur dan membangun cluster PostgreSQL failover dengan mudah, persyaratan utamanya adalah streaming replikasi dari server Master ke semua replika dan penyediaan cadangan otomatis jika ada server Master kegagalan.

Pada tahap ini, tumpukan teknologi yang digunakan ditentukan:

  • PostgreSQL sebagai DBMS
  • Patroni sebagai solusi pengelompokan
  • dlld sebagai penyimpanan terdistribusi untuk Patroni
  • HAproxy untuk mengatur satu titik masuk untuk aplikasi menggunakan database

Instalasi

Atas perhatian Anda - membangun cluster PostgreSQL dengan ketersediaan tinggi menggunakan Patroni, dlld, HAProxy.

Semua operasi dilakukan pada mesin virtual dengan OS Debian 10 terinstal.

dll

Saya tidak menyarankan menginstal etcd pada mesin yang sama di mana patroni dan postgresql akan ditempatkan, karena beban disk sangat penting untuk etcd. Tapi untuk tujuan pendidikan, kami akan melakukan hal itu.
Ayo instal dll.

#!/bin/bash
apt-get update
apt-get install etcd

Tambahkan konten ke file /etc/default/etcd

[anggota]

ETCD_NAME=datanode1 # nama host mesin Anda
ETCD_DATA_DIR=”/var/lib/etcd/default.etcd”

SEMUA ALAMAT IP HARUS VALID. LISTER PEER, CLIENT dll HARUS DIATUR KE ALAMAT IP HOST

ETCD_LISTEN_PEER_URLS="http://192.168.0.143:2380» # alamat mobil Anda
ETCD_LISTEN_CLIENT_URLS="http://192.168.0.143:2379,http://127.0.0.1:2379» # alamat mobil Anda

[gugus]

ETCD_INITIAL_ADVERTISE_PEER_URLS="http://192.168.0.143:2380» # alamat mobil Anda
ETCD_INITIAL_CLUSTER=»datanode1=http://192.168.0.143:2380,datanode2=http://192.168.0.144:2380,datanode3=http://192.168.0.145:2380» # alamat semua mesin di cluster etcd
ETCD_INITIAL_CLUSTER_STATE="baru"
ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster-1″
ETCD_ADVERTISE_CLIENT_URLS="http://192.168.0.143:2379» # alamat mobil Anda

Jalankan perintah

systemctl restart etcd

PostgreSQL 9.6 + dukungan

Hal pertama yang perlu Anda lakukan adalah menyiapkan tiga mesin virtual untuk menginstal perangkat lunak yang diperlukan di dalamnya. Setelah menginstal mesin, jika Anda mengikuti tutorial saya, Anda dapat menjalankan skrip sederhana ini yang (hampir) melakukan segalanya untuk Anda. Berjalan sebagai root.

Perlu diketahui bahwa skrip menggunakan PostgreSQL versi 9.6, hal ini disebabkan oleh persyaratan internal perusahaan kami. Solusinya belum diuji pada versi PostgreSQL lainnya.

#!/bin/bash
apt-get install gnupg -y
echo "deb http://apt.postgresql.org/pub/repos/apt/ buster-pgdg main" >> /etc/apt/sources.list
wget --quiet -O - https://www.postgresql.org/media/keys/ACCC4CF8.asc | apt-key add -
apt-get update
apt-get install postgresql-9.6 python3-pip python3-dev libpq-dev -y
systemctl stop postgresql
pip3 install --upgrade pip
pip install psycopg2
pip install patroni[etcd]
echo "
[Unit]
Description=Runners to orchestrate a high-availability PostgreSQL
After=syslog.target network.target

[Service]
Type=simple

User=postgres
Group=postgres

ExecStart=/usr/local/bin/patroni /etc/patroni.yml

KillMode=process

TimeoutSec=30

Restart=no

[Install]
WantedBy=multi-user.targ
" > /etc/systemd/system/patroni.service
mkdir -p /data/patroni
chown postgres:postgres /data/patroni
chmod 700 /data/patroniпо
touch /etc/patroni.yml

Selanjutnya pada file /etc/patroni.yml yang baru saja Anda buat, Anda perlu menempatkan konten berikut, tentu saja mengubah alamat IP di semua tempat ke alamat yang Anda gunakan.
Perhatikan komentar di yaml ini. Ubah alamat menjadi milik Anda sendiri di setiap mesin di cluster.

/etc/patroni.yml

scope: pgsql # должно быть одинаковым на всех нодах
namespace: /cluster/ # должно быть одинаковым на всех нодах
name: postgres1 # должно быть разным на всех нодах

restapi:
    listen: 192.168.0.143:8008 # адрес той ноды, в которой находится этот файл
    connect_address: 192.168.0.143:8008 # адрес той ноды, в которой находится этот файл

etcd:
    hosts: 192.168.0.143:2379,192.168.0.144:2379,192.168.0.145:2379 # перечислите здесь все ваши ноды, в случае если вы устанавливаете etcd на них же

# this section (bootstrap) will be written into Etcd:/<namespace>/<scope>/config after initializing new cluster
# and all other cluster members will use it as a `global configuration`
bootstrap:
    dcs:
        ttl: 100
        loop_wait: 10
        retry_timeout: 10
        maximum_lag_on_failover: 1048576
        postgresql:
            use_pg_rewind: true
            use_slots: true
            parameters:
                    wal_level: replica
                    hot_standby: "on"
                    wal_keep_segments: 5120
                    max_wal_senders: 5
                    max_replication_slots: 5
                    checkpoint_timeout: 30

    initdb:
    - encoding: UTF8
    - data-checksums
    - locale: en_US.UTF8
    # init pg_hba.conf должен содержать адреса ВСЕХ машин, используемых в кластере
    pg_hba:
    - host replication postgres ::1/128 md5
    - host replication postgres 127.0.0.1/8 md5
    - host replication postgres 192.168.0.143/24 md5
    - host replication postgres 192.168.0.144/24 md5
    - host replication postgres 192.168.0.145/24 md5
    - host all all 0.0.0.0/0 md5

    users:
        admin:
            password: admin
            options:
                - createrole
                - createdb

postgresql:
    listen: 192.168.0.143:5432 # адрес той ноды, в которой находится этот файл
    connect_address: 192.168.0.143:5432 # адрес той ноды, в которой находится этот файл
    data_dir: /data/patroni # эту директорию создаст скрипт, описанный выше и установит нужные права
    bin_dir:  /usr/lib/postgresql/9.6/bin # укажите путь до вашей директории с postgresql
    pgpass: /tmp/pgpass
    authentication:
        replication:
            username: postgres
            password: postgres
        superuser:
            username: postgres
            password: postgres
    create_replica_methods:
        basebackup:
            checkpoint: 'fast'
    parameters:
        unix_socket_directories: '.'

tags:
    nofailover: false
    noloadbalance: false
    clonefrom: false
    nosync: false

Skrip harus dijalankan di ketiga mesin cluster, dan konfigurasi di atas juga harus ditempatkan di file /etc/patroni.yml di semua mesin.

Setelah Anda menyelesaikan operasi ini pada semua mesin di klaster, jalankan perintah berikut pada salah satu mesin tersebut

systemctl start patroni
systemctl start postgresql

Tunggu sekitar 30 detik, lalu jalankan perintah ini pada mesin yang tersisa di cluster.

proksi HA

Kami menggunakan HAproxy yang luar biasa untuk menyediakan satu titik masuk. Server master akan selalu tersedia di alamat mesin tempat HAproxy dikerahkan.

Agar mesin dengan HAproxy tidak menjadi satu titik kegagalan, kami akan meluncurkannya dalam wadah Docker; di masa depan mesin ini dapat diluncurkan ke cluster K8 dan menjadikan cluster failover kami lebih andal.

Buat direktori tempat Anda dapat menyimpan dua file - Dockerfile dan haproxy.cfg. Pergi ke sana.

Dockerfile

FROM ubuntu:latest

RUN apt-get update 
    && apt-get install -y haproxy rsyslog 
    && rm -rf /var/lib/apt/lists/*

RUN mkdir /run/haproxy

COPY haproxy.cfg /etc/haproxy/haproxy.cfg

CMD haproxy -f /etc/haproxy/haproxy.cfg && tail -F /var/log/haproxy.log

Hati-hati, tiga baris terakhir file haproxy.cfg harus mencantumkan alamat mesin Anda. HAproxy akan menghubungi Patroni, di header HTTP server master akan selalu mengembalikan 200, dan replika akan selalu mengembalikan 503.

haproxy.cfg

global
    maxconn 100

defaults
    log global
    mode tcp
    retries 2
    timeout client 30m
    timeout connect 4s
    timeout server 30m
    timeout check 5s

listen stats
    mode http
    bind *:7000
    stats enable
    stats uri /

listen postgres
    bind *:5000
    option httpchk
    http-check expect status 200
    default-server inter 3s fall 3 rise 2 on-marked-down shutdown-sessions
    server postgresql1 192.168.0.143:5432 maxconn 100 check port 8008
    server postgresql2 192.168.0.144:5432 maxconn 100 check port 8008
    server postgresql3 192.168.0.145:5432 maxconn 100 check port 8008

Berada di direktori di mana kedua file kita "berbohong", mari kita jalankan perintah untuk mengemas wadah secara berurutan, serta meluncurkannya dengan meneruskan port yang diperlukan:

docker build -t my-haproxy .
docker run -d -p5000:5000 -p7000:7000 my-haproxy 

Sekarang, dengan membuka alamat mesin Anda dengan HAproxy di browser dan menentukan port 7000, Anda akan melihat statistik cluster Anda.

Server yang menjadi master akan berada dalam keadaan UP, dan replikanya akan berada dalam keadaan DOWN. Ini normal, sebenarnya berfungsi, tetapi muncul seperti ini karena mengembalikan 503 untuk permintaan dari HAproxy. Hal ini memungkinkan kita untuk selalu mengetahui secara pasti mana dari tiga server yang merupakan master saat ini.

Kesimpulan

Kamu cantik! Hanya dalam 30 menit Anda telah menerapkan cluster database yang sangat toleran terhadap kesalahan dan berkinerja tinggi dengan replikasi streaming dan fallback otomatis. Jika Anda berencana menggunakan solusi ini, lihatlah dengan dokumentasi resmi Patroni, dan terutama terkait dengan utilitas patronictl, yang menyediakan akses mudah untuk mengelola cluster Anda.

Selamat!

Sumber: www.habr.com

Tambah komentar