بناء مجموعة PostgreSQL عالية التوفر باستخدام Patroni ، etcd ، HAProxy

لقد حدث أنه في وقت تحديد المهمة ، لم تكن لدي درجة كافية من الخبرة لتطوير وتشغيل هذا الحل بمفردي. وبعد ذلك بدأت في googling.

لا أعرف ما هو المصيد ، ولكن للمرة الألف صادفت حقيقة أنه حتى لو فعلت كل شيء خطوة بخطوة كما هو الحال في البرنامج التعليمي ، جهز نفس البيئة مثل بيئة المؤلف ، فلن يعمل أبدًا. ليس لدي أي فكرة عما هو الأمر ، لكن عندما واجهت هذا مرة أخرى ، قررت - وسأكتب تعليمي عندما يعمل كل شيء. واحد من المؤكد أنه سيعمل.

أدلة على الإنترنت

يحدث فقط أن الإنترنت لا يعاني من نقص في العديد من الأدلة والبرامج التعليمية وخطوات خطوة بخطوة وما شابه. لقد حدث أن تم تكليفي بمهمة تطوير حل لتنظيم وبناء مجموعة تجاوز فشل PostgreSQL بشكل ملائم ، والتي كانت المتطلبات الرئيسية لها هي دفق النسخ المتماثل من الخادم الرئيسي إلى جميع النسخ المتماثلة والرجوع التلقائي عند فشل الخادم الرئيسي.

في هذه المرحلة ، تم تحديد مجموعة التقنيات المستخدمة:

  • PostgreSQL باعتباره DBMS
  • باتروني كحل تجمعي
  • إلخ كمخزن موزع لـ Patroni
  • HAproxy لتنظيم نقطة دخول واحدة للتطبيقات التي تستخدم قاعدة البيانات

تركيب

ينصب اهتمامك على بناء مجموعة PostgreSQL عالية التوفر باستخدام Patroni ، etcd ، HAProxy.

تم إجراء جميع العمليات على أجهزة افتراضية مثبت عليها نظام تشغيل Debian 10.

إلخ

لا أوصي بتثبيت etcd على نفس الأجهزة حيث سيكون موقع patroni و postgresql ، نظرًا لأن تحميل القرص مهم جدًا بالنسبة إلى الخ. لكن للأغراض التعليمية ، سنفعل ذلك بالضبط.
تثبيت إلخ.

#!/bin/bash
apt-get update
apt-get install etcd

أضف محتوى إلى ملف / etc / default / etcd

[عضو]

ETCD_NAME = datanode1 # اسم مضيف جهازك
ETCD_DATA_DIR = "/ var / lib / etcd / default.etcd"

يجب أن تكون جميع عناوين IP صالحة. يجب تعيين LISTER PEER أو CLIENT إلخ على عنوان IP الخاص بالمضيف

ETCD_LISTEN_PEER_URLS = "http://192.168.0.143:2380»# عنوان جهازك
ETCD_LISTEN_CLIENT_URLS = "http://192.168.0.143:2379,http://127.0.0.1:2379»# عنوان جهازك

[تَجَمَّع]

ETCD_INITIAL_ADVERTISE_PEER_URLS = "http://192.168.0.143:2380»# عنوان جهازك
ETCD_INITIAL_CLUSTER = "رمز البيانات 1 =http://192.168.0.143:2380,datanode2=http://192.168.0.144:2380,datanode3=http://192.168.0.145:2380»# عناوين لجميع الآلات في المجموعة الخ
ETCD_INITIAL_CLUSTER_STATE = "جديد"
ETCD_INITIAL_CLUSTER_TOKEN = "etcd-الكتلة -1"
ETCD_ADVERTISE_CLIENT_URLS = "http://192.168.0.143:2379»# عنوان جهازك

نفّذ الأمر

systemctl restart etcd

PostgreSQL 9.6 + مستفيد

أول شيء يجب القيام به هو إعداد ثلاثة أجهزة افتراضية لتثبيت البرامج اللازمة عليها. بعد تثبيت الأجهزة ، إذا اتبعت البرنامج التعليمي الخاص بي ، فيمكنك تشغيل هذا البرنامج النصي البسيط الذي سيفعل (تقريبًا) كل شيء من أجلك. يعمل كجذر.

يرجى ملاحظة أن البرنامج النصي يستخدم إصدار PostgreSQL 9.6 ، ويرجع ذلك إلى المتطلبات الداخلية لشركتنا. لم يتم اختبار الحل على إصدارات PostgreSQL الأخرى.

#!/bin/bash
apt-get install gnupg -y
echo "deb http://apt.postgresql.org/pub/repos/apt/ buster-pgdg main" >> /etc/apt/sources.list
wget --quiet -O - https://www.postgresql.org/media/keys/ACCC4CF8.asc | apt-key add -
apt-get update
apt-get install postgresql-9.6 python3-pip python3-dev libpq-dev -y
systemctl stop postgresql
pip3 install --upgrade pip
pip install psycopg2
pip install patroni[etcd]
echo "
[Unit]
Description=Runners to orchestrate a high-availability PostgreSQL
After=syslog.target network.target

[Service]
Type=simple

User=postgres
Group=postgres

ExecStart=/usr/local/bin/patroni /etc/patroni.yml

KillMode=process

TimeoutSec=30

Restart=no

[Install]
WantedBy=multi-user.targ
" > /etc/systemd/system/patroni.service
mkdir -p /data/patroni
chown postgres:postgres /data/patroni
chmod 700 /data/patroniпо
touch /etc/patroni.yml

بعد ذلك ، في ملف /etc/patroni.yml الذي أنشأته للتو ، تحتاج إلى وضع المحتوى التالي ، بالطبع تغيير عناوين IP في جميع الأماكن إلى العناوين التي تستخدمها.
انتبه للتعليقات في هذا yaml. قم بتغيير العناوين إلى عناوينك الخاصة ، على كل جهاز في المجموعة.

/etc/patroni.yml

scope: pgsql # должно быть одинаковым на всех нодах
namespace: /cluster/ # должно быть одинаковым на всех нодах
name: postgres1 # должно быть разным на всех нодах

restapi:
    listen: 192.168.0.143:8008 # адрес той ноды, в которой находится этот файл
    connect_address: 192.168.0.143:8008 # адрес той ноды, в которой находится этот файл

etcd:
    hosts: 192.168.0.143:2379,192.168.0.144:2379,192.168.0.145:2379 # перечислите здесь все ваши ноды, в случае если вы устанавливаете etcd на них же

# this section (bootstrap) will be written into Etcd:/<namespace>/<scope>/config after initializing new cluster
# and all other cluster members will use it as a `global configuration`
bootstrap:
    dcs:
        ttl: 100
        loop_wait: 10
        retry_timeout: 10
        maximum_lag_on_failover: 1048576
        postgresql:
            use_pg_rewind: true
            use_slots: true
            parameters:
                    wal_level: replica
                    hot_standby: "on"
                    wal_keep_segments: 5120
                    max_wal_senders: 5
                    max_replication_slots: 5
                    checkpoint_timeout: 30

    initdb:
    - encoding: UTF8
    - data-checksums
    - locale: en_US.UTF8
    # init pg_hba.conf должен содержать адреса ВСЕХ машин, используемых в кластере
    pg_hba:
    - host replication postgres ::1/128 md5
    - host replication postgres 127.0.0.1/8 md5
    - host replication postgres 192.168.0.143/24 md5
    - host replication postgres 192.168.0.144/24 md5
    - host replication postgres 192.168.0.145/24 md5
    - host all all 0.0.0.0/0 md5

    users:
        admin:
            password: admin
            options:
                - createrole
                - createdb

postgresql:
    listen: 192.168.0.143:5432 # адрес той ноды, в которой находится этот файл
    connect_address: 192.168.0.143:5432 # адрес той ноды, в которой находится этот файл
    data_dir: /data/patroni # эту директорию создаст скрипт, описанный выше и установит нужные права
    bin_dir:  /usr/lib/postgresql/9.6/bin # укажите путь до вашей директории с postgresql
    pgpass: /tmp/pgpass
    authentication:
        replication:
            username: postgres
            password: postgres
        superuser:
            username: postgres
            password: postgres
    create_replica_methods:
        basebackup:
            checkpoint: 'fast'
    parameters:
        unix_socket_directories: '.'

tags:
    nofailover: false
    noloadbalance: false
    clonefrom: false
    nosync: false

يجب تشغيل البرنامج النصي على جميع الأجهزة الثلاثة في المجموعة ، تمامًا كما يجب وضع التكوين أعلاه في ملف /etc/patroni.yml على جميع الأجهزة.

عند الانتهاء من هذه العمليات على جميع أجهزة الكتلة ، قم بتشغيل الأمر التالي على أي منها

systemctl start patroni
systemctl start postgresql

انتظر حوالي 30 ثانية ، ثم قم بتشغيل هذا الأمر على بقية الأجهزة في الكتلة.

هابروكسي

نستخدم HAproxy الرائع لتوفير نقطة دخول واحدة. سيكون الخادم الرئيسي متاحًا دائمًا على عنوان الجهاز حيث يتم نشر HAproxy.

من أجل عدم جعل الجهاز باستخدام HAproxy نقطة فشل واحدة ، سنقوم بتشغيله في حاوية Docker ، في المستقبل سيكون من الممكن تشغيله في مجموعة K8 وجعل مجموعة تجاوز الفشل لدينا أكثر موثوقية.

قم بإنشاء دليل حيث يمكنك تخزين ملفين - Dockerfile و haproxy.cfg. اذهب إليه.

Dockerfile

FROM ubuntu:latest

RUN apt-get update 
    && apt-get install -y haproxy rsyslog 
    && rm -rf /var/lib/apt/lists/*

RUN mkdir /run/haproxy

COPY haproxy.cfg /etc/haproxy/haproxy.cfg

CMD haproxy -f /etc/haproxy/haproxy.cfg && tail -F /var/log/haproxy.log

كن حذرًا ، يجب أن تسرد الأسطر الثلاثة الأخيرة من ملف haproxy.cfg عناوين أجهزتك. سيتصل HAproxy بـ Patroni ، في رؤوس HTTP ، سيعود الخادم الرئيسي دائمًا 200 ، وستعيد النسخة المتماثلة دائمًا 503.

haproxy.cfg

global
    maxconn 100

defaults
    log global
    mode tcp
    retries 2
    timeout client 30m
    timeout connect 4s
    timeout server 30m
    timeout check 5s

listen stats
    mode http
    bind *:7000
    stats enable
    stats uri /

listen postgres
    bind *:5000
    option httpchk
    http-check expect status 200
    default-server inter 3s fall 3 rise 2 on-marked-down shutdown-sessions
    server postgresql1 192.168.0.143:5432 maxconn 100 check port 8008
    server postgresql2 192.168.0.144:5432 maxconn 100 check port 8008
    server postgresql3 192.168.0.145:5432 maxconn 100 check port 8008

كوننا في الدليل الذي "يقع" فيه كلا الملفين ، سنقوم بتنفيذ الأوامر بالتسلسل لتعبئة الحاوية ، بالإضافة إلى تشغيلها بالمنافذ الضرورية المعاد توجيهها:

docker build -t my-haproxy .
docker run -d -p5000:5000 -p7000:7000 my-haproxy 

الآن ، عند فتح عنوان جهازك باستخدام HAproxy في المستعرض وتحديد المنفذ 7000 ، سترى إحصائيات المجموعة الخاصة بك.

سيكون الخادم الرئيسي في حالة UP ، وستكون النسخ المتماثلة في حالة DOWN. هذا أمر طبيعي ، في الواقع أنها تعمل ، ولكن يتم عرضها في هذا النموذج نظرًا لحقيقة أنها تقوم بإرجاع 503 عند الطلبات الواردة من HAproxy. هذا يسمح لنا دائمًا بمعرفة أي من الخوادم الثلاثة هو الخادم الرئيسي الحالي.

اختتام

انت جذاب! في 30 دقيقة فقط ، قمت بنشر مجموعة رائعة من تجاوز الفشل وقاعدة بيانات الأداء مع النسخ المتماثل المتدفق وتجاوز الفشل التلقائي. إذا كنت تخطط لاستخدام هذا الحل ، من فضلك انظر مع وثائق Patroni الرسمية، وخاصة الجزء المتعلق بأداة المستفيد ، التي توفر وصولاً سهلاً لإدارة المجموعة الخاصة بك.

تهانينا!

المصدر: www.habr.com

إضافة تعليق