Wal-g ක්රියා කරන ආකාරය පිළිබඳ විස්තර ලිපියෙන් සොයාගත හැකිය:
දත්ත ගබඩා කිරීම සඳහා S3 ගබඩා ප්රොටෝකෝලය ජනප්රිය වී ඇත. S3 හි ඇති එක් වාසියක් නම් API හරහා ප්රවේශ වීමේ හැකියාවයි, එමඟින් ඔබට පොදු කියවීම් ප්රවේශය ඇතුළුව ගබඩාව සමඟ නම්යශීලී අන්තර්ක්රියා සංවිධානය කිරීමට ඉඩ සලසයි, ගබඩාවේ තොරතුරු යාවත්කාලීන කිරීම සිදුවන්නේ බලයලත් පුද්ගලයින් විසින් පමණි.
S3 ප්රොටෝකෝලය භාවිතා කරන පොදු සහ පුද්ගලික ගබඩා ක්රියාත්මක කිරීම් කිහිපයක් තිබේ. අද අපි කුඩා ගබඩා සංවිධානය කිරීම සඳහා ජනප්රිය විසඳුමක් දෙස බලමු - Minio.
wal-g පරීක්ෂා කිරීම සඳහා තනි PostgreSQL සේවාදායකයක් සුදුසු වන අතර S3 සඳහා ආදේශකයක් ලෙස Minio භාවිතා වේ.
කුඩා සේවාදායකය
කුඩා ස්ථාපනය
yum -y install yum-plugin-copr
yum copr enable -y lkiesow/minio
yum install -y minio
/etc/minio/minio.conf හි AccessKey සහ SecretKey සංස්කරණය කරන්න
vi /etc/minio/minio.conf
ඔබ Minio වලට පෙර nginx භාවිතා නොකරන්නේ නම්, ඔබ වෙනස් කළ යුතුය
--address 127.0.0.1:9000
--address 0.0.0.0:9000
Minio දියත් කිරීම
systemctl start minio
Minio වෙබ් අතුරු මුහුණත වෙත යන්න
DB සේවාදායකය
rpm හි WAL-G මා විසින් (Anton Patsev) එකලස් කර ඇත.
RPM-පාදක පද්ධතියක් නොමැති අය, නිල භාවිතා කරන්න
wal-g ද්විමය සමඟින්, rpm හි /etc/wal-gd/server-s3.conf ගොනුවෙන් විචල්ය ආයාත කරන ස්ක්රිප්ට් අඩංගු වේ.
backup-fetch.sh
backup-list.sh
backup-push.sh
wal-fetch.sh
wal-g-run.sh
wal-push.sh
Walg ස්ථාපනය කරන්න.
yum -y install yum-plugin-copr
yum copr enable -y antonpatsev/wal-g
yum install -y wal-g
wal-g අනුවාදය පරීක්ෂා කිරීම.
wal-g --version
wal-g version v0.2.14
ඔබගේ අවශ්යතා අනුව /etc/wal-gd/server-s3.conf සංස්කරණය කරන්න.
දත්ත සමුදා පොකුරක් විසින් භාවිතා කරන වින්යාස ගොනු සහ දත්ත ගොනු සාම්ප්රදායිකව පොකුරු දත්ත නාමාවලියෙහි එකට ගබඩා කර ඇත, සාමාන්යයෙන් හඳුන්වනු ලබන්නේ PGDATA
#!/bin/bash
export PG_VER="9.6"
export WALE_S3_PREFIX="s3://pg-backups" # бакет, который мы создали в S3
export AWS_ACCESS_KEY_ID="xxxx" # AccessKey из /etc/minio/minio.conf
export AWS_ENDPOINT="http://ip-адрес-сервера-minio:9000"
export AWS_S3_FORCE_PATH_STYLE="true"
export AWS_SECRET_ACCESS_KEY="yyyy" # SecretKey из /etc/minio/minio.conf
export PGDATA=/var/lib/pgsql/$PG_VER/data/
export PGHOST=/var/run/postgresql/.s.PGSQL.5432 # Сокет для подключения к PostgreSQL
export WALG_UPLOAD_CONCURRENCY=2 # Кол-во потоков для закачки
export WALG_DOWNLOAD_CONCURRENCY=2 # Кол-во потоков для скачивания
export WALG_UPLOAD_DISK_CONCURRENCY=2 # Кол-во потоков на диске для закачки
export WALG_DELTA_MAX_STEPS=7
export WALG_COMPRESSION_METHOD=brotli # Какой метод сжатия использовать.
WAL-G වින්යාස කරන විට, ඔබ WALG_DELTA_MAX_STEPS සඳහන් කරයි - මූලික උපස්ථයෙන් ඩෙල්ටා උපස්ථය උපරිම වන පියවර ගණන, සහ ඩෙල්ටා පිටපත් ප්රතිපත්තිය සඳහන් කරන්න. එක්කෝ ඔබ අවසාන පවතින ඩෙල්ටාවෙන් පිටපතක් සාදන්න, නැතහොත් ඔබ මුල් සම්පූර්ණ උපස්ථයෙන් ඩෙල්ටාවක් සාදන්න. ඔබගේ දත්ත සමුදායේ එකම දත්ත සමුදාය සැමවිටම වෙනස් වන විට, එකම දත්ත නිරන්තරයෙන් වෙනස් වන අවස්ථාවක මෙය අවශ්ය වේ.
දත්ත සමුදාය ස්ථාපනය කිරීම.
yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.
noarch.rpm
yum install -y postgresql96 postgresql96-server mc
අපි දත්ත සමුදාය ආරම්භ කරමු.
/usr/pgsql-9.6/bin/postgresql96-setup initdb
Initializing database ... OK
ඔබ 1 සේවාදායකයක් මත පරීක්ෂා කරන්නේ නම්, 10 අනුවාදයට වඩා අඩු PostgreSQL සඳහා සංරක්ෂණය කිරීමට wal_level පරාමිතිය නැවත වින්යාස කිරීම අවශ්ය වේ, සහ PostgreSQL අනුවාදය 10 සහ පැරණි සඳහා අනුරුව.
wal_level = archive
PostgreSQL භාවිතයෙන්ම සෑම තත්පර 60කට වරක්ම WAL සංරක්ෂිත උපස්ථ කරමු. නිෂ්පාදන මත, ඔබට වෙනස් සංරක්ෂිත_කාලඉක්මීමේ අගයක් ඇත.
archive_mode = on
archive_command = '/usr/local/bin/wal-push.sh %p'
archive_timeout = 60 # Каждые 60 секунд будет выполнятся команда archive_command.
PostgreSQL ආරම්භ කිරීම
systemctl start postgresql-9.6
වෙනම කොන්සෝලයකදී, අපි දෝෂ සඳහා PostgreSQL ලොග් දෙස බලමු: (postgresql-Wed.log වත්මන් එකට වෙනස් කරන්න).
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log
අපි psql වෙත යමු.
su - postgres
psql
psql වලින් දත්ත සමුදායක් සාදන්න
දත්ත සමුදාය test1 හි වගුවක් සාදන්න.
create database test1;
දත්ත සමුදා පරීක්ෂණයට මාරු වන්න.
postgres=# c test1;
අපි වගුව සුචිගත කිරීමේ_වගුව සාදන්නෙමු.
test1=# CREATE TABLE indexing_table(created_at TIMESTAMP WITH TIME ZONE DEFAULT NOW());
දත්ත එකතු කිරීම.
අපි දත්ත ඇතුළත් කිරීමට පටන් ගනිමු. අපි විනාඩි 10-20 ක් බලා සිටිමු.
#!/bin/bash
# postgres
while true; do
psql -U postgres -d test1 -c "INSERT INTO indexing_table(created_at) VALUES (CURRENT_TIMESTAMP);"
sleep 60;
done
සම්පූර්ණ උපස්ථයක් සෑදීමට වග බලා ගන්න.
su - postgres
/usr/local/bin/backup-push.sh
අපි දත්ත සමුදාය test1 හි වගුවේ ඇති වාර්තා දෙස බලමු
select * from indexing_table;
2020-01-29 09:41:25.226198+
2020-01-29 09:42:25.336989+
2020-01-29 09:43:25.356069+
2020-01-29 09:44:25.37381+
2020-01-29 09:45:25.392944+
2020-01-29 09:46:25.412327+
2020-01-29 09:47:25.432564+
2020-01-29 09:48:25.451985+
2020-01-29 09:49:25.472653+
2020-01-29 09:50:25.491974+
2020-01-29 09:51:25.510178+
තන්තුව වත්මන් වේලාවයි.
සම්පූර්ණ උපස්ථ ලැයිස්තුව බලන්න
/usr/local/bin/backup-list.sh
ප්රතිසාධන පරීක්ෂණය
පවතින සියලුම WAL පෙරළීම සමඟ සම්පූර්ණ ප්රතිසාධනය.
Postgresql නවත්වන්න.
/var/lib/pgsql/9.6/data ෆෝල්ඩරයෙන් සියල්ල මකන්න.
postgres පරිශීලකයා ලෙස /usr/local/bin/backup-fetch.sh ස්ක්රිප්ට් ධාවනය කරන්න.
su - postgres
/usr/local/bin/backup-fetch.sh
උපස්ථ නිස්සාරණය සම්පූර්ණයි.
පහත අන්තර්ගතය සහිත /var/lib/pgsql/9.6/data ෆෝල්ඩරය වෙත recovery.conf එක් කරන්න.
restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'
අපි PostgreSQL ආරම්භ කරමු. PostgreSQL විසින් සංරක්ෂිත WAL වලින් ප්රතිසාධන ක්රියාවලිය ආරම්භ කරනු ඇත, පසුව පමණක් දත්ත සමුදාය විවෘත වේ.
systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log
නිශ්චිත කාලයක් සඳහා ප්රකෘතිමත් වීම.
අපට නිශ්චිත මිනිත්තුවක් දක්වා දත්ත සමුදාය ප්රතිසාධනය කිරීමට අවශ්ය නම්, අපි recovery_target_time පරාමිතිය recovery.conf වෙත එක් කරන්නෙමු - දත්ත සමුදාය ප්රතිසාධනය කරන්නේ කුමන වේලාවකදැයි අපි දක්වන්නෙමු.
restore_command = '/usr/local/bin/wal-fetch.sh "%f" "%p"'
recovery_target_time = '2020-01-29 09:46:25'
ප්රතිසාධනයෙන් පසු, වගුව සුචිගත කිරීමේ_වගුව බලන්න
2020-01-29 09:41:25.226198+00
2020-01-29 09:42:25.336989+00
2020-01-29 09:43:25.356069+00
2020-01-29 09:44:25.37381+00
2020-01-29 09:45:25.392944+00
අපි PostgreSQL ආරම්භ කරමු. PostgreSQL විසින් සංරක්ෂිත WAL වලින් ප්රතිසාධන ක්රියාවලිය ආරම්භ කරනු ඇත, පසුව පමණක් දත්ත සමුදාය විවෘත වේ.
systemctl start postgresql-9.6
tail -fn100 /var/lib/pgsql/9.6/data/pg_log/postgresql-Wed.log
පරීක්ෂා කිරීම
මෙහි විස්තර කර ඇති පරිදි 1GB දත්ත සමුදායක් උත්පාදනය කිරීම
1GB දත්ත ජනනය කිරීමෙන් පසු බාල්දියේ ප්රමාණය ඉල්ලා සිටීම.
postgres=# SELECT pg_size_pretty(pg_database_size('test1'));
pg_size_pretty
----------------
1003 MB
s4cmd යනු Amazon S3 ගබඩාවේ පවතින දත්ත සමඟ වැඩ කිරීම සඳහා නොමිලේ විධාන රේඛා මෙවලමකි. උපයෝගීතාව python ක්රමලේඛන භාෂාවෙන් ලියා ඇති අතර මේ නිසා එය Windows සහ Linux මෙහෙයුම් පද්ධති දෙකෙහිම භාවිතා කළ හැක.
s4cmd ස්ථාපනය කිරීම
pip install s4cmd
LZ4
s4cmd --endpoint-url=http://ip-адрес-сервера-minio:9000 --access-key=xxxx --secret-key=yyyy du -r s3://pg-backups
840540822 s3://pg-backups/wal_005/
840 МБ в формате lz4 только WAL логов
Полный бекап с lz4 - 1GB данных
time backup_push.sh
real 0m18.582s
Размер S3 бакета после полного бекапа
581480085 s3://pg-backups/basebackups_005/
842374424 s3://pg-backups/wal_005
581 МБ занимает полный бекап
LZMA
После генерации 1ГБ данных
338413694 s3://pg-backups/wal_005/
338 мб логов в формате lzma
Время генерации полного бекапа
time backup_push.sh
real 5m25.054s
Размер бакета в S3
270310495 s3://pg-backups/basebackups_005/
433485092 s3://pg-backups/wal_005/
270 мб занимает полный бекап в формате lzma
බ්රොට්ලි
После генерации 1ГБ данных
459229886 s3://pg-backups/wal_005/
459 мб логов в формате brotli
Время генерации полного бекапа
real 0m23.408s
Размер бакета в S3
312960942 s3://pg-backups/basebackups_005/
459309262 s3://pg-backups/wal_005/
312 мб занимает полный бекап в формате brotli
ප්රස්ථාරයේ ප්රතිඵල සංසන්දනය කිරීම.
ඔබට පෙනෙන පරිදි, Brotli ප්රමාණයෙන් LZMA හා සැසඳිය හැකි නමුත් උපස්ථය LZ4 වේලාවෙන් සිදු කෙරේ.
රුසියානු කතා කරන PostgreSQL ප්රජාවේ කතාබස්:
ඔබ භාවිතා කරන්නේ නම් කරුණාකර Github වෙත තරුවක් දෙන්න
මූලාශ්රය: www.habr.com