پسوند pgsentinel :
«تمام اطلاعات انباشته شده فقط در RAM ذخیره می شود و میزان حافظه مصرفی با تعداد آخرین رکوردهای ذخیره شده تنظیم می شود.
فیلد queryid اضافه شده است - همان queryid از پسوند pg_stat_statements (پیش نصب لازم است).«
البته این خیلی کمک میکند، اما دردسرسازترین نکته اولین نکته است.»تمام اطلاعات انباشته شده فقط در RAM ذخیره می شود "، یعنی بر پایه هدف تأثیر می گذارد. علاوه بر این، تاریخچه قفل و آمار جدول وجود ندارد. آن ها راه حل به طور کلی ناقص است:هنوز پکیج آماده ای برای نصب وجود ندارد. پیشنهاد می شود خودتان منابع را دانلود و کتابخانه را جمع آوری کنید. ابتدا باید بسته “devel” را برای سرور خود نصب کنید و مسیر را روی pg_config در متغیر PATH تنظیم کنید.".
در کل هیاهو زیاد است و در مورد دیتابیس های تولیدی جدی شاید نتوان کاری با سرور انجام داد. ما باید دوباره چیزی از خودمان پیدا کنیم.
اخطار.
به دلیل حجم نسبتاً زیاد و به دلیل ناقص بودن دوره آزمایشی، مقاله عمدتاً جنبه اطلاعاتی دارد و به عنوان مجموعه ای از پایان نامه ها و نتایج میانی است.
مطالب دقیق تر بعداً در قسمت هایی تهیه خواهد شد
پیش نویس الزامات راه حل
لازم است ابزاری ایجاد کنید که به شما امکان می دهد ذخیره کنید:
تاریخچه مشاهده pg_stat_activity تاریخچه قفل جلسه با استفاده از نمای pg_locks
نیاز راه حل-تاثیر را بر پایگاه داده هدف به حداقل برسانید.
ایده کلی- عامل جمع آوری داده ها نه در پایگاه داده هدف، بلکه در پایگاه داده نظارت به عنوان یک سرویس systemd راه اندازی می شود. بله، مقداری از دست دادن داده ها ممکن است، اما این برای گزارش گیری حیاتی نیست، اما هیچ تاثیری بر پایگاه داده هدف از نظر حافظه و فضای دیسک ندارد. و در مورد استفاده از یک استخر اتصال، تأثیر آن بر فرآیندهای کاربر حداقل است.
مراحل اجرا
1. جداول سرویس
یک طرح واره جداگانه برای ذخیره جداول استفاده می شود تا تجزیه و تحلیل جداول اصلی مورد استفاده را پیچیده نکند.
DROP SCHEMA IF EXISTS activity_hist ;
CREATE SCHEMA activity_hist AUTHORIZATION monitor ;
مهم: طرحواره در پایگاه داده هدف ایجاد نمی شود، بلکه در پایگاه داده نظارت ایجاد می شود.
تاریخچه مشاهده pg_stat_activity
یک جدول برای ذخیره عکس های فوری فعلی نمای pg_stat_activity استفاده می شود
activity_hist.history_pg_stat_activity:
--ACTIVITY_HIST.HISTORY_PG_STAT_ACTIVITY
DROP TABLE IF EXISTS activity_hist.history_pg_stat_activity;
CREATE TABLE activity_hist.history_pg_stat_activity
(
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text ,
queryid bigint
);
برای سرعت بخشیدن به درج - بدون فهرست یا محدودیت.
برای ذخیره خود تاریخچه، از جدول پارتیشن بندی شده استفاده می شود:
activity_hist.archive_pg_stat_activity:
DROP TABLE IF EXISTS activity_hist.archive_pg_stat_activity;
CREATE TABLE activity_hist.archive_pg_stat_activity
(
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text ,
queryid bigint
)
PARTITION BY RANGE (timepoint);
از آنجایی که در این مورد هیچ الزامی برای سرعت درج وجود ندارد، برخی از شاخص ها برای سرعت بخشیدن به ایجاد گزارش ایجاد شده اند.
تاریخچه مسدود کردن جلسه
یک جدول برای ذخیره عکس های لحظه ای فعلی از قفل های جلسه استفاده می شود:
activity_hist.history_locking:
--ACTIVITY_HIST.HISTORY_LOCKING
DROP TABLE IF EXISTS activity_hist.history_locking;
CREATE TABLE activity_hist.history_locking
(
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
);
همچنین برای سرعت بخشیدن به درج، هیچ فهرست یا محدودیتی وجود ندارد.
برای ذخیره خود تاریخچه، از جدول پارتیشن بندی شده استفاده می شود:
activity_hist.archive_locking:
DROP TABLE IF EXISTS activity_hist.archive_locking;
CREATE TABLE activity_hist.archive_locking
(
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
)
PARTITION BY RANGE (timepoint);
از آنجایی که در این مورد هیچ الزامی برای سرعت درج وجود ندارد، برخی از شاخص ها برای سرعت بخشیدن به ایجاد گزارش ایجاد شده اند.
2. پر کردن تاریخچه فعلی
برای جمعآوری مستقیم عکسهای فوری، از یک اسکریپت bash استفاده میشود که تابع plpgsql را اجرا میکند.
plpgsql تابع dblink به نماها در پایگاه داده هدف دسترسی پیدا می کند و ردیف ها را در جداول سرویس در پایگاه داده مانیتورینگ قرار می دهد.
get_current_activity.sql
CREATE OR REPLACE FUNCTION activity_hist.get_current_activity( current_host text , current_s_name text , current_s_pass text ) RETURNS BOOLEAN AS $$
DECLARE
database_rec record;
dblink_str text ;
BEGIN
EXECUTE 'SELECT dblink_connect(''LINK1'',''host='||current_host||' port=5432 dbname=postgres'||
' user='||current_s_name||' password='||current_s_pass|| ' '')';
--------------------------------------------------------------------
--GET pg_stat_activity stats
INSERT INTO activity_hist.history_pg_stat_activity
(
SELECT * FROM dblink('LINK1',
'SELECT
now() ,
datid ,
datname ,
pid ,
usesysid ,
usename ,
application_name ,
client_addr ,
client_hostname ,
client_port ,
backend_start ,
xact_start ,
query_start ,
state_change ,
wait_event_type ,
wait_event ,
state ,
backend_xid ,
backend_xmin ,
query ,
backend_type
FROM pg_stat_activity
')
AS t (
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text
)
);
---------------------------------------
--ACTIVITY_HIST.HISTORY_LOCKING
INSERT INTO activity_hist.history_locking
(
SELECT * FROM dblink('LINK1',
'SELECT
now() ,
lock.locktype,
lock.relation,
lock.mode,
lock.transactionid as tid,
lock.virtualtransaction as vtid,
lock.pid,
pg_blocking_pids(lock.pid),
lock.granted
FROM pg_catalog.pg_locks lock LEFT JOIN pg_catalog.pg_database db ON db.oid = lock.database
WHERE NOT lock.pid = pg_backend_pid()
')
AS t (
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
)
);
PERFORM dblink_disconnect('LINK1');
RETURN TRUE ;
END
$$ LANGUAGE plpgsql;
برای جمعآوری عکسهای فوری، از سرویس systemd و دو اسکریپت استفاده میشود:
pg_current_activity.service
# /etc/systemd/system/pg_current_activity.service
[Unit]
Description=Collect history of pg_stat_activity , pg_locks
Wants=pg_current_activity.timer
[Service]
Type=forking
StartLimitIntervalSec=0
ExecStart=/home/postgres/pgutils/demon/get_current_activity.sh 10.124.70.40 postgres postgres
[Install]
WantedBy=multi-user.target
pg_current_activity.timer
# /etc/systemd/system/pg_current_activity.timer
[Unit]
Description=Run pg_current_activity.sh every 1 second
Requires=pg_current_activity.service
[Timer]
Unit=pg_current_activity.service
OnCalendar=*:*:0/1
AccuracySec=1
[Install]
WantedBy=timers.target
اختصاص حقوق به اسکریپت ها:
# chmod 755 pg_current_activity.timer
# chmod 755 pg_current_activity.service
بیایید سرویس را شروع کنیم:
# systemctl daemon-reload
# systemctl pg_current_activity.service را شروع کنید
بدین ترتیب تاریخچه نماها در قالب عکس های فوری ثانیه به ثانیه جمع آوری می شود. البته اگر همه چیز به همین شکل باقی بماند، اندازه میزها خیلی سریع افزایش می یابد و کار کم و بیش سازنده غیرممکن می شود.
سازماندهی آرشیو داده ها ضروری است.
3. تاریخچه بایگانی
برای بایگانی از آرشیو جداول پارتیشن بندی شده* استفاده می شود.
پارتیشنهای جدید هر ساعت ایجاد میشوند، در حالی که دادههای قدیمی از جداول تاریخ* حذف میشوند، بنابراین اندازه جداول تاریخ* تغییر زیادی نمیکند و سرعت درج با گذشت زمان کاهش نمییابد.
ایجاد بخش های جدید توسط تابع plpgsql activity_hist.archive_current_activity انجام می شود. الگوریتم کار بسیار ساده است (با استفاده از مثال قسمت جدول archive_pg_stat_activity).
یک بخش جدید ایجاد و پر کنید
EXECUTE format(
'CREATE TABLE ' || partition_name ||
' PARTITION OF activity_hist.archive_pg_stat_activity FOR VALUES FROM ( %L ) TO ( %L ) ' ,
to_char(date_trunc('year', partition_min_range ),'YYYY')||'-'||
to_char(date_trunc('month', partition_min_range ),'MM')||'-'||
to_char(date_trunc('day', partition_min_range ),'DD')||' '||
to_char(date_trunc('hour', partition_min_range ),'HH24')||':00',
to_char(date_trunc('year', partition_max_range ),'YYYY')||'-'||
to_char(date_trunc('month', partition_max_range ),'MM')||'-'||
to_char(date_trunc('day', partition_max_range ),'DD')||' '||
to_char(date_trunc('hour', partition_max_range ),'HH24')||':00'
);
INSERT INTO activity_hist.archive_pg_stat_activity
(
SELECT *
FROM activity_hist.history_pg_stat_activity
WHERE timepoint BETWEEN partition_min_range AND partition_max_range
);
ایجاد نمایه ها
EXECUTE format (
'CREATE INDEX '||index_name||
' ON '||partition_name||' ( wait_event_type , backend_type , timepoint )'
);
EXECUTE format ('CREATE INDEX '||index_name||
' ON '||partition_name||' ( wait_event_type , backend_type , timepoint , queryid )'
);
حذف داده های قدیمی از جدول history_pg_stat_activity
DELETE
FROM activity_hist.history_pg_stat_activity
WHERE timepoint < partition_max_range;
البته هر از چند گاهی قسمت های قدیمی به عنوان غیر ضروری حذف می شوند.
گزارش های اساسی
در واقع چرا این همه انجام می شود؟ برای به دست آوردن گزارش هایی که بسیار مبهم یادآور AWR اوراکل است.
اضافه کردن این نکته ضروری است که برای دریافت گزارش ها باید بین نماهای pg_stat_activity و pg_stat_statements ارتباط برقرار کنید. جداول با افزودن یک ستون "queryid" به جداول "history_pg_stat_activity"، "archive_pg_stat_activity" مرتبط می شوند. روش افزودن مقدار ستون خارج از محدوده این مقاله است و در اینجا توضیح داده شده است pg_stat_statements + pg_stat_activity + loq_query = pg_ash؟ .
کل زمان CPU برای پرسش ها
درخواست :
WITH hist AS
(
SELECT
aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND backend_type = 'client backend' AND datname != 'postgres' AND ( aa.wait_event_type IS NULL ) ANDaa.state = 'active'
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND backend_type = 'client backend' AND datname != 'postgres' AND ( ha.wait_event_type IS NULL )AND ha.state = 'active'
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
WITH hist AS
(
SELECT
aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( aa.wait_event_type IS NOT NULL )
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( ha.wait_event_type IS NOT NULL )
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
WITH hist AS
(
SELECT
aa.wait_event_type , aa.wait_event
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
aa.wait_event IS NOT NULL
GROUP BY aa.wait_event_type , aa.wait_event
UNION
SELECT
ha.wait_event_type , ha.wait_event
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
ha.wait_event IS NOT NULL
GROUP BY ha.wait_event_type , ha.wait_event
)
SELECT wait_event_type , wait_event
FROM hist
GROUP BY wait_event_type , wait_event
ORDER BY 1 ASC,2 ASC
----------------------------------------------------------------------
WITH hist AS
(
SELECT
aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( aa.wait_event_type = waitings_stat_rec.wait_event_type AND aa.wait_event = waitings_stat_rec.wait_event )
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( ha.wait_event_type = waitings_stat_rec.wait_event_type AND ha.wait_event = waitings_stat_rec.wait_event )
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
SELECT
MIN(date_trunc('second',timepoint)) AS started ,
count(*) * interval '1 second' as duration ,
pid , blocking_pids , relation , mode , locktype
FROM
activity_hist.archive_locking al
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY pid , blocking_pids , relation , mode , locktype
UNION
SELECT
MIN(date_trunc('second',timepoint)) AS started ,
count(*) * interval '1 second' as duration ,
pid , blocking_pids , relation , mode , locktype
FROM
activity_hist.history_locking
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY pid , blocking_pids , relation , mode , locktype
ORDER BY 1
SELECT
blocking_pids
FROM
activity_hist.archive_locking al
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY blocking_pids
UNION
SELECT
blocking_pids
FROM
activity_hist.history_locking
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY blocking_pids
ORDER BY 1
---------------------------------------------------------------
SELECT
pid , usename , application_name , datname ,
MIN(date_trunc('second',timepoint)) as started ,
count(*) * interval '1 second' as duration ,
state ,
query
FROM activity_hist.archive_pg_stat_activity
WHERE pid= current_pid AND
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour')
GROUP BY pid , usename , application_name ,
datname ,
state_change,
state ,
query
UNION
SELECT
pid , usename , application_name , datname ,
MIN(date_trunc('second',timepoint)) as started ,
count(*) * interval '1 second' as duration ,
state ,
query
FROM activity_hist.history_pg_stat_activity_for_reports
WHERE pid= current_pid AND
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour')
GROUP BY pid , usename , application_name ,
datname ,
state_change,
state ,
query
ORDER BY 5 , 1
پرسشهای اساسی نشاندادهشده و گزارشهای بهدستآمده در حال حاضر هنگام تجزیه و تحلیل رویدادهای عملکرد، زندگی را بسیار آسانتر میکنند.
بر اساس پرس و جوهای اولیه، می توانید گزارشی دریافت کنید که به طور مبهم شبیه AWR اوراکل است. نمونه گزارش خلاصه
+----------------------------------------------- ----------------------------------- | گزارش تلفیقی برای فعالیت و انتظارات.
ادامه دارد. در ردیف بعدی ایجاد یک تاریخچه قفل (pg_stat_locks) است که شرح مفصل تری از فرآیند پر کردن جداول است.