ملحق pgsentinel :
«يتم تخزين جميع المعلومات المتراكمة في ذاكرة الوصول العشوائي فقط ، ويتم تنظيم مقدار الذاكرة المستهلكة من خلال عدد السجلات المخزنة الأخيرة.
تمت إضافة حقل معرّف الاستعلام - نفس معرّف الاستعلام من الامتداد pg_stat_statements (يلزم التثبيت المسبق).«
وهذا بالطبع سيساعد كثيرا، ولكن الشيء الأكثر إزعاجا هو النقطة الأولى.يتم تخزين كافة المعلومات المتراكمة فقط في ذاكرة الوصول العشوائي "، أي. هناك تأثير على القاعدة المستهدفة. بالإضافة إلى ذلك، لا يوجد سجل قفل وإحصائيات الجدول. أولئك. الحل بشكل عام غير مكتمل: "لا توجد حزمة جاهزة للتثبيت حتى الآن. يُقترح تنزيل المصادر وتجميع المكتبة بنفسك. تحتاج أولاً إلى تثبيت حزمة "devel" لخادمك وتعيين المسار إلى pg_config في متغير PATH.".
بشكل عام، هناك الكثير من الضجة، وفي حالة قواعد بيانات الإنتاج الجادة، قد لا يكون من الممكن فعل أي شيء مع الخادم. نحن بحاجة إلى التوصل إلى شيء خاص بنا مرة أخرى.
تحذير.
نظرًا للحجم الكبير نوعًا ما وبسبب فترة الاختبار غير المكتملة، فإن المقالة ذات طبيعة إعلامية بشكل أساسي، بدلاً من كونها مجموعة من الأطروحات والنتائج المتوسطة.
سيتم إعداد المزيد من المواد التفصيلية لاحقًا، على أجزاء
مشروع متطلبات الحل
من الضروري تطوير أداة تسمح لك بتخزين:
pg_stat_activity عرض التاريخ سجل قفل الجلسة باستخدام عرض pg_locks
متطلبات الحل-تقليل التأثير على قاعدة البيانات الهدف.
فكرة عامة- لا يتم إطلاق وكيل جمع البيانات في قاعدة البيانات الهدف، ولكن في قاعدة بيانات المراقبة كخدمة systemd. نعم، من الممكن فقدان بعض البيانات، ولكن هذا ليس بالغ الأهمية لإعداد التقارير، ولكن ليس هناك أي تأثير على قاعدة البيانات الهدف من حيث الذاكرة ومساحة القرص. وفي حالة استخدام تجمع اتصال، يكون التأثير على عمليات المستخدم ضئيلًا.
مراحل التنفيذ
1. جداول الخدمة
يتم استخدام مخطط منفصل لتخزين الجداول، حتى لا يؤدي إلى تعقيد تحليل الجداول الرئيسية المستخدمة.
DROP SCHEMA IF EXISTS activity_hist ;
CREATE SCHEMA activity_hist AUTHORIZATION monitor ;
هام: لا يتم إنشاء المخطط في قاعدة البيانات الهدف، ولكن في قاعدة بيانات المراقبة.
pg_stat_activity عرض التاريخ
يتم استخدام جدول لتخزين اللقطات الحالية لعرض pg_stat_activity
Activity_hist.history_pg_stat_activity :
--ACTIVITY_HIST.HISTORY_PG_STAT_ACTIVITY
DROP TABLE IF EXISTS activity_hist.history_pg_stat_activity;
CREATE TABLE activity_hist.history_pg_stat_activity
(
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text ,
queryid bigint
);
لتسريع الإدراج - لا توجد فهارس أو قيود.
لتخزين التاريخ نفسه، يتم استخدام جدول مقسم:
Activity_hist.archive_pg_stat_activity :
DROP TABLE IF EXISTS activity_hist.archive_pg_stat_activity;
CREATE TABLE activity_hist.archive_pg_stat_activity
(
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text ,
queryid bigint
)
PARTITION BY RANGE (timepoint);
وبما أنه في هذه الحالة لا توجد متطلبات لسرعة الإدراج، فقد تم إنشاء بعض الفهارس لتسريع إنشاء التقارير.
سجل حظر الجلسة
يتم استخدام جدول لتخزين اللقطات الحالية لأقفال الجلسة:
Activity_hist.history_locking :
--ACTIVITY_HIST.HISTORY_LOCKING
DROP TABLE IF EXISTS activity_hist.history_locking;
CREATE TABLE activity_hist.history_locking
(
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
);
أيضًا، لتسريع الإدراج، لا توجد فهارس أو قيود.
لتخزين التاريخ نفسه، يتم استخدام جدول مقسم:
Activity_hist.archive_locking:
DROP TABLE IF EXISTS activity_hist.archive_locking;
CREATE TABLE activity_hist.archive_locking
(
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
)
PARTITION BY RANGE (timepoint);
وبما أنه في هذه الحالة لا توجد متطلبات لسرعة الإدراج، فقد تم إنشاء بعض الفهارس لتسريع إنشاء التقارير.
2. تعبئة التاريخ الحالي
لتجميع لقطات العرض مباشرة، يتم استخدام برنامج bash النصي الذي يقوم بتشغيل وظيفة plpgsql.
com.plpgsql تصل وظيفة dblink إلى طرق العرض في قاعدة البيانات الهدف وتقوم بإدراج صفوف في جداول الخدمة في قاعدة بيانات المراقبة.
get_current_activity.sql
CREATE OR REPLACE FUNCTION activity_hist.get_current_activity( current_host text , current_s_name text , current_s_pass text ) RETURNS BOOLEAN AS $$
DECLARE
database_rec record;
dblink_str text ;
BEGIN
EXECUTE 'SELECT dblink_connect(''LINK1'',''host='||current_host||' port=5432 dbname=postgres'||
' user='||current_s_name||' password='||current_s_pass|| ' '')';
--------------------------------------------------------------------
--GET pg_stat_activity stats
INSERT INTO activity_hist.history_pg_stat_activity
(
SELECT * FROM dblink('LINK1',
'SELECT
now() ,
datid ,
datname ,
pid ,
usesysid ,
usename ,
application_name ,
client_addr ,
client_hostname ,
client_port ,
backend_start ,
xact_start ,
query_start ,
state_change ,
wait_event_type ,
wait_event ,
state ,
backend_xid ,
backend_xmin ,
query ,
backend_type
FROM pg_stat_activity
')
AS t (
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text
)
);
---------------------------------------
--ACTIVITY_HIST.HISTORY_LOCKING
INSERT INTO activity_hist.history_locking
(
SELECT * FROM dblink('LINK1',
'SELECT
now() ,
lock.locktype,
lock.relation,
lock.mode,
lock.transactionid as tid,
lock.virtualtransaction as vtid,
lock.pid,
pg_blocking_pids(lock.pid),
lock.granted
FROM pg_catalog.pg_locks lock LEFT JOIN pg_catalog.pg_database db ON db.oid = lock.database
WHERE NOT lock.pid = pg_backend_pid()
')
AS t (
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
)
);
PERFORM dblink_disconnect('LINK1');
RETURN TRUE ;
END
$$ LANGUAGE plpgsql;
لتجميع لقطات العرض، يتم استخدام خدمة systemd وبرنامجين نصيين:
pg_current_activity.service
# /etc/systemd/system/pg_current_activity.service
[Unit]
Description=Collect history of pg_stat_activity , pg_locks
Wants=pg_current_activity.timer
[Service]
Type=forking
StartLimitIntervalSec=0
ExecStart=/home/postgres/pgutils/demon/get_current_activity.sh 10.124.70.40 postgres postgres
[Install]
WantedBy=multi-user.target
pg_current_activity.timer
# /etc/systemd/system/pg_current_activity.timer
[Unit]
Description=Run pg_current_activity.sh every 1 second
Requires=pg_current_activity.service
[Timer]
Unit=pg_current_activity.service
OnCalendar=*:*:0/1
AccuracySec=1
[Install]
WantedBy=timers.target
تعيين الحقوق للبرامج النصية:
# chmod 755 pg_current_activity.timer
# chmod 755 pg_current_activity.service
نبدأ الخدمة:
# systemctl daemon-loading
# systemctl يبدأ pg_current_activity.service
وبالتالي، يتم جمع تاريخ المشاهدات في شكل لقطات ثانية بثانية. بالطبع، إذا بقي كل شيء كما هو، فسوف يزيد حجم الجداول بسرعة كبيرة وسيصبح العمل الأكثر أو الأقل إنتاجية مستحيلا.
من الضروري تنظيم أرشفة البيانات.
3. أرشفة التاريخ
للأرشفة، يتم استخدام أرشيف الجداول المقسمة*.
يتم إنشاء أقسام جديدة كل ساعة، بينما تتم إزالة البيانات القديمة من جداول المحفوظات*، وبالتالي لا يتغير حجم جداول المحفوظات* كثيرًا ولا تنخفض سرعة الإدراج بمرور الوقت.
يتم إنشاء أقسام جديدة بواسطة وظيفة plpgsql Activity_hist.archive_current_activity. خوارزمية العمل بسيطة للغاية (باستخدام مثال القسم الخاص بجدول archive_pg_stat_activity).
إنشاء وملء قسم جديد
EXECUTE format(
'CREATE TABLE ' || partition_name ||
' PARTITION OF activity_hist.archive_pg_stat_activity FOR VALUES FROM ( %L ) TO ( %L ) ' ,
to_char(date_trunc('year', partition_min_range ),'YYYY')||'-'||
to_char(date_trunc('month', partition_min_range ),'MM')||'-'||
to_char(date_trunc('day', partition_min_range ),'DD')||' '||
to_char(date_trunc('hour', partition_min_range ),'HH24')||':00',
to_char(date_trunc('year', partition_max_range ),'YYYY')||'-'||
to_char(date_trunc('month', partition_max_range ),'MM')||'-'||
to_char(date_trunc('day', partition_max_range ),'DD')||' '||
to_char(date_trunc('hour', partition_max_range ),'HH24')||':00'
);
INSERT INTO activity_hist.archive_pg_stat_activity
(
SELECT *
FROM activity_hist.history_pg_stat_activity
WHERE timepoint BETWEEN partition_min_range AND partition_max_range
);
إنشاء الفهارس
EXECUTE format (
'CREATE INDEX '||index_name||
' ON '||partition_name||' ( wait_event_type , backend_type , timepoint )'
);
EXECUTE format ('CREATE INDEX '||index_name||
' ON '||partition_name||' ( wait_event_type , backend_type , timepoint , queryid )'
);
إزالة البيانات القديمة من جدول History_pg_stat_activity
DELETE
FROM activity_hist.history_pg_stat_activity
WHERE timepoint < partition_max_range;
وبطبيعة الحال، من وقت لآخر، يتم حذف الأقسام القديمة باعتبارها غير ضرورية.
التقارير الأساسية
في الواقع، لماذا يتم كل هذا؟ للحصول على تقارير تذكرنا بشكل غامض جدًا بتقارير AWR الخاصة بشركة Oracle.
من المهم إضافة أنه لتلقي التقارير، يتعين عليك إنشاء اتصال بين عرضي pg_stat_activity وpg_stat_statements. يتم ربط الجداول عن طريق إضافة عمود "queryid" إلى الجداول "history_pg_stat_activity"، و"archive_pg_stat_activity". إن طريقة إضافة قيمة عمود تقع خارج نطاق هذه المقالة ويتم وصفها هنا - pg_stat_statements + pg_stat_activity + loq_query = pg_ash؟ .
إجمالي وقت وحدة المعالجة المركزية للاستعلامات
طلب :
WITH hist AS
(
SELECT
aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND backend_type = 'client backend' AND datname != 'postgres' AND ( aa.wait_event_type IS NULL ) ANDaa.state = 'active'
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND backend_type = 'client backend' AND datname != 'postgres' AND ( ha.wait_event_type IS NULL )AND ha.state = 'active'
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
WITH hist AS
(
SELECT
aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( aa.wait_event_type IS NOT NULL )
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( ha.wait_event_type IS NOT NULL )
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
WITH hist AS
(
SELECT
aa.wait_event_type , aa.wait_event
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
aa.wait_event IS NOT NULL
GROUP BY aa.wait_event_type , aa.wait_event
UNION
SELECT
ha.wait_event_type , ha.wait_event
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
ha.wait_event IS NOT NULL
GROUP BY ha.wait_event_type , ha.wait_event
)
SELECT wait_event_type , wait_event
FROM hist
GROUP BY wait_event_type , wait_event
ORDER BY 1 ASC,2 ASC
----------------------------------------------------------------------
WITH hist AS
(
SELECT
aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( aa.wait_event_type = waitings_stat_rec.wait_event_type AND aa.wait_event = waitings_stat_rec.wait_event )
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( ha.wait_event_type = waitings_stat_rec.wait_event_type AND ha.wait_event = waitings_stat_rec.wait_event )
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
SELECT
MIN(date_trunc('second',timepoint)) AS started ,
count(*) * interval '1 second' as duration ,
pid , blocking_pids , relation , mode , locktype
FROM
activity_hist.archive_locking al
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY pid , blocking_pids , relation , mode , locktype
UNION
SELECT
MIN(date_trunc('second',timepoint)) AS started ,
count(*) * interval '1 second' as duration ,
pid , blocking_pids , relation , mode , locktype
FROM
activity_hist.history_locking
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY pid , blocking_pids , relation , mode , locktype
ORDER BY 1
على سبيل المثال:
-------------------------------------------------- -------------------------------------------------- --------------------------------- | تاريخ العمليات المقفلة +-----+---------+-------- --+------------ --------+--------------------+----- --------------- +------------------- | #| معرف الهوية| بدأت| المدة| blocking_pids| علاقة| الوضع| نوع القفل +----------+----------+---------- +--------- -----------+------------------------------------------------------------------- -------------- | 1| 26224| 2019-09-02 19:32:16| 00:01:45| {26211}| 16541| الوصول إلى المشاركة| علاقة | 2| 26390| 2019-09-02 19:34:03| 00:00:53| {26211}| 16541| الوصول إلى المشاركة| علاقة | 3| 26391| 2019-09-02 19:34:03| 00:00:53| {26211}| 16541| الوصول إلى المشاركة| علاقة | 4| 26531| 2019-09-02 19:35:27| 00:00:12| {26211}| 16541| الوصول إلى المشاركة| علاقة | 5| 27284| 2019-09-02 19:44:02| 00:00:19| {27276}| 16541| الوصول إلى المشاركة| علاقة | 6| 27283| 2019-09-02 19:44:02| 00:00:19| {27276}| 16541| الوصول إلى المشاركة| علاقة | 7| 27286| 2019-09-02 19:44:02| 00:00:19| {27276}| 16541| الوصول إلى المشاركة| علاقة | 8| 27423| 2019-09-02 19:45:24| 00:00:12| {27394}| 16541| الوصول إلى المشاركة| علاقة | 9| 27648| 2019-09-02 19:48:06| 00:00:20| {27647}| 16541| الوصول إلى المشاركة| علاقة | 10| 27650| 2019-09-02 19:48:06| 00:00:20| {27647}| 16541| الوصول إلى المشاركة| علاقة | 11| 27735| 2019-09-02 19:49:08| 00:00:06| {27650}| 16541| AccessExclusiveLock| علاقة | 12| 28380| 2019-09-02 19:56:03| 00:01:56| {28379}| 16541| الوصول إلى المشاركة| علاقة | 13| 28379| 2019-09-02 19:56:03| 00:00:01| 28377| 16541| AccessExclusiveLock| علاقة | | | | | 28376| |
تاريخ عمليات الحظر
الطلبات:
SELECT
blocking_pids
FROM
activity_hist.archive_locking al
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY blocking_pids
UNION
SELECT
blocking_pids
FROM
activity_hist.history_locking
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY blocking_pids
ORDER BY 1
---------------------------------------------------------------
SELECT
pid , usename , application_name , datname ,
MIN(date_trunc('second',timepoint)) as started ,
count(*) * interval '1 second' as duration ,
state ,
query
FROM activity_hist.archive_pg_stat_activity
WHERE pid= current_pid AND
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour')
GROUP BY pid , usename , application_name ,
datname ,
state_change,
state ,
query
UNION
SELECT
pid , usename , application_name , datname ,
MIN(date_trunc('second',timepoint)) as started ,
count(*) * interval '1 second' as duration ,
state ,
query
FROM activity_hist.history_pg_stat_activity_for_reports
WHERE pid= current_pid AND
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour')
GROUP BY pid , usename , application_name ,
datname ,
state_change,
state ,
query
ORDER BY 5 , 1
الاستعلامات الأساسية المعروضة والتقارير الناتجة تجعل الحياة أسهل بكثير عند تحليل حوادث الأداء.
استنادًا إلى الاستعلامات الأساسية، يمكنك الحصول على تقرير يشبه بشكل غامض تقرير AWR الخاص بشركة Oracle. مثال على تقرير ملخص
+------------------------------------------------- ----------------------------------- | تقرير موحد للنشاط والانتظار.
يتبع. التالي في السطر هو إنشاء سجل القفل (pg_stat_locks)، وهو وصف أكثر تفصيلاً لعملية ملء الجداول.