PostgreSQL հարցումները օպտիմիզացնելու համար շատ պահանջվում է գործունեության պատմությունը, մասնավորապես՝ սպասումները, կողպեքները և աղյուսակի վիճակագրությունը վերլուծելու ունակությունը:
pgsentinel ընդլայնում :
«Ամբողջ կուտակված տեղեկատվությունը պահվում է միայն RAM-ում, իսկ սպառված հիշողության քանակը կարգավորվում է վերջին պահված գրառումների քանակով:
Հարցման դաշտը ավելացված է. նույն հարցումը pg_stat_statements ընդլայնումից (նախնական տեղադրումը պարտադիր է):«
Սա, իհարկե, շատ կօգներ, բայց ամենադժվարը առաջին կետն է»։Ամբողջ կուտակված տեղեկատվությունը պահվում է միայն RAM-ում », այսինքն. կա ազդեցություն թիրախային բազայի վրա. Բացի այդ, չկա կողպեքի պատմություն և աղյուսակի վիճակագրություն: Նրանք. լուծումը, ընդհանուր առմամբ, թերի է.Տեղադրման համար պատրաստ փաթեթ դեռ չկա։ Առաջարկվում է ներբեռնել աղբյուրները և ինքնուրույն հավաքել գրադարանը։ Դուք նախ պետք է տեղադրեք «devel» փաթեթը ձեր սերվերի համար և սահմանեք pg_config ուղին PATH փոփոխականում:".
Ընդհանրապես մեծ աղմուկ է բարձրանում, իսկ լուրջ արտադրական շտեմարանների դեպքում սերվերի հետ հնարավոր չէ ինչ-որ բան անել։ Պետք է նորից մեր սեփական ինչ-որ բան հորինենք:
Ուշադրություն.
Բավականին մեծ ծավալի և թեստավորման թերի շրջանի պատճառով հոդվածը հիմնականում տեղեկատվական բնույթ է կրում, ավելի շուտ որպես թեզերի և միջանկյալ արդյունքների հավաքածու։
Ավելի մանրամասն նյութը կպատրաստվի ավելի ուշ՝ մաս-մաս
Լուծման պահանջների նախագիծ
Անհրաժեշտ է մշակել գործիք, որը թույլ է տալիս պահպանել.
pg_stat_activity դիտումների պատմությունը Աշխատաշրջանի կողպման պատմությունը՝ օգտագործելով pg_locks տեսքը
Լուծման պահանջ- նվազագույնի հասցնել ազդեցությունը թիրախային տվյալների բազայի վրա:
Ընդհանուր գաղափար– տվյալների հավաքագրման գործակալը գործարկվում է ոչ թե թիրախային տվյալների բազայում, այլ մոնիտորինգի տվյալների բազայում՝ որպես համակարգված ծառայություն: Այո, տվյալների որոշակի կորուստ հնարավոր է, բայց դա կարևոր չէ հաշվետվության համար, բայց հիշողության և սկավառակի տարածության առումով թիրախային տվյալների բազայի վրա որևէ ազդեցություն չկա: Իսկ կապի լողավազան օգտագործելու դեպքում օգտատերերի գործընթացների վրա ազդեցությունը նվազագույն է:
Իրականացման փուլերը
1.Սպասարկման սեղաններ
Առանձին սխեմա օգտագործվում է աղյուսակները պահելու համար, որպեսզի չբարդացնեն օգտագործվող հիմնական աղյուսակների վերլուծությունը:
DROP SCHEMA IF EXISTS activity_hist ;
CREATE SCHEMA activity_hist AUTHORIZATION monitor ;
Կարևոր է. սխեման ստեղծվում է ոչ թե թիրախային տվյալների բազայում, այլ մոնիտորինգի տվյալների բազայում:
pg_stat_activity դիտումների պատմությունը
Աղյուսակը օգտագործվում է pg_stat_activity տեսքի ընթացիկ նկարները պահելու համար
activity_hist.history_pg_stat_activity:
--ACTIVITY_HIST.HISTORY_PG_STAT_ACTIVITY
DROP TABLE IF EXISTS activity_hist.history_pg_stat_activity;
CREATE TABLE activity_hist.history_pg_stat_activity
(
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text ,
queryid bigint
);
Տեղադրումն արագացնելու համար՝ ոչ մի ինդեքս կամ սահմանափակում:
Պատմությունը ինքնին պահելու համար օգտագործվում է բաժանված աղյուսակ.
activity_hist.archive_pg_stat_activity:
DROP TABLE IF EXISTS activity_hist.archive_pg_stat_activity;
CREATE TABLE activity_hist.archive_pg_stat_activity
(
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text ,
queryid bigint
)
PARTITION BY RANGE (timepoint);
Քանի որ այս դեպքում ներդրման արագության պահանջներ չկան, որոշ ինդեքսներ են ստեղծվել հաշվետվությունների ստեղծումն արագացնելու համար:
Նիստի արգելափակման պատմությունը
Աղյուսակը օգտագործվում է նստաշրջանի կողպեքների ընթացիկ պատկերները պահելու համար.
activity_hist.history_locking:
--ACTIVITY_HIST.HISTORY_LOCKING
DROP TABLE IF EXISTS activity_hist.history_locking;
CREATE TABLE activity_hist.history_locking
(
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
);
Բացի այդ, ներդրումն արագացնելու համար ինդեքսներ կամ սահմանափակումներ չկան:
Պատմությունը ինքնին պահելու համար օգտագործվում է բաժանված աղյուսակ.
activity_hist.archive_locking:
DROP TABLE IF EXISTS activity_hist.archive_locking;
CREATE TABLE activity_hist.archive_locking
(
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
)
PARTITION BY RANGE (timepoint);
Քանի որ այս դեպքում ներդրման արագության պահանջներ չկան, որոշ ինդեքսներ են ստեղծվել հաշվետվությունների ստեղծումն արագացնելու համար:
2. Լրացնելով ընթացիկ պատմությունը
Դիտումների ակնթարթները ուղղակիորեն հավաքելու համար օգտագործվում է bash սցենար, որն աշխատում է plpgsql ֆունկցիան:
plpgsql Dblink ֆունկցիան մուտք է գործում թիրախային տվյալների բազայի դիտումներ և տողեր տեղադրում մոնիտորինգի տվյալների բազայի սպասարկման աղյուսակներում:
get_current_activity.sql
CREATE OR REPLACE FUNCTION activity_hist.get_current_activity( current_host text , current_s_name text , current_s_pass text ) RETURNS BOOLEAN AS $$
DECLARE
database_rec record;
dblink_str text ;
BEGIN
EXECUTE 'SELECT dblink_connect(''LINK1'',''host='||current_host||' port=5432 dbname=postgres'||
' user='||current_s_name||' password='||current_s_pass|| ' '')';
--------------------------------------------------------------------
--GET pg_stat_activity stats
INSERT INTO activity_hist.history_pg_stat_activity
(
SELECT * FROM dblink('LINK1',
'SELECT
now() ,
datid ,
datname ,
pid ,
usesysid ,
usename ,
application_name ,
client_addr ,
client_hostname ,
client_port ,
backend_start ,
xact_start ,
query_start ,
state_change ,
wait_event_type ,
wait_event ,
state ,
backend_xid ,
backend_xmin ,
query ,
backend_type
FROM pg_stat_activity
')
AS t (
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text
)
);
---------------------------------------
--ACTIVITY_HIST.HISTORY_LOCKING
INSERT INTO activity_hist.history_locking
(
SELECT * FROM dblink('LINK1',
'SELECT
now() ,
lock.locktype,
lock.relation,
lock.mode,
lock.transactionid as tid,
lock.virtualtransaction as vtid,
lock.pid,
pg_blocking_pids(lock.pid),
lock.granted
FROM pg_catalog.pg_locks lock LEFT JOIN pg_catalog.pg_database db ON db.oid = lock.database
WHERE NOT lock.pid = pg_backend_pid()
')
AS t (
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
)
);
PERFORM dblink_disconnect('LINK1');
RETURN TRUE ;
END
$$ LANGUAGE plpgsql;
Դիտումների նկարներ հավաքելու համար օգտագործվում է systemd ծառայությունը և երկու սցենար.
pg_current_activity.service
# /etc/systemd/system/pg_current_activity.service
[Unit]
Description=Collect history of pg_stat_activity , pg_locks
Wants=pg_current_activity.timer
[Service]
Type=forking
StartLimitIntervalSec=0
ExecStart=/home/postgres/pgutils/demon/get_current_activity.sh 10.124.70.40 postgres postgres
[Install]
WantedBy=multi-user.target
pg_current_activity.timer
# /etc/systemd/system/pg_current_activity.timer
[Unit]
Description=Run pg_current_activity.sh every 1 second
Requires=pg_current_activity.service
[Timer]
Unit=pg_current_activity.service
OnCalendar=*:*:0/1
AccuracySec=1
[Install]
WantedBy=timers.target
Սկսենք ծառայությունը.
# systemctl daemon- վերբեռնել
# systemctl սկսել pg_current_activity.service
Այսպիսով, դիտումների պատմությունը հավաքվում է վայրկյան առ վայրկյան ակնարկների տեսքով։ Իհարկե, եթե ամեն ինչ մնա այնպես, ինչպես կա, սեղանները շատ արագ կմեծանան չափերով, և քիչ թե շատ արդյունավետ աշխատանքը կդառնա անհնար։
Անհրաժեշտ է կազմակերպել տվյալների արխիվացումը։
3. Արխիվացման պատմություն
Արխիվացման համար օգտագործվում են բաժանված աղյուսակների արխիվ*։
Նոր բաժանմունքներ են ստեղծվում ամեն ժամ, մինչդեռ հին տվյալները հեռացվում են պատմության* աղյուսակներից, ուստի պատմության* աղյուսակների չափերը շատ չեն փոխվում, և տեղադրման արագությունը ժամանակի ընթացքում չի նվազում:
Նոր բաժինների ստեղծումը կատարվում է plpgsql ֆունկցիայի միջոցով activity_hist.archive_current_activity: Աշխատանքի ալգորիթմը շատ պարզ է (օգտագործելով archive_pg_stat_activity աղյուսակի բաժնի օրինակը):
Ստեղծեք և լրացրեք նոր բաժին
EXECUTE format(
'CREATE TABLE ' || partition_name ||
' PARTITION OF activity_hist.archive_pg_stat_activity FOR VALUES FROM ( %L ) TO ( %L ) ' ,
to_char(date_trunc('year', partition_min_range ),'YYYY')||'-'||
to_char(date_trunc('month', partition_min_range ),'MM')||'-'||
to_char(date_trunc('day', partition_min_range ),'DD')||' '||
to_char(date_trunc('hour', partition_min_range ),'HH24')||':00',
to_char(date_trunc('year', partition_max_range ),'YYYY')||'-'||
to_char(date_trunc('month', partition_max_range ),'MM')||'-'||
to_char(date_trunc('day', partition_max_range ),'DD')||' '||
to_char(date_trunc('hour', partition_max_range ),'HH24')||':00'
);
INSERT INTO activity_hist.archive_pg_stat_activity
(
SELECT *
FROM activity_hist.history_pg_stat_activity
WHERE timepoint BETWEEN partition_min_range AND partition_max_range
);
Ինդեքսների ստեղծում
EXECUTE format (
'CREATE INDEX '||index_name||
' ON '||partition_name||' ( wait_event_type , backend_type , timepoint )'
);
EXECUTE format ('CREATE INDEX '||index_name||
' ON '||partition_name||' ( wait_event_type , backend_type , timepoint , queryid )'
);
Հին տվյալների հեռացում history_pg_stat_activity աղյուսակից
DELETE
FROM activity_hist.history_pg_stat_activity
WHERE timepoint < partition_max_range;
Իհարկե, ժամանակ առ ժամանակ հին բաժինները ջնջվում են որպես ավելորդ։
Հիմնական հաշվետվություններ
Իրականում ինչո՞ւ է այս ամենը արվում։ Ստանալ զեկույցներ, որոնք շատ անորոշ կերպով հիշեցնում են Oracle-ի AWR-ը:
Կարևոր է ավելացնել, որ հաշվետվություններ ստանալու համար անհրաժեշտ է կապ ստեղծել pg_stat_activity և pg_stat_statements դիտումների միջև։ Աղյուսակները կապվում են՝ ավելացնելով «queryid» սյունակը «history_pg_stat_activity», «archive_pg_stat_activity» աղյուսակներում: Սյունակի արժեքի ավելացման մեթոդը դուրս է այս հոդվածի շրջանակներից և նկարագրված է այստեղ − pg_stat_statements + pg_stat_activity + loq_query = pg_ash? .
ԸՆԴՀԱՆՈՒՐ CPU ԺԱՄԱՆԱԿԸ ՀԱՐՑՈՒՄՆԵՐԻ ՀԱՄԱՐ
Հայց.
WITH hist AS
(
SELECT
aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND backend_type = 'client backend' AND datname != 'postgres' AND ( aa.wait_event_type IS NULL ) ANDaa.state = 'active'
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND backend_type = 'client backend' AND datname != 'postgres' AND ( ha.wait_event_type IS NULL )AND ha.state = 'active'
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
WITH hist AS
(
SELECT
aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( aa.wait_event_type IS NOT NULL )
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( ha.wait_event_type IS NOT NULL )
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
WITH hist AS
(
SELECT
aa.wait_event_type , aa.wait_event
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
aa.wait_event IS NOT NULL
GROUP BY aa.wait_event_type , aa.wait_event
UNION
SELECT
ha.wait_event_type , ha.wait_event
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
ha.wait_event IS NOT NULL
GROUP BY ha.wait_event_type , ha.wait_event
)
SELECT wait_event_type , wait_event
FROM hist
GROUP BY wait_event_type , wait_event
ORDER BY 1 ASC,2 ASC
----------------------------------------------------------------------
WITH hist AS
(
SELECT
aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( aa.wait_event_type = waitings_stat_rec.wait_event_type AND aa.wait_event = waitings_stat_rec.wait_event )
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( ha.wait_event_type = waitings_stat_rec.wait_event_type AND ha.wait_event = waitings_stat_rec.wait_event )
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
SELECT
MIN(date_trunc('second',timepoint)) AS started ,
count(*) * interval '1 second' as duration ,
pid , blocking_pids , relation , mode , locktype
FROM
activity_hist.archive_locking al
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY pid , blocking_pids , relation , mode , locktype
UNION
SELECT
MIN(date_trunc('second',timepoint)) AS started ,
count(*) * interval '1 second' as duration ,
pid , blocking_pids , relation , mode , locktype
FROM
activity_hist.history_locking
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY pid , blocking_pids , relation , mode , locktype
ORDER BY 1
SELECT
blocking_pids
FROM
activity_hist.archive_locking al
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY blocking_pids
UNION
SELECT
blocking_pids
FROM
activity_hist.history_locking
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY blocking_pids
ORDER BY 1
---------------------------------------------------------------
SELECT
pid , usename , application_name , datname ,
MIN(date_trunc('second',timepoint)) as started ,
count(*) * interval '1 second' as duration ,
state ,
query
FROM activity_hist.archive_pg_stat_activity
WHERE pid= current_pid AND
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour')
GROUP BY pid , usename , application_name ,
datname ,
state_change,
state ,
query
UNION
SELECT
pid , usename , application_name , datname ,
MIN(date_trunc('second',timepoint)) as started ,
count(*) * interval '1 second' as duration ,
state ,
query
FROM activity_hist.history_pg_stat_activity_for_reports
WHERE pid= current_pid AND
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour')
GROUP BY pid , usename , application_name ,
datname ,
state_change,
state ,
query
ORDER BY 5 , 1
Ցուցադրված հիմնական հարցումները և արդյունքում ստացված հաշվետվություններն արդեն իսկ շատ ավելի հեշտացնում են կյանքը կատարողական միջադեպերը վերլուծելիս:
Հիմնական հարցումների հիման վրա դուք կարող եք ստանալ զեկույց, որը անորոշ կերպով նման է Oracle-ի AWR-ին: Ամփոփ զեկույցի օրինակ
+------------------------------------------------ ----------------------------------- | ԳՈՐԾՈՒՆԵՈՒԹՅԱՆ ԵՎ ՍՊԱՍՈՒՄՆԵՐԻ ՀԱՄԱԽՄԲԱՑՎԱԾ ՀԱՇՎԵՏՎՈՒԹՅՈՒՆ.
Շարունակելի. Հաջորդը կողպեքի պատմության ստեղծումն է (pg_stat_locks), աղյուսակների լրացման գործընթացի ավելի մանրամասն նկարագրությունը: