Usa ka pagsulay sa paghimo og ASH analogue alang sa PostgreSQL
Pagbuot sa problema
Aron ma-optimize ang mga pangutana sa PostgreSQL, ang abilidad sa pag-analisar sa kasaysayan sa kalihokan, ilabi na, paghulat, mga kandado, ug mga istatistika sa lamesa, gikinahanglan kaayo.
pgsentinel extension :
Β«Ang tanan nga natipon nga impormasyon gitipigan lamang sa RAM, ug ang gidaghanon sa memorya nga gigamit gikontrolar sa gidaghanon sa katapusang gitipigan nga mga rekord.
Gidugang ang field sa queryid - parehas nga queryid gikan sa extension sa pg_stat_statements (kinahanglan nga pre-installation).Β«
Kini, siyempre, makatabang kaayo, apan ang labing makahasol nga butang mao ang una nga punto. βAng tanan nga natipon nga impormasyon gitipigan lamang sa RAM β, i.e. adunay epekto sa target nga base. Dugang pa, wala'y kasaysayan sa kandado ug mga istatistika sa lamesa. Mga. ang solusyon sa kasagaran nagsulti nga dili kompleto: "Wala pa'y andam nga pakete alang sa pag-instalar. Gisugyot nga i-download ang mga gigikanan ug i-assemble ang librarya sa imong kaugalingon. Kinahanglan nimo una nga i-install ang "devel" nga pakete alang sa imong server ug itakda ang agianan sa pg_config sa PATH variable.".
Sa kinatibuk-an, adunay daghang kasamok, ug sa kaso sa seryoso nga mga database sa produksiyon, dili mahimo nga mahimo ang bisan unsa sa server. Kinahanglan nga maghimo kita og usa ka butang nga atong kaugalingon pag-usab.
Pasidaan
Tungod sa labi ka dako nga gidaghanon ug tungod sa dili kompleto nga panahon sa pagsulay, ang artikulo labi na alang sa mga katuyoan sa kasayuran, imbes usa ka hugpong sa mga tesis ug tunga nga mga resulta.
Ang mas detalyado nga materyal iandam sa ulahi, sa mga bahin
Mga kinahanglanon sa draft alang sa solusyon
Kinahanglan nga maghimo usa ka himan nga nagtugot kanimo sa pagtipig:
pg_stat_activity tan-awa ang kasaysayan Kasaysayan sa lock sa sesyon gamit ang pg_locks view
Kinahanglanon sa solusyon-maminusan ang epekto sa target nga database.
Kinatibuk-ang ideyaβ ang ahente sa pagkolekta sa datos gilusad dili sa target database, apan sa monitoring database isip usa ka systemd service. Oo, ang pipila ka pagkawala sa datos posible, apan kini dili kritikal alang sa pagtaho, apan walay epekto sa target nga database sa termino sa memorya ug disk space. Ug sa kaso sa paggamit sa usa ka koneksyon pool, ang epekto sa mga proseso sa user gamay ra.
Mga yugto sa pagpatuman
1. Mga lamesa sa serbisyo
Ang usa ka bulag nga schema gigamit sa pagtipig sa mga lamesa, aron dili makomplikado ang pag-analisar sa mga nag-unang lamesa nga gigamit.
DROP SCHEMA IF EXISTS activity_hist ;
CREATE SCHEMA activity_hist AUTHORIZATION monitor ;
Importante: Ang schema wala gihimo sa target database, apan sa monitoring database.
pg_stat_activity tan-awa ang kasaysayan
Usa ka lamesa ang gigamit sa pagtipig sa kasamtangang mga snapshot sa pg_stat_activity view
activity_hist.history_pg_stat_activity :
--ACTIVITY_HIST.HISTORY_PG_STAT_ACTIVITY
DROP TABLE IF EXISTS activity_hist.history_pg_stat_activity;
CREATE TABLE activity_hist.history_pg_stat_activity
(
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text ,
queryid bigint
);
Aron mapadali ang pagsulod - walay mga indeks o mga pagdili.
Aron tipigan ang kasaysayan mismo, gigamit ang usa ka partitioned table:
activity_hist.archive_pg_stat_activity :
DROP TABLE IF EXISTS activity_hist.archive_pg_stat_activity;
CREATE TABLE activity_hist.archive_pg_stat_activity
(
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text ,
queryid bigint
)
PARTITION BY RANGE (timepoint);
Tungod kay sa kini nga kaso walaβy mga kinahanglanon alang sa katulin sa pagsal-ot, ang pipila nga mga indeks gihimo aron mapadali ang paghimo sa mga taho.
Kasaysayan sa pag-block sa sesyon
Ang usa ka lamesa gigamit sa pagtipig sa kasamtangan nga mga snapshot sa mga kandado sa sesyon:
activity_hist.history_locking :
--ACTIVITY_HIST.HISTORY_LOCKING
DROP TABLE IF EXISTS activity_hist.history_locking;
CREATE TABLE activity_hist.history_locking
(
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
);
Usab, aron mapadali ang pagsulod, walaβy mga indeks o mga pagdili.
Aron tipigan ang kasaysayan mismo, gigamit ang usa ka partitioned table:
activity_hist.archive_locking:
DROP TABLE IF EXISTS activity_hist.archive_locking;
CREATE TABLE activity_hist.archive_locking
(
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
)
PARTITION BY RANGE (timepoint);
Tungod kay sa kini nga kaso walaβy mga kinahanglanon alang sa katulin sa pagsal-ot, ang pipila nga mga indeks gihimo aron mapadali ang paghimo sa mga taho.
2. Pagpuno sa kasamtangan nga kasaysayan
Aron direktang makolekta ang mga snapshot sa pagtan-aw, usa ka bash script ang gigamit nga nagpadagan sa plpgsql function.
plpgsql Ang dblink function nag-access sa mga panan-aw sa target nga database ug nagsal-ot sa mga laray sa mga lamesa sa serbisyo sa database sa pag-monitor.
get_current_activity.sql
CREATE OR REPLACE FUNCTION activity_hist.get_current_activity( current_host text , current_s_name text , current_s_pass text ) RETURNS BOOLEAN AS $$
DECLARE
database_rec record;
dblink_str text ;
BEGIN
EXECUTE 'SELECT dblink_connect(''LINK1'',''host='||current_host||' port=5432 dbname=postgres'||
' user='||current_s_name||' password='||current_s_pass|| ' '')';
--------------------------------------------------------------------
--GET pg_stat_activity stats
INSERT INTO activity_hist.history_pg_stat_activity
(
SELECT * FROM dblink('LINK1',
'SELECT
now() ,
datid ,
datname ,
pid ,
usesysid ,
usename ,
application_name ,
client_addr ,
client_hostname ,
client_port ,
backend_start ,
xact_start ,
query_start ,
state_change ,
wait_event_type ,
wait_event ,
state ,
backend_xid ,
backend_xmin ,
query ,
backend_type
FROM pg_stat_activity
')
AS t (
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text
)
);
---------------------------------------
--ACTIVITY_HIST.HISTORY_LOCKING
INSERT INTO activity_hist.history_locking
(
SELECT * FROM dblink('LINK1',
'SELECT
now() ,
lock.locktype,
lock.relation,
lock.mode,
lock.transactionid as tid,
lock.virtualtransaction as vtid,
lock.pid,
pg_blocking_pids(lock.pid),
lock.granted
FROM pg_catalog.pg_locks lock LEFT JOIN pg_catalog.pg_database db ON db.oid = lock.database
WHERE NOT lock.pid = pg_backend_pid()
')
AS t (
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
)
);
PERFORM dblink_disconnect('LINK1');
RETURN TRUE ;
END
$$ LANGUAGE plpgsql;
Aron makolekta ang mga snapshot sa pagtan-aw, gigamit ang serbisyo sa systemd ug duha nga mga script:
pg_current_activity.service
# /etc/systemd/system/pg_current_activity.service
[Unit]
Description=Collect history of pg_stat_activity , pg_locks
Wants=pg_current_activity.timer
[Service]
Type=forking
StartLimitIntervalSec=0
ExecStart=/home/postgres/pgutils/demon/get_current_activity.sh 10.124.70.40 postgres postgres
[Install]
WantedBy=multi-user.target
pg_current_activity.timer
# /etc/systemd/system/pg_current_activity.timer
[Unit]
Description=Run pg_current_activity.sh every 1 second
Requires=pg_current_activity.service
[Timer]
Unit=pg_current_activity.service
OnCalendar=*:*:0/1
AccuracySec=1
[Install]
WantedBy=timers.target
Ihatag ang mga katungod sa mga script:
# chmod 755 pg_current_activity.timer
# chmod 755 pg_current_activity.service
Busa, ang kasaysayan sa mga panan-aw gikolekta sa porma sa ikaduha-sa-segundo nga mga snapshot. Siyempre, kung ang tanan mabiyaan, ang mga lamesa dali nga modaghan sa gidak-on ug labi pa o dili kaayo produktibo nga trabaho mahimong imposible.
Gikinahanglan ang pag-organisar sa pag-archive sa datos.
3. Pag-archive sa kasaysayan
Para sa pag-archive, gigamit ang mga partitioned tables archive*.
Ang mga bag-ong partisyon gihimo matag oras, samtang ang daan nga datos gikuha gikan sa mga talaan sa kasaysayan*, busa ang gidak-on sa mga talaan sa kasaysayan* dili kaayo mausab ug ang katulin sa pagsulod dili mous-os sa paglabay sa panahon.
Ang paghimo sa bag-ong mga seksyon gihimo sa plpgsql function activity_hist.archive_current_activity. Ang algorithm sa trabaho yano ra (gamit ang panig-ingnan sa seksyon alang sa lamesa sa archive_pg_stat_activity).
Paghimo ug pagpuno og bag-ong seksyon
EXECUTE format(
'CREATE TABLE ' || partition_name ||
' PARTITION OF activity_hist.archive_pg_stat_activity FOR VALUES FROM ( %L ) TO ( %L ) ' ,
to_char(date_trunc('year', partition_min_range ),'YYYY')||'-'||
to_char(date_trunc('month', partition_min_range ),'MM')||'-'||
to_char(date_trunc('day', partition_min_range ),'DD')||' '||
to_char(date_trunc('hour', partition_min_range ),'HH24')||':00',
to_char(date_trunc('year', partition_max_range ),'YYYY')||'-'||
to_char(date_trunc('month', partition_max_range ),'MM')||'-'||
to_char(date_trunc('day', partition_max_range ),'DD')||' '||
to_char(date_trunc('hour', partition_max_range ),'HH24')||':00'
);
INSERT INTO activity_hist.archive_pg_stat_activity
(
SELECT *
FROM activity_hist.history_pg_stat_activity
WHERE timepoint BETWEEN partition_min_range AND partition_max_range
);
Paghimo mga indeks
EXECUTE format (
'CREATE INDEX '||index_name||
' ON '||partition_name||' ( wait_event_type , backend_type , timepoint )'
);
EXECUTE format ('CREATE INDEX '||index_name||
' ON '||partition_name||' ( wait_event_type , backend_type , timepoint , queryid )'
);
Pagtangtang sa daan nga datos gikan sa history_pg_stat_activity table
DELETE
FROM activity_hist.history_pg_stat_activity
WHERE timepoint < partition_max_range;
Siyempre, matag karon ug unya, ang mga daan nga seksyon gitangtang nga wala kinahanglana.
Panguna nga mga taho
Sa pagkatinuod, nganong kining tanan gibuhat? Aron makakuha og mga taho nga klaro kaayo nga nagpahinumdom sa Oracle's AWR.
Mahinungdanon nga idugang nga aron makadawat mga taho, kinahanglan nimo nga maghimo usa ka koneksyon tali sa pg_stat_activity ug pg_stat_statements nga pagtan-aw. Ang mga lamesa gisumpay pinaagi sa pagdugang ug 'queryid' nga kolum sa 'history_pg_stat_activity', 'archive_pg_stat_activity' nga mga lamesa. Ang pamaagi sa pagdugang ug kantidad sa kolum lapas sa kasangkaran niini nga artikulo ug gihulagway dinhi β pg_stat_statements + pg_stat_activity + loq_query = pg_ash? .
TOTAL PANAHON sa CPU PARA SA MGA PANGUTANA
hangyo :
WITH hist AS
(
SELECT
aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND backend_type = 'client backend' AND datname != 'postgres' AND ( aa.wait_event_type IS NULL ) ANDaa.state = 'active'
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND backend_type = 'client backend' AND datname != 'postgres' AND ( ha.wait_event_type IS NULL )AND ha.state = 'active'
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
WITH hist AS
(
SELECT
aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( aa.wait_event_type IS NOT NULL )
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( ha.wait_event_type IS NOT NULL )
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
WITH hist AS
(
SELECT
aa.wait_event_type , aa.wait_event
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
aa.wait_event IS NOT NULL
GROUP BY aa.wait_event_type , aa.wait_event
UNION
SELECT
ha.wait_event_type , ha.wait_event
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
ha.wait_event IS NOT NULL
GROUP BY ha.wait_event_type , ha.wait_event
)
SELECT wait_event_type , wait_event
FROM hist
GROUP BY wait_event_type , wait_event
ORDER BY 1 ASC,2 ASC
----------------------------------------------------------------------
WITH hist AS
(
SELECT
aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( aa.wait_event_type = waitings_stat_rec.wait_event_type AND aa.wait_event = waitings_stat_rec.wait_event )
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( ha.wait_event_type = waitings_stat_rec.wait_event_type AND ha.wait_event = waitings_stat_rec.wait_event )
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
SELECT
MIN(date_trunc('second',timepoint)) AS started ,
count(*) * interval '1 second' as duration ,
pid , blocking_pids , relation , mode , locktype
FROM
activity_hist.archive_locking al
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY pid , blocking_pids , relation , mode , locktype
UNION
SELECT
MIN(date_trunc('second',timepoint)) AS started ,
count(*) * interval '1 second' as duration ,
pid , blocking_pids , relation , mode , locktype
FROM
activity_hist.history_locking
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY pid , blocking_pids , relation , mode , locktype
ORDER BY 1
SELECT
blocking_pids
FROM
activity_hist.archive_locking al
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY blocking_pids
UNION
SELECT
blocking_pids
FROM
activity_hist.history_locking
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY blocking_pids
ORDER BY 1
---------------------------------------------------------------
SELECT
pid , usename , application_name , datname ,
MIN(date_trunc('second',timepoint)) as started ,
count(*) * interval '1 second' as duration ,
state ,
query
FROM activity_hist.archive_pg_stat_activity
WHERE pid= current_pid AND
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour')
GROUP BY pid , usename , application_name ,
datname ,
state_change,
state ,
query
UNION
SELECT
pid , usename , application_name , datname ,
MIN(date_trunc('second',timepoint)) as started ,
count(*) * interval '1 second' as duration ,
state ,
query
FROM activity_hist.history_pg_stat_activity_for_reports
WHERE pid= current_pid AND
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour')
GROUP BY pid , usename , application_name ,
datname ,
state_change,
state ,
query
ORDER BY 5 , 1
Ang batakang mga pangutana nga gipakita ug ang resulta nga mga taho nakapasayon ββna sa kinabuhi sa dihang nag-analisar sa mga insidente sa pasundayag.
Pinasukad sa sukaranang mga pangutana, makakuha ka usa ka taho nga dili klaro nga kaamgid sa AWR sa Oracle. Pananglitan sa summary report
+------------------------------------------------- ------------------------------------ | KONSOLIDATED NGA REPORT ALANG SA KALIHOKAN UG PAGHULAT.
Ipadayon. Sunod sa linya mao ang paghimo sa usa ka kasaysayan sa lock (pg_stat_locks), usa ka mas detalyado nga paghulagway sa proseso sa pagpuno sa mga lamesa.