Një përpjekje për të krijuar një analog të ASH për PostgreSQL
Formulimi i problemit
Për të optimizuar pyetjet e PostgreSQL, kërkohet shumë aftësia për të analizuar historikun e aktiviteteve, në veçanti pritjet, kyçjet dhe statistikat e tabelave.
zgjerimi pgsentinel :
«I gjithë informacioni i grumbulluar ruhet vetëm në RAM, dhe sasia e memories së konsumuar rregullohet nga numri i regjistrimeve të fundit të ruajtura.
Fusha queryid shtohet - i njëjti pyetësor nga shtrirja pg_stat_statements (kërkohet instalimi paraprak).«
Kjo, sigurisht, do të ndihmonte shumë, por gjëja më e mundimshme është pika e parë.”Të gjitha informacionet e grumbulluara ruhen vetëm në RAM ”, d.m.th. ka një ndikim në bazën e synuar. Përveç kësaj, nuk ka histori bllokimi dhe statistika të tabelës. ato. zgjidhja në përgjithësi është e paplotë: "Nuk ka ende një paketë të gatshme për instalim. Sugjerohet që të shkarkoni burimet dhe ta montoni vetë bibliotekën. Së pari duhet të instaloni paketën “zhvilloni” për serverin tuaj dhe të vendosni shtegun te pg_config në variablin PATH.".
Në përgjithësi, ka shumë bujë dhe në rastin e bazave të të dhënave serioze të prodhimit, mund të mos jetë e mundur të bëhet asgjë me serverin. Ne duhet të dalim me diçka tonën përsëri.
Warning.
Për shkak të vëllimit mjaft të madh dhe për shkak të periudhës jo të plotë të testimit, artikulli është kryesisht i natyrës informative, më tepër si një grup tezash dhe rezultatesh të ndërmjetme.
Materiali më i detajuar do të përgatitet më vonë, në pjesë
Hartimi i kërkesave për zgjidhjen
Është e nevojshme të zhvillohet një mjet që ju lejon të ruani:
pg_stat_activity historia e shikimit Historia e kyçjes së sesionit duke përdorur pamjen pg_locks
Kërkesa për zgjidhje– minimizoni ndikimin në bazën e të dhënave të synuar.
Ide e pergjithshme– agjenti i mbledhjes së të dhënave nuk lëshohet në bazën e të dhënave të synuar, por në bazën e të dhënave të monitorimit si një shërbim systemd. Po, disa humbje të të dhënave është e mundur, por kjo nuk është kritike për raportimin, por nuk ka asnjë ndikim në bazën e të dhënave të synuar për sa i përket memories dhe hapësirës në disk. Dhe në rastin e përdorimit të një grupi lidhjesh, ndikimi në proceset e përdoruesit është minimal.
Fazat e zbatimit
1.Tabelat e shërbimit
Një skemë e veçantë përdoret për të ruajtur tabelat, në mënyrë që të mos komplikohet analiza e tabelave kryesore të përdorura.
DROP SCHEMA IF EXISTS activity_hist ;
CREATE SCHEMA activity_hist AUTHORIZATION monitor ;
E rëndësishme: Skema nuk krijohet në bazën e të dhënave të synuar, por në bazën e të dhënave të monitorimit.
pg_stat_activity historia e shikimit
Një tabelë përdoret për të ruajtur pamjet aktuale të pamjes pg_stat_activity
activity_hist.history_pg_stat_activity:
--ACTIVITY_HIST.HISTORY_PG_STAT_ACTIVITY
DROP TABLE IF EXISTS activity_hist.history_pg_stat_activity;
CREATE TABLE activity_hist.history_pg_stat_activity
(
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text ,
queryid bigint
);
Për të shpejtuar futjen - nuk ka indekse ose kufizime.
Për të ruajtur vetë historinë, përdoret një tabelë e ndarë:
activity_hist.archive_pg_stat_activity:
DROP TABLE IF EXISTS activity_hist.archive_pg_stat_activity;
CREATE TABLE activity_hist.archive_pg_stat_activity
(
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text ,
queryid bigint
)
PARTITION BY RANGE (timepoint);
Meqenëse në këtë rast nuk ka kërkesa për shpejtësinë e futjes, janë krijuar disa indekse për të përshpejtuar krijimin e raporteve.
Historia e bllokimit të sesioneve
Një tabelë përdoret për të ruajtur pamjet aktuale të bllokimeve të sesioneve:
activity_hist.history_locking:
--ACTIVITY_HIST.HISTORY_LOCKING
DROP TABLE IF EXISTS activity_hist.history_locking;
CREATE TABLE activity_hist.history_locking
(
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
);
Gjithashtu, për të përshpejtuar futjen, nuk ka indekse ose kufizime.
Për të ruajtur vetë historinë, përdoret një tabelë e ndarë:
activity_hist.archive_locking:
DROP TABLE IF EXISTS activity_hist.archive_locking;
CREATE TABLE activity_hist.archive_locking
(
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
)
PARTITION BY RANGE (timepoint);
Meqenëse në këtë rast nuk ka kërkesa për shpejtësinë e futjes, janë krijuar disa indekse për të përshpejtuar krijimin e raporteve.
2. Plotësimi i historikut aktual
Për të mbledhur drejtpërdrejt fotografitë e pamjeve, përdoret një skrip bash që ekzekuton funksionin plpgsql.
plpgsql Funksioni dblink akseson pamjet në bazën e të dhënave të synuar dhe fut rreshta në tabelat e shërbimit në bazën e të dhënave të monitorimit.
get_current_activity.sql
CREATE OR REPLACE FUNCTION activity_hist.get_current_activity( current_host text , current_s_name text , current_s_pass text ) RETURNS BOOLEAN AS $$
DECLARE
database_rec record;
dblink_str text ;
BEGIN
EXECUTE 'SELECT dblink_connect(''LINK1'',''host='||current_host||' port=5432 dbname=postgres'||
' user='||current_s_name||' password='||current_s_pass|| ' '')';
--------------------------------------------------------------------
--GET pg_stat_activity stats
INSERT INTO activity_hist.history_pg_stat_activity
(
SELECT * FROM dblink('LINK1',
'SELECT
now() ,
datid ,
datname ,
pid ,
usesysid ,
usename ,
application_name ,
client_addr ,
client_hostname ,
client_port ,
backend_start ,
xact_start ,
query_start ,
state_change ,
wait_event_type ,
wait_event ,
state ,
backend_xid ,
backend_xmin ,
query ,
backend_type
FROM pg_stat_activity
')
AS t (
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text
)
);
---------------------------------------
--ACTIVITY_HIST.HISTORY_LOCKING
INSERT INTO activity_hist.history_locking
(
SELECT * FROM dblink('LINK1',
'SELECT
now() ,
lock.locktype,
lock.relation,
lock.mode,
lock.transactionid as tid,
lock.virtualtransaction as vtid,
lock.pid,
pg_blocking_pids(lock.pid),
lock.granted
FROM pg_catalog.pg_locks lock LEFT JOIN pg_catalog.pg_database db ON db.oid = lock.database
WHERE NOT lock.pid = pg_backend_pid()
')
AS t (
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
)
);
PERFORM dblink_disconnect('LINK1');
RETURN TRUE ;
END
$$ LANGUAGE plpgsql;
Për të mbledhur pamjet e fotografive, përdoret shërbimi systemd dhe dy skripta:
pg_aktual_activity.service
# /etc/systemd/system/pg_current_activity.service
[Unit]
Description=Collect history of pg_stat_activity , pg_locks
Wants=pg_current_activity.timer
[Service]
Type=forking
StartLimitIntervalSec=0
ExecStart=/home/postgres/pgutils/demon/get_current_activity.sh 10.124.70.40 postgres postgres
[Install]
WantedBy=multi-user.target
pg_aktiviteti_aktive.kohëmatësi
# /etc/systemd/system/pg_current_activity.timer
[Unit]
Description=Run pg_current_activity.sh every 1 second
Requires=pg_current_activity.service
[Timer]
Unit=pg_current_activity.service
OnCalendar=*:*:0/1
AccuracySec=1
[Install]
WantedBy=timers.target
Caktoni të drejtat për skriptet:
# chmod 755 pg_current_activity.timer
# chmod 755 pg_current_activity.service
Le të fillojmë shërbimin:
# systemctl daemon-reload
# systemctl nis pg_current_activity.service
Kështu, historia e pamjeve është mbledhur në formën e fotove të çastit sekondë pas sekondës. Sigurisht, nëse gjithçka lihet ashtu siç është, tavolinat do të rriten shumë shpejt në madhësi dhe puna pak a shumë produktive do të bëhet e pamundur.
Është e nevojshme të organizohet arkivimi i të dhënave.
3. Historia e arkivimit
Për arkivim, përdoret arkivi i tabelave të ndarë*.
Ndarjet e reja krijohen çdo orë, ndërsa të dhënat e vjetra hiqen nga tabelat e historisë*, kështu që madhësia e tabelave të historisë* nuk ndryshon shumë dhe shpejtësia e futjes nuk zvogëlohet me kalimin e kohës.
Krijimi i seksioneve të reja kryhet nga funksioni plpgsql activity_hist.archive_current_activity. Algoritmi i punës është shumë i thjeshtë (duke përdorur shembullin e seksionit për tabelën archive_pg_stat_activity).
Krijoni dhe plotësoni një seksion të ri
EXECUTE format(
'CREATE TABLE ' || partition_name ||
' PARTITION OF activity_hist.archive_pg_stat_activity FOR VALUES FROM ( %L ) TO ( %L ) ' ,
to_char(date_trunc('year', partition_min_range ),'YYYY')||'-'||
to_char(date_trunc('month', partition_min_range ),'MM')||'-'||
to_char(date_trunc('day', partition_min_range ),'DD')||' '||
to_char(date_trunc('hour', partition_min_range ),'HH24')||':00',
to_char(date_trunc('year', partition_max_range ),'YYYY')||'-'||
to_char(date_trunc('month', partition_max_range ),'MM')||'-'||
to_char(date_trunc('day', partition_max_range ),'DD')||' '||
to_char(date_trunc('hour', partition_max_range ),'HH24')||':00'
);
INSERT INTO activity_hist.archive_pg_stat_activity
(
SELECT *
FROM activity_hist.history_pg_stat_activity
WHERE timepoint BETWEEN partition_min_range AND partition_max_range
);
Krijimi i indekseve
EXECUTE format (
'CREATE INDEX '||index_name||
' ON '||partition_name||' ( wait_event_type , backend_type , timepoint )'
);
EXECUTE format ('CREATE INDEX '||index_name||
' ON '||partition_name||' ( wait_event_type , backend_type , timepoint , queryid )'
);
Heqja e të dhënave të vjetra nga tabela history_pg_stat_activity
DELETE
FROM activity_hist.history_pg_stat_activity
WHERE timepoint < partition_max_range;
Sigurisht, herë pas here, seksionet e vjetra fshihen si të panevojshme.
Raportet bazë
Në fakt, pse po bëhet e gjithë kjo? Për të marrë raporte shumë të paqarta të kujtojnë AWR të Oracle.
Është e rëndësishme të shtohet se për të marrë raporte, duhet të ndërtoni një lidhje midis pamjeve pg_stat_activity dhe pg_stat_statements. Tabelat lidhen duke shtuar një kolonë 'queryid' në tabelat 'history_pg_stat_activity', 'archive_pg_stat_activity'. Metoda e shtimit të një vlere kolone është përtej qëllimit të këtij artikulli dhe përshkruhet këtu − pg_stat_statements + pg_stat_activity + loq_query = pg_ash? .
KOHA TOTALE E CPU-së për pyetje
Kërkesë :
WITH hist AS
(
SELECT
aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND backend_type = 'client backend' AND datname != 'postgres' AND ( aa.wait_event_type IS NULL ) ANDaa.state = 'active'
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND backend_type = 'client backend' AND datname != 'postgres' AND ( ha.wait_event_type IS NULL )AND ha.state = 'active'
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
WITH hist AS
(
SELECT
aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( aa.wait_event_type IS NOT NULL )
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( ha.wait_event_type IS NOT NULL )
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
WITH hist AS
(
SELECT
aa.wait_event_type , aa.wait_event
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
aa.wait_event IS NOT NULL
GROUP BY aa.wait_event_type , aa.wait_event
UNION
SELECT
ha.wait_event_type , ha.wait_event
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
ha.wait_event IS NOT NULL
GROUP BY ha.wait_event_type , ha.wait_event
)
SELECT wait_event_type , wait_event
FROM hist
GROUP BY wait_event_type , wait_event
ORDER BY 1 ASC,2 ASC
----------------------------------------------------------------------
WITH hist AS
(
SELECT
aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( aa.wait_event_type = waitings_stat_rec.wait_event_type AND aa.wait_event = waitings_stat_rec.wait_event )
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( ha.wait_event_type = waitings_stat_rec.wait_event_type AND ha.wait_event = waitings_stat_rec.wait_event )
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
SELECT
MIN(date_trunc('second',timepoint)) AS started ,
count(*) * interval '1 second' as duration ,
pid , blocking_pids , relation , mode , locktype
FROM
activity_hist.archive_locking al
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY pid , blocking_pids , relation , mode , locktype
UNION
SELECT
MIN(date_trunc('second',timepoint)) AS started ,
count(*) * interval '1 second' as duration ,
pid , blocking_pids , relation , mode , locktype
FROM
activity_hist.history_locking
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY pid , blocking_pids , relation , mode , locktype
ORDER BY 1
SELECT
blocking_pids
FROM
activity_hist.archive_locking al
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY blocking_pids
UNION
SELECT
blocking_pids
FROM
activity_hist.history_locking
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY blocking_pids
ORDER BY 1
---------------------------------------------------------------
SELECT
pid , usename , application_name , datname ,
MIN(date_trunc('second',timepoint)) as started ,
count(*) * interval '1 second' as duration ,
state ,
query
FROM activity_hist.archive_pg_stat_activity
WHERE pid= current_pid AND
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour')
GROUP BY pid , usename , application_name ,
datname ,
state_change,
state ,
query
UNION
SELECT
pid , usename , application_name , datname ,
MIN(date_trunc('second',timepoint)) as started ,
count(*) * interval '1 second' as duration ,
state ,
query
FROM activity_hist.history_pg_stat_activity_for_reports
WHERE pid= current_pid AND
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour')
GROUP BY pid , usename , application_name ,
datname ,
state_change,
state ,
query
ORDER BY 5 , 1
Pyetjet bazë të shfaqura dhe raportet që rezultojnë tashmë e bëjnë jetën shumë më të lehtë kur analizohen incidentet e performancës.
Bazuar në pyetjet bazë, mund të merrni një raport që i ngjan në mënyrë të paqartë AWR-së së Oracle. Shembull raporti përmbledhës
+------------------------------------------------- ----------------------------------- | RAPORT I KONSOLIDUAR PËR AKTIVITETIN DHE PRITJET.
Vazhdon. Tjetra në radhë është krijimi i një historie bllokimi (pg_stat_locks), një përshkrim më i detajuar i procesit të plotësimit të tabelave.