Un tentativo di creare un analogo di ASH per PostgreSQL

Formulazione del problema

Per ottimizzare le query PostgreSQL, è molto richiesta la capacità di analizzare la cronologia delle attività, in particolare le attese, i blocchi e le statistiche delle tabelle.

Opportunità disponibili

Strumento di analisi del carico di lavoro storico o "AWR per Postgres": una soluzione molto interessante, ma non c'è cronologia di pg_stat_activity e pg_locks.

pgsentinel :
«Tutte le informazioni accumulate vengono archiviate solo nella RAM e la quantità di memoria consumata è regolata dal numero degli ultimi record memorizzati.

Viene aggiunto il campo queryid: lo stesso queryid dell'estensione pg_stat_statements (è richiesta la preinstallazione).«

Questo, ovviamente, aiuterebbe molto, ma la cosa più problematica è il primo punto”.Tutte le informazioni accumulate vengono archiviate solo nella RAM ", cioè. c'è un impatto sulla base target. Inoltre, non sono presenti cronologia dei blocchi e statistiche della tabella. Quelli. la soluzione è generalmente incompleta: “Non esiste ancora un pacchetto pronto per l'installazione. Si consiglia di scaricare i sorgenti e assemblare autonomamente la libreria. Devi prima installare il pacchetto “devel” per il tuo server e impostare il percorso su pg_config nella variabile PATH.".

In generale, c'è molta confusione e, nel caso di database di produzione seri, potrebbe non essere possibile fare nulla con il server. Dobbiamo inventare di nuovo qualcosa di nostro.

Attenzione.

A causa del volume piuttosto ampio e del periodo di prova incompleto, l'articolo ha principalmente carattere informativo, piuttosto che un insieme di tesi e risultati intermedi.
Materiale più dettagliato sarà preparato più avanti, in parti

Bozza dei requisiti per la soluzione

È necessario sviluppare uno strumento che permetta di memorizzare:

pg_stat_activity cronologia visualizzazioni
Cronologia dei blocchi di sessione utilizzando la vista pg_locks

Requisito risolutivo–minimizzare l'impatto sul database di destinazione.

Idea generale– l'agente di raccolta dati non viene avviato nel database di destinazione, ma nel database di monitoraggio come servizio systemd. Sì, è possibile una certa perdita di dati, ma ciò non è fondamentale per il reporting, ma non vi è alcun impatto sul database di destinazione in termini di memoria e spazio su disco. E nel caso dell'utilizzo di un pool di connessioni, l'impatto sui processi utente è minimo.

Fasi di attuazione

1.Tavoli di servizio

Per memorizzare le tabelle viene utilizzato uno schema separato, in modo da non complicare l'analisi delle principali tabelle utilizzate.

DROP SCHEMA IF EXISTS activity_hist ;
CREATE SCHEMA activity_hist AUTHORIZATION monitor ;

Importante: lo schema non viene creato nel database di destinazione, ma nel database di monitoraggio.

pg_stat_activity cronologia visualizzazioni

Una tabella viene utilizzata per archiviare le istantanee correnti della vista pg_stat_activity

Activity_hist.history_pg_stat_activity:

--ACTIVITY_HIST.HISTORY_PG_STAT_ACTIVITY
DROP TABLE IF EXISTS activity_hist.history_pg_stat_activity;
CREATE TABLE activity_hist.history_pg_stat_activity
(
  timepoint timestamp without time zone ,
  datid             oid  , 
  datname           name ,
  pid               integer,
  usesysid          oid    ,
  usename           name   ,
  application_name  text   ,
  client_addr       inet   ,
  client_hostname   text   ,
  client_port       integer,
  backend_start     timestamp with time zone ,
  xact_start        timestamp with time zone ,
  query_start       timestamp with time zone ,
  state_change      timestamp with time zone ,
  wait_event_type   text ,                     
  wait_event        text ,                   
  state             text ,                  
  backend_xid       xid  ,                 
  backend_xmin      xid  ,                
  query             text ,               
  backend_type      text ,  
  queryid           bigint
);

Per accelerare l'inserimento, nessun indice o restrizione.

Per memorizzare la cronologia stessa, viene utilizzata una tabella partizionata:

Activity_hist.archive_pg_stat_activity:

DROP TABLE IF EXISTS activity_hist.archive_pg_stat_activity;
CREATE TABLE activity_hist.archive_pg_stat_activity
(
  timepoint timestamp without time zone ,
  datid             oid  , 
  datname           name ,
  pid               integer,
  usesysid          oid    ,
  usename           name   ,
  application_name  text   ,
  client_addr       inet   ,
  client_hostname   text   ,
  client_port       integer,
  backend_start     timestamp with time zone ,
  xact_start        timestamp with time zone ,
  query_start       timestamp with time zone ,
  state_change      timestamp with time zone ,
  wait_event_type   text ,                     
  wait_event        text ,                   
  state             text ,                  
  backend_xid       xid  ,                 
  backend_xmin      xid  ,                
  query             text ,               
  backend_type      text ,
  queryid           bigint
)
PARTITION BY RANGE (timepoint);

Poiché in questo caso non sono previsti requisiti di velocità di inserimento, sono stati creati alcuni indici per velocizzare la creazione dei report.

Cronologia del blocco delle sessioni

Una tabella viene utilizzata per archiviare le istantanee correnti dei blocchi di sessione:

Activity_hist.history_locking:

--ACTIVITY_HIST.HISTORY_LOCKING
DROP TABLE IF EXISTS activity_hist.history_locking;
CREATE TABLE activity_hist.history_locking
(
	timepoint timestamp without time zone ,
	locktype text ,
	relation oid ,
	mode text ,
	tid xid ,
	vtid text ,
	pid integer ,
	blocking_pids integer[] ,
	granted boolean
);

Inoltre, per velocizzare l'inserimento, non sono presenti indici o restrizioni.

Per memorizzare la cronologia stessa, viene utilizzata una tabella partizionata:

Activity_hist.archive_locking:

DROP TABLE IF EXISTS activity_hist.archive_locking;
CREATE TABLE activity_hist.archive_locking
(
	timepoint timestamp without time zone ,
	locktype text ,
	relation oid ,
	mode text ,
	tid xid ,
	vtid text ,
	pid integer ,
	blocking_pids integer[] ,
	granted boolean	
)
PARTITION BY RANGE (timepoint);

Poiché in questo caso non sono previsti requisiti di velocità di inserimento, sono stati creati alcuni indici per velocizzare la creazione dei report.

2.Compilare la cronologia attuale

Per raccogliere direttamente le istantanee della vista, viene utilizzato uno script bash che esegue la funzione plpgsql.

get_current_activity.sh

#!/bin/bash
#########################################################
#get_current_activity.sh

ERROR_FILE='/home/demon/get_current_activity'$(date +%Y%m%d-)'T'$(date +%H)$(date +%M)$(date +%S)
host=$1
s_name=$2
s_pass=$3

psql  -A -t -q -v ON_ERROR_STOP=1 -c "SELECT activity_hist.get_current_activity( '$host' , '$s_name' , '$s_pass' )" >/dev/null 2>$ERROR_FILE

line_count=`cat $ERROR_FILE | wc -l`
if [[ $line_count != '0' ]];
then
    rm -f /home/demon/*.err >/dev/null 2>/dev/null
	cp $ERROR_FILE $ERROR_FILE'.err' >/dev/null 2>/dev/null  
fi
rm $ERROR_FILE >/dev/null 2>/dev/null
exit 0

plpgsql La funzione dblink accede alle visualizzazioni nel database di destinazione e inserisce righe nelle tabelle di servizio nel database di monitoraggio.

get_current_activity.sql

CREATE OR REPLACE FUNCTION activity_hist.get_current_activity( current_host text , current_s_name text , current_s_pass text ) RETURNS BOOLEAN AS $$
DECLARE 
  database_rec record;
  dblink_str text ;
BEGIN   

	EXECUTE 'SELECT dblink_connect(''LINK1'',''host='||current_host||' port=5432 dbname=postgres'||
	                                         ' user='||current_s_name||' password='||current_s_pass|| ' '')';



--------------------------------------------------------------------
--GET pg_stat_activity stats
	INSERT INTO activity_hist.history_pg_stat_activity
	(
		SELECT * FROM dblink('LINK1',
			'SELECT 
			now() , 
			datid             , 
			datname           ,
			pid               ,
			usesysid              ,
			usename              ,
			application_name     ,
			client_addr          ,
			client_hostname      ,
			client_port       ,
			backend_start         ,
			xact_start            ,
			query_start           ,
			state_change          ,
			wait_event_type    ,                     
			wait_event         ,                   
			state              ,                  
			backend_xid         ,                 
			backend_xmin        ,                
			query              ,               
			backend_type   			
		FROM pg_stat_activity
		') 
		AS t (
		    timepoint 		  timestamp without time zone ,			
			datid             oid  , 
			datname           name ,
			pid               integer,
			usesysid          oid    ,
			usename           name   ,
			application_name  text   ,
			client_addr       inet   ,
			client_hostname   text   ,
			client_port       integer,
			backend_start     timestamp with time zone ,
			xact_start        timestamp with time zone ,
			query_start       timestamp with time zone ,
			state_change      timestamp with time zone ,
			wait_event_type   text ,                     
			wait_event        text ,                   
			state             text ,                  
			backend_xid       xid  ,                 
			backend_xmin      xid  ,                
			query             text ,               
			backend_type      text 			
		)
	);

---------------------------------------	
--ACTIVITY_HIST.HISTORY_LOCKING	
	INSERT INTO activity_hist.history_locking
	(
		SELECT * FROM dblink('LINK1',
			'SELECT 
			now() , 
			lock.locktype,
			lock.relation,
			lock.mode,
			lock.transactionid as tid,
			lock.virtualtransaction as vtid,
			lock.pid,
			pg_blocking_pids(lock.pid), 
			lock.granted
			FROM 	pg_catalog.pg_locks lock LEFT JOIN pg_catalog.pg_database db ON db.oid = lock.database
			WHERE NOT lock.pid = pg_backend_pid()	
		') 
		AS t (
			timepoint timestamp without time zone ,
			locktype text ,
			relation oid , 
			mode text ,
			tid xid ,
			vtid text ,
			pid integer ,
			blocking_pids integer[] ,
			granted boolean
		)
	);
	PERFORM dblink_disconnect('LINK1');
	
	RETURN TRUE ;
END
$$ LANGUAGE plpgsql;

Per raccogliere le istantanee della vista, vengono utilizzati il ​​servizio systemd e due script:

pg_current_activity.service

# /etc/systemd/system/pg_current_activity.service
[Unit]
Description=Collect history of pg_stat_activity , pg_locks 
Wants=pg_current_activity.timer

[Service]
Type=forking
StartLimitIntervalSec=0
ExecStart=/home/postgres/pgutils/demon/get_current_activity.sh 10.124.70.40 postgres postgres

[Install]
WantedBy=multi-user.target

pg_current_activity.timer

# /etc/systemd/system/pg_current_activity.timer
[Unit]
Description=Run pg_current_activity.sh every 1 second
Requires=pg_current_activity.service

[Timer]
Unit=pg_current_activity.service
OnCalendar=*:*:0/1
AccuracySec=1

[Install]
WantedBy=timers.target

Assegnare diritti agli script:
# chmod 755 pg_current_activity.timer
# chmod 755 pg_current_activity.service

Iniziamo il servizio:
# systemctl daemon-reload
# systemctl start pg_current_activity.service

Pertanto, la cronologia delle visualizzazioni viene raccolta sotto forma di istantanee secondo per secondo. Naturalmente, se si lascia tutto così com'è, i tavoli aumenteranno molto rapidamente di dimensioni e il lavoro più o meno produttivo diventerà impossibile.

È necessario organizzare l'archiviazione dei dati.

3. Archiviazione della cronologia

Per l'archiviazione vengono utilizzati archivi di tabelle partizionate*.

Nuove partizioni vengono create ogni ora, mentre i vecchi dati vengono rimossi dalle tabelle della cronologia*, quindi la dimensione delle tabelle della cronologia* non cambia molto e la velocità di inserimento non diminuisce nel tempo.

La creazione di nuove sezioni viene eseguita dalla funzione plpgsqlactivity_hist.archive_current_activity. L'algoritmo di lavoro è molto semplice (usando l'esempio della sezione per la tabella archive_pg_stat_activity).

Crea e compila una nuova sezione

EXECUTE format(
'CREATE TABLE ' || partition_name || 
' PARTITION OF activity_hist.archive_pg_stat_activity FOR VALUES FROM ( %L ) TO ( %L ) ' , 
to_char(date_trunc('year', partition_min_range ),'YYYY')||'-'||
to_char(date_trunc('month', partition_min_range ),'MM')||'-'||
to_char(date_trunc('day', partition_min_range ),'DD')||' '||
to_char(date_trunc('hour', partition_min_range ),'HH24')||':00', 
to_char(date_trunc('year', partition_max_range ),'YYYY')||'-'||
to_char(date_trunc('month', partition_max_range ),'MM')||'-'||
to_char(date_trunc('day', partition_max_range ),'DD')||' '||
to_char(date_trunc('hour', partition_max_range ),'HH24')||':00'
);

INSERT INTO activity_hist.archive_pg_stat_activity
(
	SELECT 	* 
	FROM 	activity_hist.history_pg_stat_activity
	WHERE 	timepoint BETWEEN partition_min_range AND partition_max_range 		
);

Creazione di indici

EXECUTE format	(
'CREATE INDEX '||index_name||
' ON '||partition_name||' ( wait_event_type , backend_type , timepoint )' 
);

EXECUTE format	('CREATE INDEX '||index_name||
' ON '||partition_name||' ( wait_event_type , backend_type , timepoint , queryid )' 
);

Rimozione dei vecchi dati dalla tabella History_pg_stat_activity

DELETE 
FROM 	activity_hist.history_pg_stat_activity
WHERE 	timepoint < partition_max_range;

Naturalmente, di tanto in tanto, le vecchie sezioni vengono cancellate perché non necessarie.

Rapporti di base

In realtà, perché viene fatto tutto questo? Per ottenere report che ricordano molto vagamente l'AWR di Oracle.

È importante aggiungere che per ricevere report è necessario creare una connessione tra le viste pg_stat_activity e pg_stat_statements. Le tabelle sono collegate aggiungendo una colonna "queryid" alle tabelle "history_pg_stat_activity", "archive_pg_stat_activity". Il metodo per aggiungere un valore di colonna va oltre lo scopo di questo articolo ed è descritto qui − pg_stat_statements + pg_stat_activity + loq_query = pg_ash? .

TEMPO CPU TOTALE PER LE QUERY

Richiesta :

WITH hist AS
(
SELECT 
	aa.query ,aa.queryid ,			
	count(*) * interval '1 second' AS duration 
FROM 	activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND  pg_stat_history_end+(current_hour_diff * interval '1 hour')  AND backend_type = 'client backend' AND datname != 'postgres' AND	( aa.wait_event_type IS NULL  ) ANDaa.state = 'active'
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid		
UNION 
SELECT 
	ha.query ,ha.queryid,
	count(*) * interval '1 second' AS duration 
FROM 	activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour')  AND 	backend_type = 'client backend' AND datname != 'postgres' AND ( ha.wait_event_type IS NULL  )AND ha.state = 'active'
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid		
)
SELECT 	query , queryid , SUM( duration ) as duration 
FROM hist
GROUP BY  query , queryid 
ORDER BY 3 DESC

Esempio:

-------------------------------------------------------------------
| TOTAL CPU TIME FOR QUERIES : 07:47:36
+----+----------------------------------------+--------------------
|   #|                                 queryid|            duration
+----+----------------------------------------+--------------------
|   1|                      389015618226997618|            04:28:58
|   2|                                        |            01:07:29
|   3|                     1237430309438971376|            00:59:38
|   4|                     4710212362688288619|            00:50:48
|   5|                       28942442626229688|            00:15:50
|   6|                     9150846928388977274|            00:04:46
|   7|                    -6572922443698419129|            00:00:06
|   8|                                        |            00:00:01
+----+----------------------------------------+--------------------

TEMPO TOTALE DI ATTESA PER LE RICHIESTE

Richiesta :

WITH hist AS
(
SELECT 
	aa.query ,aa.queryid ,			
	count(*) * interval '1 second' AS duration 
FROM 	activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour')  AND 
	backend_type = 'client backend' AND datname != 'postgres' AND
	( aa.wait_event_type IS NOT NULL  ) 
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid		
UNION 
SELECT 
	ha.query ,ha.queryid,
	count(*) * interval '1 second' AS duration 
FROM 	activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour')  AND 
	backend_type = 'client backend' AND datname != 'postgres' AND				
	( ha.wait_event_type IS NOT NULL  )
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid		
)
SELECT 	query , queryid , SUM( duration ) as duration 
FROM hist
GROUP BY  query , queryid 
ORDER BY 3 DESC 

Esempio:

-------------------------------------------------------------------
| TOTAL WAITINGS TIME FOR QUERIES : 21:55:04
+----+----------------------------------------+--------------------
|   #|                                 queryid|            duration
+----+----------------------------------------+--------------------
|   1|                      389015618226997618|            16:19:05
|   2|                                        |            03:47:04
|   3|                     8085340880788646241|            00:40:20
|   4|                     4710212362688288619|            00:13:35
|   5|                     9150846928388977274|            00:12:25
|   6|                       28942442626229688|            00:11:32
|   7|                     1237430309438971376|            00:09:45
|   8|                     2649515222348904837|            00:09:37
|   9|                                        |            00:03:45
|  10|                     3167065002719415275|            00:02:20
|  11|                     5731212217001535134|            00:02:13
|  12|                     8304755792398128062|            00:01:31
|  13|                     2649515222348904837|            00:00:59
|  14|                     2649515222348904837|            00:00:22
|  15|                                        |            00:00:12
|  16|                     3422818749220588372|            00:00:08
|  17|                    -5730801771815999400|            00:00:03
|  18|                    -1473395109729441239|            00:00:02
|  19|                     2404820632950544954|            00:00:02
|  20|                    -6572922443698419129|            00:00:02
|  21|                     2369289265278398647|            00:00:01
|  22|                      180077086776069052|            00:00:01
+----+----------------------------------------+--------------------

ASPETTANDO DOMANDE

Richieste:

WITH hist AS
(
SELECT 
	aa.wait_event_type , aa.wait_event 
FROM 	activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND 
	backend_type = 'client backend' AND datname != 'postgres' AND
	aa.wait_event IS NOT NULL 
GROUP BY aa.wait_event_type , aa.wait_event
UNION 
SELECT 
	ha.wait_event_type , ha.wait_event 
FROM 	activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND 
	backend_type = 'client backend' AND datname != 'postgres' AND
	ha.wait_event IS NOT NULL 
GROUP BY ha.wait_event_type , ha.wait_event		
)
SELECT 	wait_event_type , wait_event 
FROM hist
GROUP BY wait_event_type , wait_event
ORDER BY 1 ASC,2 ASC

----------------------------------------------------------------------

WITH hist AS
(
SELECT 
	aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid ,			
	count(*) * interval '1 second' AS duration 
FROM 	activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND 
	backend_type = 'client backend' AND datname != 'postgres' AND
	( aa.wait_event_type = waitings_stat_rec.wait_event_type AND aa.wait_event = waitings_stat_rec.wait_event )
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid		
UNION 
SELECT 
	ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid,
	count(*) * interval '1 second' AS duration 
FROM 	activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND 
	backend_type = 'client backend' AND datname != 'postgres' AND				
	( ha.wait_event_type = waitings_stat_rec.wait_event_type AND ha.wait_event = waitings_stat_rec.wait_event )
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid		
)
SELECT 	query , queryid , SUM( duration ) as duration 
FROM hist
GROUP BY  query , queryid 
ORDER BY 3 DESC

Esempio:

------------------------------------------------
| WAITINGS FOR QUERIES
+-----------------------------------------------
|                      wait_event_type = Client|
|                       wait_event = ClientRead|
|                        Total time  = 00:46:56|
------------------------------------------------
|    #|             queryid|            duration
+-----+--------------------+--------------------
|    1| 8085340880788646241|            00:40:20
|    2|                    |            00:03:45
|    3| 5731212217001535134|            00:01:53
|    4|                    |            00:00:12
|    5| 9150846928388977274|            00:00:09
|    6| 3422818749220588372|            00:00:08
|    7| 1237430309438971376|            00:00:06
|    8|   28942442626229688|            00:00:05
|    9| 4710212362688288619|            00:00:05
|   10|-5730801771815999400|            00:00:03
|   11| 8304755792398128062|            00:00:02
|   12|-6572922443698419129|            00:00:02
|   13|-1473395109729441239|            00:00:02
|   14| 2404820632950544954|            00:00:02
|   15|  180077086776069052|            00:00:01
|   16| 2369289265278398647|            00:00:01

+-----------------------------------------------
|                          wait_event_type = IO|
|                      wait_event = BufFileRead|
|                        Total time  = 00:00:38|
------------------------------------------------
|    #|             queryid|            duration
+-----+--------------------+--------------------
|    1|   28942442626229688|            00:00:38

+-----------------------------------------------

STORIA DEI PROCESSI BLOCCATI

Richiesta:

SELECT 
MIN(date_trunc('second',timepoint)) AS started , 
	count(*) * interval '1 second' as duration ,
	pid , blocking_pids , relation , mode , locktype 	 
FROM 
	activity_hist.archive_locking al 
WHERE 
	timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
	NOT granted AND 
	locktype = 'relation' 
GROUP BY pid , blocking_pids , relation , mode , locktype			
UNION
SELECT 
	MIN(date_trunc('second',timepoint)) AS started , 
	count(*) * interval '1 second' as duration ,
	pid , blocking_pids , relation , mode , locktype
FROM 
	activity_hist.history_locking 
WHERE 
	timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
	NOT granted AND 
	locktype = 'relation' 
GROUP BY pid , blocking_pids , relation , mode , locktype			
ORDER BY 1

Esempio:

-------------------------------------------------- -------------------------------------------------- --------------------------------- | STORICO PROCESSI BLOCCATI +-----+----------+-----+-------- --+------------ --------+--------------------+----- --------------- +------------------- | #| pid| iniziato| durata| blocking_pids| relazione| modalità| tipo di blocco +----------+----------+-----+---------- +--------- -----------+-----------+------- -------------+----- -------------- | 1| 26224| 2019-09-02 19:32:16| 00:01:45| {26211}| 16541| AccediCondividiBlocca| relazione | 2| 26390| 2019-09-02 19:34:03| 00:00:53| {26211}| 16541| AccediCondividiBlocca| relazione | 3| 26391| 2019-09-02 19:34:03| 00:00:53| {26211}| 16541| AccediCondividiBlocca| relazione | 4| 26531| 2019-09-02 19:35:27| 00:00:12| {26211}| 16541| AccediCondividiBlocca| relazione | 5| 27284| 2019-09-02 19:44:02| 00:00:19| {27276}| 16541| AccediCondividiBlocca| relazione | 6| 27283| 2019-09-02 19:44:02| 00:00:19| {27276}| 16541| AccediCondividiBlocca| relazione | 7| 27286| 2019-09-02 19:44:02| 00:00:19| {27276}| 16541| AccediCondividiBlocca| relazione | 8| 27423| 2019-09-02 19:45:24| 00:00:12| {27394}| 16541| AccediCondividiBlocca| relazione | 9| 27648| 2019-09-02 19:48:06| 00:00:20| {27647}| 16541| AccediCondividiBlocca| relazione | 10| 27650| 2019-09-02 19:48:06| 00:00:20| {27647}| 16541| AccediCondividiBlocca| relazione | 11| 27735| 2019-09-02 19:49:08| 00:00:06| {27650}| 16541| AccessoBloccoEsclusivo| relazione | 12| 28380| 2019-09-02 19:56:03| 00:01:56| {28379}| 16541| AccediCondividiBlocca| relazione | 13| 28379| 2019-09-02 19:56:03| 00:00:01| 28377| 16541| AccessoBloccoEsclusivo| relazione | | | | | 28376| | 

STORIA DEI PROCESSI DI BLOCCO

Richieste:

SELECT 
blocking_pids 
FROM 
	activity_hist.archive_locking al 
WHERE 
	timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
	NOT granted AND 
	locktype = 'relation' 
GROUP BY blocking_pids 		
UNION
SELECT 
	blocking_pids 
FROM 
	activity_hist.history_locking 
WHERE 
	timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
	NOT granted AND 
	locktype = 'relation' 
GROUP BY blocking_pids 		
ORDER BY 1

---------------------------------------------------------------

SELECT 
	pid , usename , application_name , datname ,
	MIN(date_trunc('second',timepoint)) as started , 
	count(*) * interval '1 second' as duration ,		 
	state , 
	query
				FROM  	activity_hist.archive_pg_stat_activity
				WHERE 	pid= current_pid AND 
						timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') 						 
				GROUP BY pid , usename , application_name , 
						datname , 
						state_change, 
						state , 
						query 
				UNION
				SELECT 
					pid , usename , application_name , datname ,
					MIN(date_trunc('second',timepoint)) as started , 
					count(*) * interval '1 second' as duration ,		 
					state , 
					query
				FROM  	activity_hist.history_pg_stat_activity_for_reports
				WHERE 	pid= current_pid AND 
						timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') 						 
				GROUP BY pid , usename , application_name , 
						datname , 
						state_change, 
						state , 
						query 
				ORDER BY 5 , 1

Esempio:

-------------------------------------------------- -------------------------------------------------- -------------------------------------------------- ----------------------- STORICO PROCESSI DI BLOCCO +----+----------+------- ---+--------------------+----------+------ ------+--------------------+--------------------- - -------+---------------------------------------------- | #| pid| nomeuso| nome_applicazione| nomedati| iniziato| durata| stato| interrogazione +----------+----------+----------+-----+ --------- -+--------------------+------------ --+------ -------------------+---------------- ------- ----------------- | 1| 26211| utente| psql| tdb1| 2019-09-02 19:31:54| 00:00:04| inattivo| | 2| 26211| utente| psql| tdb1| 2019-09-02 19:31:58| 00:00:06| inattivo nella transazione| inizio; | 3| 26211| utente| psql| tdb1| 2019-09-02 19:32:16| 00:01:45| inattivo nella transazione| blocca la tabella wafer_data; | 4| 26211| utente| psql| tdb1| 2019-09-02 19:35:54| 00:01:23| inattivo| commettere; | 5| 26211| utente| psql| tdb1| 2019-09-02 19:38:46| 00:00:02| inattivo nella transazione| inizio; | 6| 26211| utente| psql| tdb1| 2019-09-02 19:38:54| 00:00:08| inattivo nella transazione| blocca la tabella wafer_data; | 7| 26211| utente| psql| tdb1| 2019-09-02 19:39:08| 00:42:42| inattivo| commettere; | 8| 26211| utente| psql| tdb1| 2019-09-03 07:12:07| 00:00:52| attivo| seleziona prova_del();

Sviluppo.

Le query di base mostrate e i report risultanti rendono già la vita molto più semplice durante l'analisi degli incidenti relativi alle prestazioni.
Sulla base di query di base, puoi ottenere un report che ricorda vagamente l'AWR di Oracle.
Esempio di rapporto riepilogativo

+------------------------------------------------- ----------------------------------- | RELAZIONE CONSOLIDATA DI ATTIVITÀ E ATTESE. 

Continua. Il prossimo passo è la creazione di una cronologia dei lock (pg_stat_locks), una descrizione più dettagliata del processo di riempimento delle tabelle.

Fonte: habr.com

Aggiungi un commento