Monitoraghju di u rendiment di e dumande PostgreSQL. Parte 1 - rapportu

Ingegnere - traduttu da u latinu - inspiratu.
Un ingegnere pò fà tuttu. (c) R. Diesel.
Epigrafi.
Monitoraghju di u rendiment di e dumande PostgreSQL. Parte 1 - rapportu
O una storia per quessa chì un amministratore di basa di dati deve ricurdà u so passatu di prugrammazione.

Prélude

Tutti i nomi sò stati cambiati. I partiti sò casuali. U materiale hè solu l'opinione persunale di l'autore.

Disclaimer di garanzie: in a seria di articuli pianificati ùn ci sarà micca una descrizzione dettagliata è precisa di e tavule è scripts utilizati. I materiali ùn ponu micca immediatamente utilizati "AS IS".
Prima, per via di a grande quantità di materiale,
siconda, per via di a sharpness cù a basa di pruduzzione di un veru cliente.
Dunque, solu idee è descrizzioni in a forma più generale seranu datu in l'articuli.
Forsi in u futuru u sistema cresce à u livellu di pubblicazione in GitHub, o forse micca. U tempu mostrarà.

U principiu di a storia -Ti ricordi cumu tuttu principia».
Ciò chì hè accadutu in u risultatu, in i termini più generale - "Sintesi cum'è unu di i metudi per migliurà u rendiment PostgreSQL»

Perchè aghju bisognu di tuttu questu?

Ebbè, prima, per ùn scurdà di sè stessu, ricurdendu i ghjorni gloriosi in a ritirata.
Siconda, per sistematizà ciò chì era scrittu. Dighjà per mè stessu, qualchì volta cumencia à cunfundà è scurdate di parti separate.

Eppo, è più impurtante - di colpu pò esse utile per qualchissia è aiutanu micca à reinventà a rota è micca à cullà un rake. In altri palori, migliurà u vostru karma (micca Khabrovsky). Perchè a cosa più preziosa in questu mondu hè l'idee. A cosa principal hè di truvà una idea. È per traduce l'idea in a realità hè digià un prublema puramente tecnicu.

Allora cuminciamu pianu pianu...

Formulazione di u prublema.

Disponibile:

PostgreSQL (10.5), carica mista (OLTP + DSS), carica media à ligera, ospitata in u nuvulu AWS.
Ùn ci hè micca un monitoraghju di basa di dati, u monitoraghju di l'infrastruttura hè presentatu cum'è strumenti AWS standard in una cunfigurazione minima.

Ubligatoriu:

Monitorà u rendiment è u statutu di a basa di dati, truvate è avete infurmazioni iniziali per ottimisà e dumande di basa di dati pesanti.

Breve introduzione o analisi di suluzione

Per principià, pruvate d'analizà l'opzioni per risolve u prublema da u puntu di vista di una analisi comparativa di i benefizii è i prublemi per l'ingegnere, è lasciate chì quelli chì sò supposti esse nantu à a lista di u persunale si trattanu di i benefici è pèrdite. di gestione.

Opzione 1 - "U travagliu nantu à a dumanda"

Lasciamu tuttu cumu hè. Se u cliente ùn hè micca cuntentu di qualcosa in a salute, u funziunamentu di a basa di dati o l'applicazione, hà da avvisà l'ingegneri DBA per e-mail o creendu un incidente in a scatula di u bigliettu.
Un ingegnere, avè ricivutu una notificazione, capisce u prublema, offre una suluzione, o scacciate u prublema, sperendu chì tuttu si risolve, è in ogni modu, tuttu sarà prestu scurdatu.
Pan di zenzeru è ciambelle, contusioni è bumpsPan di zenzeru è donuts:
1. Nunda extra à fà
2. Ci hè sempre l'uppurtunità di esce è imbruttassi.
3. Un saccu di tempu chì pudete passà nantu à u vostru propiu.
Contusioni è contusioni:
1. Prima o dopu, u cliente hà da pensà à l'essenza di l'esse è a ghjustizia universale in questu mondu è torna una volta à dumandà sè stessu a quistione - perchè li pagu i mo soldi? A cunsiquenza hè sempre a stessa - l'unica quistione hè quandu u cliente si annoia è si salutava. È l'alimentatore hè viotu. Hè tristu.
2. U sviluppu di un ingegnere hè zero.
3. Difficultà à pianificà u travagliu è a carica

Opzione 2 - "Dance with tambourines, put on and put on shoes"

Paragrafu 1-Perchè avemu bisognu di un sistema di surviglianza, riceveremu tutte e dumande. Lancemu una mansa di ogni tipu di dumande à u dizziunariu di dati è viste dinamiche, accendemu ogni tipu di cuntatori, purtemu tuttu in tavule, analizà periodicamente listi è tabelle, per esse. In u risultatu, avemu belli o micca assai grafici, tavule, rapporti. A cosa principal - chì saria più, più.
Paragrafu 2-Generate attività-run l'analisi di tuttu stu.
Paragrafu 3-Avemu preparatu un certu documentu, chjamemu stu documentu, simpricimenti - "cumu domu equipà a basa di dati".
Paragrafu 4- U cliente, videndu tutta questa magnificenza di gràfiche è figure, hè in una cunfidenza ingenua infantile - avà tuttu hà da travaglià per noi, prestu. È, facilmente è senza dolore parte cù e so risorse finanziarie. A gestione hè ancu sicura chì i nostri ingegneri travaglianu duramente. Carica massima.
Paragrafu 5- Repetite u passu 1 regularmente.
Pan di zenzeru è ciambelle, contusioni è bumpsPan di zenzeru è donuts:
1. A vita di i gestori è l'ingegneri hè simplice, prevedibile è pienu di attività. Tuttu hè buzzing, ognunu hè occupatu.
2. A vita di u cliente hè ancu micca male - hè sempre sicuru chì avete bisognu di pacienza pocu è tuttu hà da travaglià. Migliurà micca, bè, bè - stu mondu hè inghjustu, in a vita dopu - furtunatu.
Contusioni è contusioni:
1. Prima o dopu, ci sarà un fornitore più intelligente di un serviziu simili chì farà u listessu, ma un pocu più prezzu. È se u risultatu hè u listessu, perchè pagà più. Chì torna à purtà à a scumparsa di l'alimentatore.
2. Hè noiosa. Quantu noiosa ogni pocu attività significativa.
3. Cum'è in a versione precedente - senza sviluppu. Ma per un ingegnere, u minus hè chì, à u cuntrariu di a prima opzione, quì avete bisognu di generà constantemente un IDB. È chì ci vole tempu. Chì pò esse passatu per u benefiziu di u vostru amatu. Perchè ùn pudete micca piglià cura di sè stessu, tutti si preoccupanu di voi.

Opzione 3 - Ùn ci hè bisognu di inventà una bicicletta, avete bisognu di cumprà è cavalcà.

L'ingegneri di altre cumpagnie manghjanu sapientemente pizza cù a biera (oh, i tempi gloriosi di San Petruburgu in l'anni 90). Utilizemu sistemi di surviglianza chì sò fatti, debuggati è travagliendu, è in generale, portanu benefici (bene, almenu à i so creatori).
Pan di zenzeru è ciambelle, contusioni è bumpsPan di zenzeru è donuts:
1. Ùn ci vole à perde u tempu à inventà ciò chì hè digià inventatu. Pigliate è aduprà.
2. I sistemi di monitoraghju ùn sò micca scritti da stupidi, è di sicuru sò utili.
3. Sistemi di surviglianza di travagliu di solitu furnisce infurmazione filtrata utile.
Contusioni è contusioni:
1. L'ingegnere in questu casu ùn hè micca un ingegnere, ma solu un utilizatore di u pruduttu di qualcunu altru, o un utilizatore.
2. U cliente deve esse cunvinta di a necessità di cumprà qualcosa chì in generale ùn vole micca capisce, è ùn deve micca, è in generale u budgetu per l'annu hè statu appruvatu è ùn cambia micca. Allora avete bisognu di assignà una risorsa separata, cunfigurà per un sistema specificu. Quelli. Prima avete bisognu di pagà, pagà è pagà di novu. È u cliente hè avara. Questa hè a norma di sta vita.

Chì fà, Chernyshevsky? A vostra dumanda hè assai pertinente. (Cù)

In questu casu particulari è a situazione attuale, pudete fà un pocu sfarente - femu u nostru sistema di surviglianza.
Monitoraghju di u rendiment di e dumande PostgreSQL. Parte 1 - rapportu
Ebbè, micca un sistema, sicuru, in u sensu sanu di a parolla, questu hè troppu forte è presuntuoso, ma almenu in qualchì manera facenu più faciule per sè stessu è recullà più infurmazione per risolve incidenti di rendiment. Per ùn truvà micca in una situazione - "andate quì, ùn sò micca induve, truvate chì, ùn sò micca ciò chì".

Chì sò i vantaghji è i contra di sta opzione:

Pros:
1. Hè interessante. Eppo, almenu più interessante di u custante "shrink datafile, altera tablespace, etc."
2. Quessi sò novi cumpetenze è novu sviluppu. Chì in u futuru, prima o dopu, dà gingerbread è donuts ben meritati.
Cons:
1. Avè à travaglià. U travagliu assai.
2. Avete da spiegà regularmente u significatu è e prospettive di tutte l'attività.
3. Qualcosa hà da esse sacrificatu, perchè l'unicu risorsu dispunibule per l'ingegnere - u tempu - hè limitatu da l'Universu.
4. U peghju è u più dispiacevule - in u risultatu, basura cum'è "Micca un surci, micca una rana, ma un animali scunnisciutu" pò esce.

Quellu chì ùn risicate micca qualcosa ùn beie micca champagne.
Allora, u divertimentu principia.

Idea generale - schematic

Monitoraghju di u rendiment di e dumande PostgreSQL. Parte 1 - rapportu
(Illustrazione presa da l'articulu «Sintesi cum'è unu di i metudi per migliurà u rendiment PostgreSQL")

Spiegazione:

  • A basa di dati di destinazione hè stallata cù l'estensione standard PostgreSQL "pg_stat_statements".
  • In a basa di dati di monitoraghju, creemu un settore di tavule di serviziu per almacenà a storia pg_stat_statements in a fase iniziale è per cunfigurà metriche è monitorizazione in u futuru.
  • Nant'à l'ospite di monitoraghju, creemu un set di scripts bash, cumprese quelli per generà incidenti in u sistema di bigliettu.

Tavule di serviziu

Per cumincià, un ERD schematicamente simplificatu, ciò chì hè accadutu à a fine:
Monitoraghju di u rendiment di e dumande PostgreSQL. Parte 1 - rapportu
Breve descrizzione di e tavuleendpoint - host, puntu di cunnessione à l'istanza
a basa - Opzioni di basa di dati
pg_stat_history - tabella storica per almacenà snapshots tempuranee di a vista pg_stat_statements di a basa di dati di destinazione
metric_glossary - Dizziunariu di metrica di rendiment
metric_config - cunfigurazione di metriche individuali
metrica - una metrica specifica per a dumanda chì hè monitorata
metric_alert_history - storia di avvisi di prestazione
log_query - tabella di serviziu per almacenà i registri analizzati da u schedariu di log PostgreSQL scaricatu da AWS
basi - paràmetri di u periodu di tempu utilizatu cum'è basa
puntu di cuntrollu - cunfigurazione di metriche per verificà u statutu di a basa di dati
checkpoint_alert_history - storia d'avvertimentu di e metriche di verificazione di u statutu di a basa di dati
pg_stat_db_queries - tavola di serviziu di e dumande attive
attività_log - tabella di serviziu di log di attività
trappula - tabella di serviziu di cunfigurazione di trappule

Stage 1 - raccoglie statistiche di rendiment è uttene rapporti

Una tavula hè aduprata per almacenà l'infurmazioni statistiche. pg_stat_history
pg_stat_history struttura di a tabella

                                          Table "public.pg_stat_history" Colonna | tipu | Modificatori--------------------+--------------------- --+---- -------------------------------- id | interu | micca null default nextval('pg_stat_history_id_seq'::regclass) snapshot_timestamp | timestamp senza timezone | database_id | interu | dbid | oid | userid | oid | queryid | bigint | dumanda | testu | chjama | bigint | tempu_tutali | doppia precisione | min_time | doppia precisione | max_time | doppia precisione | mediu_tempu | doppia precisione | stddev_time | doppia precisione | fila | bigint | shared_blks_hit | bigint | shared_blks_read | bigint | shared_blks_dirtied | bigint | shared_blks_written | bigint | local_blks_hit | bigint | local_blks_read | bigint | local_blks_dirtied | bigint | locale_blks_scritto | bigint | temp_blks_read | bigint | temp_blks_scritti | bigint | blk_read_time | doppia precisione | blk_write_time | doppia precisione | baseline_id | interu | Indici: "pg_stat_history_pkey" CHIAVE PRIMARIA, btree (id) "database_idx" btree (database_id) "queryid_idx" btree (queryid) "snapshot_timestamp_idx" btree (snapshot_timestamp) Foreign-key constraints FOREIGN-Database_EID_FEY_base: basa di dati (id ) ON DELETE CASCADE

Comu pudete vede, a tavula hè solu una vista cumulativa di dati pg_stat_statements in a basa di dati di destinazione.

L'usu di sta tavola hè assai simplice.

pg_stat_history rapprisentarà e statistiche accumulate di l'esekzione di a dumanda per ogni ora. À u principiu di ogni ora, dopu à riempie a tavula, statistiche pg_stat_statements resetta cun pg_stat_statements_reset().
Nutate bè: statistiche sò cullate per e dumande cù una durata di più di 1 secondu.
Populà a tabella pg_stat_history

--pg_stat_history.sql
CREATE OR REPLACE FUNCTION pg_stat_history( ) RETURNS boolean AS $$
DECLARE
  endpoint_rec record ;
  database_rec record ;
  pg_stat_snapshot record ;
  current_snapshot_timestamp timestamp without time zone;
BEGIN
  current_snapshot_timestamp = date_trunc('minute',now());  
  
  FOR endpoint_rec IN SELECT * FROM endpoint 
  LOOP
    FOR database_rec IN SELECT * FROM database WHERE endpoint_id = endpoint_rec.id 
	  LOOP
	    
		RAISE NOTICE 'NEW SHAPSHOT IS CREATING';
		
		--Connect to the target DB	  
	    EXECUTE 'SELECT dblink_connect(''LINK1'',''host='||endpoint_rec.host||' dbname='||database_rec.name||' user=USER password=PASSWORD '')';
 
        RAISE NOTICE 'host % and dbname % ',endpoint_rec.host,database_rec.name;
		RAISE NOTICE 'Creating snapshot of pg_stat_statements for database %',database_rec.name;
		
		SELECT 
	      *
		INTO 
		  pg_stat_snapshot
	    FROM dblink('LINK1',
	      'SELECT 
	       dbid , SUM(calls),SUM(total_time),SUM(rows) ,SUM(shared_blks_hit) ,SUM(shared_blks_read) ,SUM(shared_blks_dirtied) ,SUM(shared_blks_written) , 
           SUM(local_blks_hit) , SUM(local_blks_read) , SUM(local_blks_dirtied) , SUM(local_blks_written) , SUM(temp_blks_read) , SUM(temp_blks_written) , SUM(blk_read_time) , SUM(blk_write_time)
	       FROM pg_stat_statements WHERE dbid=(SELECT oid from pg_database where datname=current_database() ) 
		   GROUP BY dbid
  	      '
	               )
	      AS t
	       ( dbid oid , calls bigint , 
  	         total_time double precision , 
	         rows bigint , shared_blks_hit bigint , shared_blks_read bigint ,shared_blks_dirtied bigint ,shared_blks_written	 bigint ,
             local_blks_hit	 bigint ,local_blks_read bigint , local_blks_dirtied bigint ,local_blks_written bigint ,
             temp_blks_read	 bigint ,temp_blks_written bigint ,
             blk_read_time double precision , blk_write_time double precision	  
	       );
		 
		INSERT INTO pg_stat_history
          ( 
		    snapshot_timestamp  ,database_id  ,
			dbid , calls  ,total_time ,
            rows ,shared_blks_hit  ,shared_blks_read  ,shared_blks_dirtied  ,shared_blks_written ,local_blks_hit , 	 	
            local_blks_read,local_blks_dirtied,local_blks_written,temp_blks_read,temp_blks_written, 	
            blk_read_time, blk_write_time 
		  )		  
	    VALUES
	      (
	       current_snapshot_timestamp ,
		   database_rec.id ,
	       pg_stat_snapshot.dbid ,pg_stat_snapshot.calls,
	       pg_stat_snapshot.total_time,
	       pg_stat_snapshot.rows ,pg_stat_snapshot.shared_blks_hit ,pg_stat_snapshot.shared_blks_read ,pg_stat_snapshot.shared_blks_dirtied ,pg_stat_snapshot.shared_blks_written , 
           pg_stat_snapshot.local_blks_hit , pg_stat_snapshot.local_blks_read , pg_stat_snapshot.local_blks_dirtied , pg_stat_snapshot.local_blks_written , 
	       pg_stat_snapshot.temp_blks_read , pg_stat_snapshot.temp_blks_written , pg_stat_snapshot.blk_read_time , pg_stat_snapshot.blk_write_time 	   
	      );		   
		  
        RAISE NOTICE 'Creating snapshot of pg_stat_statements for queries with min_time more than 1000ms';
	
        FOR pg_stat_snapshot IN
          --All queries with max_time greater than 1000 ms
	      SELECT 
	        *
	      FROM dblink('LINK1',
	        'SELECT 
	         dbid , userid ,queryid,query,calls,total_time,min_time ,max_time,mean_time, stddev_time ,rows ,shared_blks_hit ,
			 shared_blks_read ,shared_blks_dirtied ,shared_blks_written , 
             local_blks_hit , local_blks_read , local_blks_dirtied , 
			 local_blks_written , temp_blks_read , temp_blks_written , blk_read_time , 
			 blk_write_time
	         FROM pg_stat_statements 
			 WHERE dbid=(SELECT oid from pg_database where datname=current_database() AND min_time >= 1000 ) 
  	        '

	                  )
	        AS t
	         ( dbid oid , userid oid , queryid bigint ,query text , calls bigint , 
  	           total_time double precision ,min_time double precision	 ,max_time double precision	 , mean_time double precision	 ,  stddev_time double precision	 , 
	           rows bigint , shared_blks_hit bigint , shared_blks_read bigint ,shared_blks_dirtied bigint ,shared_blks_written	 bigint ,
               local_blks_hit	 bigint ,local_blks_read bigint , local_blks_dirtied bigint ,local_blks_written bigint ,
               temp_blks_read	 bigint ,temp_blks_written bigint ,
               blk_read_time double precision , blk_write_time double precision	  
	         )
	    LOOP
		  INSERT INTO pg_stat_history
          ( 
		    snapshot_timestamp  ,database_id  ,
			dbid ,userid  , queryid  , query  , calls  ,total_time ,min_time ,max_time ,mean_time ,stddev_time ,
            rows ,shared_blks_hit  ,shared_blks_read  ,shared_blks_dirtied  ,shared_blks_written ,local_blks_hit , 	 	
            local_blks_read,local_blks_dirtied,local_blks_written,temp_blks_read,temp_blks_written, 	
            blk_read_time, blk_write_time 
		  )		  
	      VALUES
	      (
	       current_snapshot_timestamp ,
		   database_rec.id ,
	       pg_stat_snapshot.dbid ,pg_stat_snapshot.userid ,pg_stat_snapshot.queryid,pg_stat_snapshot.query,pg_stat_snapshot.calls,
	       pg_stat_snapshot.total_time,pg_stat_snapshot.min_time ,pg_stat_snapshot.max_time,pg_stat_snapshot.mean_time, pg_stat_snapshot.stddev_time ,
	       pg_stat_snapshot.rows ,pg_stat_snapshot.shared_blks_hit ,pg_stat_snapshot.shared_blks_read ,pg_stat_snapshot.shared_blks_dirtied ,pg_stat_snapshot.shared_blks_written , 
           pg_stat_snapshot.local_blks_hit , pg_stat_snapshot.local_blks_read , pg_stat_snapshot.local_blks_dirtied , pg_stat_snapshot.local_blks_written , 
	       pg_stat_snapshot.temp_blks_read , pg_stat_snapshot.temp_blks_written , pg_stat_snapshot.blk_read_time , pg_stat_snapshot.blk_write_time 	   
	      );
		  
        END LOOP;

        PERFORM dblink_disconnect('LINK1');  
				
	  END LOOP ;--FOR database_rec IN SELECT * FROM database WHERE endpoint_id = endpoint_rec.id 
    
  END LOOP;

RETURN TRUE;  
END
$$ LANGUAGE plpgsql;

In u risultatu, dopu un certu periodu di tempu in a tavula pg_stat_history averemu un set di snapshots di u cuntenutu di a tavula pg_stat_statements basa di dati di destinazione.

In fatti rapportu

Utilizendu e dumande simplici, pudete uttene rapporti abbastanza utili è interessanti.

Dati aggregati per un certu periodu di tempu

Inchiesta

SELECT 
  database_id , 
  SUM(calls) AS calls ,SUM(total_time)  AS total_time ,
  SUM(rows) AS rows , SUM(shared_blks_hit)  AS shared_blks_hit,
  SUM(shared_blks_read) AS shared_blks_read ,
  SUM(shared_blks_dirtied) AS shared_blks_dirtied,
  SUM(shared_blks_written) AS shared_blks_written , 
  SUM(local_blks_hit) AS local_blks_hit , 
  SUM(local_blks_read) AS local_blks_read , 
  SUM(local_blks_dirtied) AS local_blks_dirtied , 
  SUM(local_blks_written)  AS local_blks_written,
  SUM(temp_blks_read) AS temp_blks_read, 
  SUM(temp_blks_written) temp_blks_written , 
  SUM(blk_read_time) AS blk_read_time , 
  SUM(blk_write_time) AS blk_write_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NULL AND
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY database_id ;

D.B. Tempu

to_char(interval '1 millisecond' * pg_total_stat_history_rec.total_time, 'HH24:MI:SS.MS')

Tempu I/O

to_char(interval '1 millisecond' * ( pg_total_stat_history_rec.blk_read_time + pg_total_stat_history_rec.blk_write_time ), 'HH24:MI:SS.MS')

TOP10 SQL per total_time

Inchiesta

SELECT 
  queryid , 
  SUM(calls) AS calls ,
  SUM(total_time)  AS total_time  	
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT 
GROUP BY queryid 
ORDER BY 3 DESC 
LIMIT 10
-------------------------------------------------- ------------------------------------ | TOP10 SQL PER TEMPU DI ESECUZIONE TOTALE | #| queryid| chjama| chjama %| tempu_totale (ms) | dbtime % +----+-----------+-----------+-----------+------ --------------------+----------- | 1| 821760255| 2| .00001|00:03:23.141( 203141.681 ms.)| 5.42 | 2| 4152624390| 2| .00001|00:03:13.929( 193929.215 ms.)| 5.17 | 3| 1484454471| 4| .00001|00:02:09.129( 129129.057 ms.)| 3.44 | 4| 655729273| 1| .00000|00:02:01.869( 121869.981 ms.)| 3.25 | 5| 2460318461| 1| .00000|00:01:33.113( 93113.835 ms.)| 2.48 | 6| 2194493487| 4| .00001|00:00:17.377( 17377.868 ms.)| .46 | 7| 1053044345| 1| .00000|00:00:06.156( 6156.352 ms.)| .16 | 8| 3644780286| 1| .00000|00:00:01.063( 1063.830 ms.)| .03

TOP10 SQL per u tempu I/O tutale

Inchiesta

SELECT 
  queryid , 
  SUM(calls) AS calls ,
  SUM(blk_read_time + blk_write_time)  AS io_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY  queryid 
ORDER BY 3 DESC 
LIMIT 10
-------------------------------------------------- -------------------------------------- | TOP10 SQL PER TEMPU TOTAL I/O | #| queryid| chjama| chjama %| Temps I/O (ms)|db Temps I/O % +----+-----------+-----------+------ -----+-------------------------------+------------ -- | 1| 4152624390| 2| .00001|00:08:31.616( 511616.592 ms.)| 31.06 ghjugnu | 2| 821760255| 2| .00001|00:08:27.099( 507099.036 ms.)| 30.78 | 3| 655729273| 1| .00000|00:05:02.209( 302209.137 ms.)| 18.35 | 4| 2460318461| 1| .00000|00:04:05.981( 245981.117 ms.)| 14.93 | 5| 1484454471| 4| .00001|00:00:39.144( 39144.221 ms.)| 2.38 | 6| 2194493487| 4| .00001|00:00:18.182( 18182.816 ms.)| 1.10 | 7| 1053044345| 1| .00000|00:00:16.611( 16611.722 ms.)| 1.01 | 8| 3644780286| 1| .00000|00:00:00.436( 436.205 ms.)| .03

TOP10 SQL per u tempu massimu di esecuzione

Inchiesta

SELECT 
  id AS snapshotid , 
  queryid , 
  snapshot_timestamp ,  
  max_time 
FROM 
  pg_stat_history 
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
ORDER BY 4 DESC 
LIMIT 10

-------------------------------------------------- ------------------------------------ | TOP10 SQL PER TEMPU MAX ESECUZIONE | #| istantanea| snapshotID| queryid| max_time (ms) +----+------------------+-----------+--------- --+---------------------------------------- | 1| 05.04.2019/01/03 4169:655729273| 00| 02| 01.869:121869.981:2( 04.04.2019 ms.) | 17| 00/4153/821760255 00:01| 41.570| 101570.841| 3:04.04.2019:16( 00 ms.) | 4146| 821760255/00/01 41.570:101570.841| 4| 04.04.2019| 16:00:4144( 4152624390 ms.) | 00| 01/36.964/96964.607 5:04.04.2019| 17| 00| 4151:4152624390:00( 01 ms.) | 36.964| 96964.607/6/05.04.2019 10:00| 4188| 1484454471| 00:01:33.452( 93452.150 ms.) | 7| 04.04.2019/17/00 4150:2460318461 | 00| 01| 33.113:93113.835:8( 04.04.2019 ms.) | 15| 00/4140/1484454471 00:00| 11.892| 11892.302| 9:04.04.2019:16( 00 ms.) | 4145| 1484454471/00/00 11.892:11892.302| 10| 04.04.2019| 17:00:4152( 1484454471 ms.) | 00| 00/11.892/11892.302 XNUMX:XNUMX| XNUMX| XNUMX| XNUMX:XNUMX:XNUMX( XNUMX ms.) | XNUMX| XNUMX/XNUMX/XNUMX XNUMX:XNUMX| XNUMX| XNUMX| XNUMX:XNUMX:XNUMX (XNUMX ms.)

TOP10 SQL da buffer SHARED lettura / scrittura

Inchiesta

SELECT 
  id AS snapshotid , 
  queryid ,
  snapshot_timestamp , 
  shared_blks_read , 
  shared_blks_written 
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND
  ( shared_blks_read > 0 OR shared_blks_written > 0 )
ORDER BY 4 DESC  , 5 DESC 
LIMIT 10
-------------------------------------------------- ------------------------------------ | TOP10 SQL PER BUFFER SHARED LEGGIU / SCRITTURA | #| istantanea| snapshotID| queryid| blocchi spartuti leghje| blocchi spartuti scrive +----+------------------+-----------+---------- -+---------------------+--------------------- | 1| 04.04.2019/17/00 4153:821760255| 797308| 0| 2| 04.04.2019 | 16| 00/4146/821760255 797308:0| 3| 05.04.2019| 01| 03 | 4169| 655729273/797158/0 4:04.04.2019| 16| 00| 4144| 4152624390 | 756514| 0/5/04.04.2019 17:00| 4151| 4152624390| 756514| 0 | 6| 04.04.2019/17/00 4150:2460318461| 734117| 0| 7| 04.04.2019 | 17| 00/4155/3644780286 52973:0| 8| 05.04.2019| 01| 03 | 4168| 1053044345/52818/0 9:04.04.2019| 15| 00| 4141| 2194493487 | 52813| 0/10/04.04.2019 16:00| 4147| 2194493487| 52813| 0 | XNUMX| XNUMX/XNUMX/XNUMX XNUMX:XNUMX| XNUMX| XNUMX| XNUMX| XNUMX | XNUMX| XNUMX/XNUMX/XNUMX XNUMX:XNUMX| XNUMX| XNUMX| XNUMX| XNUMX ------------------------------------------------- -------------------------------------------------

Istogramma di a distribuzione di e dumande per u tempu massimu di esecuzione

E dumande

SELECT  
  MIN(max_time) AS hist_min  , 
  MAX(max_time) AS hist_max , 
  (( MAX(max_time) - MIN(min_time) ) / hist_columns ) as hist_width
FROM 
  pg_stat_history 
WHERE 
  queryid IS NOT NULL AND
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT ;

SELECT 
  SUM(calls) AS calls
FROM 
  pg_stat_history 
WHERE 
  queryid IS NOT NULL AND
  database_id =DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND 
  ( max_time >= hist_current_min AND  max_time < hist_current_max ) ;
|------------------------------------------------- ---------------------------------------- | MAX_TIME HISTOGRAM | CHIAMATE TOTALE : 33851920 | MIN TIME : 00:00:01.063 | TIME MAX : 00:02:01.869 ---------------------------------- -------- ---------------------------- | durata min| durata massima| chjama +---------------------------------+-------------- ---------------------+----------- | 00:00:01.063( 1063.830 ms.) | 00:00:13.144( 13144.445 ms.) | 9 | 00:00:13.144( 13144.445 ms.) | 00:00:25.225( 25225.060 ms.) | 0 | 00:00:25.225( 25225.060 ms.) | 00:00:37.305( 37305.675 ms.) | 0 | 00:00:37.305( 37305.675 ms.) | 00:00:49.386( 49386.290 ms.) | 0 | 00:00:49.386( 49386.290 ms.) | 00:01:01.466( 61466.906 ms.) | 0 | 00:01:01.466( 61466.906 ms.) | 00:01:13.547( 73547.521 ms.) | 0 | 00:01:13.547( 73547.521 ms.) | 00:01:25.628( 85628.136 ms.) | 0 | 00:01:25.628( 85628.136 ms.) | 00:01:37.708( 97708.751 ms.) | 4 | 00:01:37.708( 97708.751 ms.) | 00:01:49.789( 109789.366 ms.) | 2 | 00:01:49.789( 109789.366 ms.) | 00:02:01.869( 121869.981 ms.) | 0

TOP10 Snapshots per Query per Second

E dumande

--pg_qps.sql
--Calculate Query Per Second 
CREATE OR REPLACE FUNCTION pg_qps( pg_stat_history_id integer ) RETURNS double precision AS $$
DECLARE
 pg_stat_history_rec record ;
 prev_pg_stat_history_id integer ;
 prev_pg_stat_history_rec record;
 total_seconds double precision ;
 result double precision;
BEGIN 
  result = 0 ;
  
  SELECT *
  INTO pg_stat_history_rec
  FROM 
    pg_stat_history
  WHERE id = pg_stat_history_id ;

  IF pg_stat_history_rec.snapshot_timestamp IS NULL 
  THEN
    RAISE EXCEPTION 'ERROR - Not found pg_stat_history for id = %',pg_stat_history_id;
  END IF ;  
  
 --RAISE NOTICE 'pg_stat_history_id = % , snapshot_timestamp = %', pg_stat_history_id , 
 pg_stat_history_rec.snapshot_timestamp ;
  
  SELECT 
    MAX(id)   
  INTO
    prev_pg_stat_history_id
  FROM
    pg_stat_history
  WHERE 
    database_id = pg_stat_history_rec.database_id AND
	queryid IS NULL AND
	id < pg_stat_history_rec.id ;

  IF prev_pg_stat_history_id IS NULL 
  THEN
    RAISE NOTICE 'Not found previous pg_stat_history shapshot for id = %',pg_stat_history_id;
	RETURN NULL ;
  END IF;
  
  SELECT *
  INTO prev_pg_stat_history_rec
  FROM 
    pg_stat_history
  WHERE id = prev_pg_stat_history_id ;
  
  --RAISE NOTICE 'prev_pg_stat_history_id = % , prev_snapshot_timestamp = %', prev_pg_stat_history_id , prev_pg_stat_history_rec.snapshot_timestamp ;    

  total_seconds = extract(epoch from ( pg_stat_history_rec.snapshot_timestamp - prev_pg_stat_history_rec.snapshot_timestamp ));
  
  --RAISE NOTICE 'total_seconds = % ', total_seconds ;    
  
  --RAISE NOTICE 'calls = % ', pg_stat_history_rec.calls ;      
  
  IF total_seconds > 0 
  THEN
    result = pg_stat_history_rec.calls / total_seconds ;
  ELSE
   result = 0 ; 
  END IF;
   
 RETURN result ;
END
$$ LANGUAGE plpgsql;


SELECT 
  id , 
  snapshot_timestamp ,
  calls , 	
  total_time , 
  ( select pg_qps( id )) AS QPS ,
  blk_read_time ,
  blk_write_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND
  ( select pg_qps( id )) IS NOT NULL 
ORDER BY 5 DESC 
LIMIT 10
|------------------------------------------------- ---------------------------------------- | TOP10 Snapshots urdinati da numeri QueryPerSeconds -------------------------------------- ------ ------------------------------------------- ------ ------------------------------------------- | #| istantanea| snapshotID| chjama| dbtime tutale| QPS | Tempu I/O | Temps I/O % +-----+------------------+-----------+------- ----+---------------------------------+----------- -+---------------------------------+----------- | 1| 04.04.2019/20/04 4161:5758631| 00| 06| 30.513:390513.926:1573.396( 00 ms.)| 00| 01.470:1470.110:376( 2 ms.)| .04.04.2019 | 17| 00/4149/3529197 00:11| 48.830| 708830.618| 980.332:00:12( 47.834 ms.)| 767834.052| 108.324:3:04.04.2019( 16 ms.)| 00 | 4143| 3525360/00/10 13.492:613492.351| 979.267| 00| 08:41.396:521396.555( 84.988 ms.)| 4| 04.04.2019:21:03( 4163 ms.)| 2781536 | 00| 03/06.470/186470.979 785.745:00| 00| 00.249| 249.865:134:5( 04.04.2019 ms.)| 19| 03:4159:2890362( 00 ms.)| .03 | 16.784| 196784.755/776.979/00 00:01.441| 1441.386| 732| 6:04.04.2019:14( 00 ms.)| 4137| 2397326:00:04( 43.033 ms.)| .283033.854 | 665.924| 00/00/00.024 24.505:009| 7| 04.04.2019| 15:00:4139( 2394416 ms.)| 00| 04:51.435:291435.010( 665.116 ms.)| .00 | 00| 12.025/12025.895/4.126 8:04.04.2019| 13| 00| 4135:2373043:00( 04 ms.)| 26.791| 266791.988:659.179:00( 00 ms.)| 00.064 | 64.261| 024/9/05.04.2019 01:03 | 4167| 4387191| 00:06:51.380( 411380.293 ms.)| 609.332| 00:05:18.847( 318847.407 ms.)| .77.507 | 10| 04.04.2019/18/01 4157:1145596| 00| 01| 19.217:79217.372:313.004( 00 ms.)| 00| 01.319:1319.676:1.666( XNUMX ms.)| XNUMX | XNUMX| XNUMX/XNUMX/XNUMX XNUMX:XNUMX| XNUMX| XNUMX| XNUMX:XNUMX:XNUMX( XNUMX ms.)| XNUMX| XNUMX:XNUMX:XNUMX( XNUMX ms.)| XNUMX

Storia di Esecuzione Orale cù QueryPerSeconds è I/O Time

Inchiesta

SELECT 
  id , 
  snapshot_timestamp ,
  calls , 	
  total_time , 
  ( select pg_qps( id )) AS QPS ,
  blk_read_time ,
  blk_write_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
ORDER BY 2
|-----------------------------------------------------------------------------------------------
| HOURLY EXECUTION HISTORY  WITH QueryPerSeconds and I/O Time
-----------------------------------------------------------------------------------------------------------------------------------------------
| QUERY PER SECOND HISTORY
|    #|          snapshot| snapshotID|      calls|                      total dbtime|        QPS|                          I/O time| I/O time %
+-----+------------------+-----------+-----------+----------------------------------+-----------+----------------------------------+-----------
|    1|  04.04.2019 11:00|       4131|       3747|  00:00:00.835(       835.374 ms.)|      1.041|  00:00:00.000(          .000 ms.)|       .000
|    2|  04.04.2019 12:00|       4133|    1002722|  00:01:52.419(    112419.376 ms.)|    278.534|  00:00:00.149(       149.105 ms.)|       .133
|    3|  04.04.2019 13:00|       4135|    2373043|  00:04:26.791(    266791.988 ms.)|    659.179|  00:00:00.064(        64.261 ms.)|       .024
|    4|  04.04.2019 14:00|       4137|    2397326|  00:04:43.033(    283033.854 ms.)|    665.924|  00:00:00.024(        24.505 ms.)|       .009
|    5|  04.04.2019 15:00|       4139|    2394416|  00:04:51.435(    291435.010 ms.)|    665.116|  00:00:12.025(     12025.895 ms.)|      4.126
|    6|  04.04.2019 16:00|       4143|    3525360|  00:10:13.492(    613492.351 ms.)|    979.267|  00:08:41.396(    521396.555 ms.)|     84.988
|    7|  04.04.2019 17:00|       4149|    3529197|  00:11:48.830(    708830.618 ms.)|    980.332|  00:12:47.834(    767834.052 ms.)|    108.324
|    8|  04.04.2019 18:01|       4157|    1145596|  00:01:19.217(     79217.372 ms.)|    313.004|  00:00:01.319(      1319.676 ms.)|      1.666
|    9|  04.04.2019 19:03|       4159|    2890362|  00:03:16.784(    196784.755 ms.)|    776.979|  00:00:01.441(      1441.386 ms.)|       .732
|   10|  04.04.2019 20:04|       4161|    5758631|  00:06:30.513(    390513.926 ms.)|   1573.396|  00:00:01.470(      1470.110 ms.)|       .376
|   11|  04.04.2019 21:03|       4163|    2781536|  00:03:06.470(    186470.979 ms.)|    785.745|  00:00:00.249(       249.865 ms.)|       .134
|   12|  04.04.2019 23:03|       4165|    1443155|  00:01:34.467(     94467.539 ms.)|    200.438|  00:00:00.015(        15.287 ms.)|       .016
|   13|  05.04.2019 01:03|       4167|    4387191|  00:06:51.380(    411380.293 ms.)|    609.332|  00:05:18.847(    318847.407 ms.)|     77.507
|   14|  05.04.2019 02:03|       4171|     189852|  00:00:10.989(     10989.899 ms.)|     52.737|  00:00:00.539(       539.110 ms.)|      4.906
|   15|  05.04.2019 03:01|       4173|       3627|  00:00:00.103(       103.000 ms.)|      1.042|  00:00:00.004(         4.131 ms.)|      4.010
|   16|  05.04.2019 04:00|       4175|       3627|  00:00:00.085(        85.235 ms.)|      1.025|  00:00:00.003(         3.811 ms.)|      4.471
|   17|  05.04.2019 05:00|       4177|       3747|  00:00:00.849(       849.454 ms.)|      1.041|  00:00:00.006(         6.124 ms.)|       .721
|   18|  05.04.2019 06:00|       4179|       3747|  00:00:00.849(       849.561 ms.)|      1.041|  00:00:00.000(          .051 ms.)|       .006
|   19|  05.04.2019 07:00|       4181|       3747|  00:00:00.839(       839.416 ms.)|      1.041|  00:00:00.000(          .062 ms.)|       .007
|   20|  05.04.2019 08:00|       4183|       3747|  00:00:00.846(       846.382 ms.)|      1.041|  00:00:00.000(          .007 ms.)|       .001
|   21|  05.04.2019 09:00|       4185|       3747|  00:00:00.855(       855.426 ms.)|      1.041|  00:00:00.000(          .065 ms.)|       .008
|   22|  05.04.2019 10:00|       4187|       3797|  00:01:40.150(    100150.165 ms.)|      1.055|  00:00:21.845(     21845.217 ms.)|     21.812

Testu di tutte e selezzione SQL

Inchiesta

SELECT 
  queryid , 
  query 
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY queryid , query

U risultatu

Comu pudete vede, per mezu abbastanza simplice, pudete uttene assai infurmazioni utili nantu à a carica di travagliu è u statu di a basa di dati.

Nota:Se riparate u queryid in e dumande, allora averemu a storia per una dumanda separata (per risparmià spaziu, i rapporti per una dumanda separata sò omessi).

Dunque, e dati statistici nantu à u rendiment di e dumande sò dispunibili è raccolti.
A prima tappa "raccolta di dati statistichi" hè finita.

Pudete passà à a seconda tappa - "configurazione di metrica di rendiment".
Monitoraghju di u rendiment di e dumande PostgreSQL. Parte 1 - rapportu

Ma hè una storia completamente diversa.

Per esse continuatu ...

Source: www.habr.com

Add a comment