Spremljanje učinkovitosti poizvedb PostgreSQL. 1. del - poročanje

Inženir - prevedeno iz latinščine - navdihnjen.
Inženir zmore vse. (c) R. Diesel.
Epigrafi.
Spremljanje učinkovitosti poizvedb PostgreSQL. 1. del - poročanje
Ali pa zgodba o tem, zakaj se mora skrbnik baze podatkov spominjati svoje programerske preteklosti.

Predgovor

Vsa imena so spremenjena. Ujemanja so naključna. Gradivo je izključno osebno mnenje avtorja.

Zavrnitev jamstev: v načrtovani seriji člankov ne bo natančnega in natančnega opisa uporabljenih tabel in skript. Materialov ni mogoče takoj uporabiti "KOT SO".
Prvič, zaradi velike količine materiala,
drugič, zaradi ostrine s proizvodno bazo resničnega kupca.
Zato bodo v člankih podane samo ideje in opisi v najbolj splošni obliki.
Mogoče bo v prihodnosti sistem prerasel na nivo objavljanja na GitHubu ali pa tudi ne. Čas bo pokazal svoje.

Začetek zgodbe -Se spomnite, kako se je vse začelo".
Kaj se je zgodilo kot rezultat, na splošno - "Sinteza kot ena od metod za izboljšanje zmogljivosti PostgreSQL»

Zakaj potrebujem vse to?

No, prvič, da ne pozabite nase, ko se spomnite slavnih dni v pokoju.
Drugič, sistematizirati napisano. Tudi sama se včasih začnem mešati in pozabim na ločene dele.

No, in kar je najpomembnejše - nenadoma lahko nekomu pride prav in pomaga, da ne izumlja kolesa in ne zbira grablje. Z drugimi besedami, izboljšajte svojo karmo (ne Khabrovsky). Kajti najbolj dragocena stvar na tem svetu so ideje. Glavna stvar je najti idejo. In prevesti idejo v resničnost je že čisto tehnično vprašanje.

Pa začnimo počasi...

Izjava o težavi.

Na voljo:

PostgreSQL(10.5), mešana obremenitev (OLTP+DSS), srednja do majhna obremenitev, gostuje v oblaku AWS.
Ni spremljanja baze podatkov, spremljanje infrastrukture je predstavljeno kot standardna orodja AWS v minimalni konfiguraciji.

Zahtevano:

Spremljajte delovanje in status baze podatkov, poiščite in imejte začetne informacije za optimizacijo zahtevnih poizvedb po bazi podatkov.

Kratek uvod ali analiza rešitev

Za začetek poskusimo analizirati možnosti za rešitev problema z vidika primerjalne analize koristi in težav za inženirja, s koristmi in izgubami pa naj se ukvarjajo tisti, ki naj bi bili na kadrovskem seznamu. upravljanja.

Možnost 1 - "Delo na zahtevo"

Pustimo vse tako, kot je. Če stranka ni zadovoljna z nečim v zdravju, delovanju baze ali aplikacije, bo obvestila inženirje DBA po e-pošti ali z ustvarjanjem incidenta v blagajni.
Inženir bo po prejemu obvestila razumel težavo, ponudil rešitev ali pa težavo odložil v upanju, da se bo vse rešilo samo od sebe, tako ali tako bo vse kmalu pozabljeno.
Medenjaki in krofi, modrice in buškeMedenjaki in krofi:
1. Nič dodatnega za narediti
2. Vedno obstaja možnost, da greste ven in se umažete.
3. Veliko časa, ki ga lahko preživite sami.
Modrice in udarci:
1. Prej ali slej bo kupec pomislil na bistvo bivanja in univerzalne pravičnosti na tem svetu in si ponovno zastavil vprašanje - zakaj jim plačujem svoj denar? Posledica je vedno enaka – vprašanje je le, kdaj se stranka naveliča in ji pomaha v slovo. In hranilnik je prazen. Žalostno je.
2. Razvoj inženirja je nič.
3. Težave pri načrtovanju dela in nakladanju

Možnost 2 - "Pleši s tamburami, obuj in obuj"

1. odstavek-Zakaj potrebujemo sistem spremljanja, prejeli bomo vse zahteve. Zaženemo kup najrazličnejših poizvedb v podatkovnem slovarju in dinamičnih pogledih, vklopimo vse vrste števcev, vse prenesemo v tabele, občasno analiziramo sezname in tabele, tako rekoč. Kot rezultat, imamo lepe ali ne zelo grafe, tabele, poročila. Glavna stvar - to bi bilo več, več.
2. odstavek- Ustvarimo aktivnost - začnemo analizo vsega tega.
3. odstavek-Pripravljamo določen dokument, temu dokumentu pravimo preprosto - "kako opremimo bazo podatkov."
4. odstavek- Stranka, ko vidi vso to veličastnost grafov in številk, je v otročje naivnem zaupanju - zdaj bo vse delovalo za nas, kmalu. In se zlahka in neboleče ločijo od svojih finančnih sredstev. Tudi vodstvo je prepričano, da naši inženirji trdo delajo. Največja obremenitev.
5. odstavek- Redno ponavljajte 1. korak.
Medenjaki in krofi, modrice in buškeMedenjaki in krofi:
1. Življenje managerjev in inženirjev je preprosto, predvidljivo in polno aktivnosti. Vse brni, vsi so zaposleni.
2. Tudi življenje stranke ni slabo - vedno je prepričan, da morate malo potrpeti in vse se bo izšlo. Ne bo bolje, no, no - ta svet je nepravičen, v naslednjem življenju - sreča.
Modrice in udarci:
1. Prej ali slej se bo našel pametnejši ponudnik podobne storitve, ki bo naredil isto stvar, a malo ceneje. In če je rezultat enak, zakaj bi plačali več. Kar bo spet vodilo do izginotja podajalnika.
2. Dolgočasno je. Kako dolgočasna je vsaka malo smiselna dejavnost.
3. Kot v prejšnji različici - brez razvoja. Toda za inženirja je minus ta, da morate za razliko od prve možnosti tukaj nenehno ustvarjati IDB. In to zahteva čas. Ki jih lahko porabite v prid svojega ljubljenega. Ker ne moreš poskrbeti zase, vsi skrbijo zate.

Možnost 3-Ni vam treba izumljati kolesa, morate ga kupiti in se z njim voziti.

Inženirji iz drugih podjetij zavestno jedo pico s pivom (oh, slavni časi Sankt Peterburga v 90-ih). Uporabljajmo nadzorne sisteme, ki so narejeni, razhroščeni in delujoči ter na splošno prinašajo koristi (no, vsaj svojim ustvarjalcem).
Medenjaki in krofi, modrice in buškeMedenjaki in krofi:
1. Ni vam treba izgubljati časa z izumljanjem tega, kar je že izumljeno. Vzemite in uporabite.
2. Sistemov za spremljanje ne pišejo bedaki in seveda so uporabni.
3. Delujoči nadzorni sistemi običajno zagotavljajo koristne filtrirane informacije.
Modrice in udarci:
1. Inženir v tem primeru ni inženir, ampak le uporabnik izdelka nekoga drugega.Oziroma uporabnik.
2. Stranko je treba prepričati, da je treba kupiti nekaj, česar na splošno ne želi razumeti in ne bi smel, in na splošno je proračun za leto odobren in se ne bo spremenil. Nato morate dodeliti ločen vir, ga konfigurirati za določen sistem. Tisti. Najprej morate plačati, plačati in še enkrat plačati. In kupec je skop. To je norma tega življenja.

Kaj storiti, Černiševski? Vaše vprašanje je zelo na mestu. (z)

V tem konkretnem primeru in trenutni situaciji lahko storite nekoliko drugače - naredimo svoj nadzorni sistem.
Spremljanje učinkovitosti poizvedb PostgreSQL. 1. del - poročanje
No, seveda ni sistem, v polnem pomenu besede, to je preglasno in predrzno, a si vsaj nekako olajšajte delo in zberite več informacij za reševanje incidentov pri delovanju. Da se ne bi znašli v situaciji - "pojdi tja, ne vem kam, poišči to, ne vem kaj."

Kakšne so prednosti in slabosti te možnosti:

Profesionalci:
1. Zanimivo je. No, vsaj bolj zanimivo od nenehnega "shrink datafile, alter tablespace, itd."
2. To so nove veščine in nov razvoj. Ki bo v prihodnosti prej ali slej dala zaslužene medenjake in krofe.
Cons:
1. Moram delati. Veliko delati.
2. Redno boste morali pojasnjevati pomen in perspektive vseh dejavnosti.
3. Nekaj ​​bo treba žrtvovati, saj je edini vir, ki je na voljo inženirju - čas - omejen z Vesoljem.
4. Najslabše in najbolj neprijetno - posledično se lahko izkažejo smeti, kot je "Ne miška, ne žaba, ampak neznana žival".

Kdor nekaj ne tvega, ne pije šampanjca.
Tako, zabava se začne.

Splošna ideja - shema

Spremljanje učinkovitosti poizvedb PostgreSQL. 1. del - poročanje
(Ilustracija vzeta iz članka «Sinteza kot ena od metod za izboljšanje zmogljivosti PostgreSQL")

Pojasnilo:

  • Ciljna baza podatkov je nameščena s standardno razširitvijo PostgreSQL “pg_stat_statements”.
  • V bazi podatkov za spremljanje ustvarimo nabor servisnih tabel za shranjevanje zgodovine pg_stat_statements na začetni stopnji ter za konfiguracijo meritev in spremljanja v prihodnosti
  • Na nadzornem gostitelju ustvarimo nabor bash skriptov, vključno s tistimi za generiranje incidentov v sistemu vstopnic.

Servisne mize

Za začetek shematično poenostavljen ERD, kaj se je zgodilo na koncu:
Spremljanje učinkovitosti poizvedb PostgreSQL. 1. del - poročanje
Kratek opis tabelkončna točka - gostitelj, točka povezave z instanco
Baza podatkov - možnosti zbirke podatkov
pg_stat_history - zgodovinska tabela za shranjevanje začasnih posnetkov pogleda pg_stat_statements ciljne baze podatkov
metric_glossary - Slovar meritev uspešnosti
metric_config - konfiguracija posameznih metrik
meritev - posebno metriko za zahtevo, ki se spremlja
metric_alert_history - zgodovina opozoril o uspešnosti
log_query - servisna tabela za shranjevanje razčlenjenih zapisov iz dnevniške datoteke PostgreSQL, prenesene iz AWS
izhodiščno - parametri časovnega obdobja, uporabljenega kot osnova
kontrolno točko - konfiguracija metrik za preverjanje stanja baze podatkov
checkpoint_alert_history - zgodovina opozoril o meritvah preverjanja stanja baze podatkov
pg_stat_db_queries — servisna tabela aktivnih zahtevkov
Dnevnik aktivnosti — servisna tabela dnevnika dejavnosti
trap_oid - tabela storitev konfiguracije pasti

1. stopnja - zbiranje statističnih podatkov o uspešnosti in pridobivanje poročil

Tabela se uporablja za shranjevanje statističnih informacij. pg_stat_history
struktura tabele pg_stat_history

                                          Tabela "public.pg_stat_history" Stolpec | vrsta | Modifikatorji--------------------+-------------------- --+---- -------------------------------- id | celo število | not null default nextval('pg_stat_history_id_seq'::regclass) snapshot_timestamp | časovni žig brez časovnega pasu | ID baze podatkov | celo število | dbid | oid | ID uporabnika | oid | queryid | bigint | poizvedba | besedilo | klici | bigint | skupni_čas | dvojna natančnost | min_čas | dvojna natančnost | največji_čas | dvojna natančnost | srednji_čas | dvojna natančnost | stddev_time | dvojna natančnost | vrstice | bigint | shared_blks_hit | bigint | shared_blks_read | bigint | shared_blks_dirtied | bigint | shared_blks_written | bigint | local_blks_hit | bigint | local_blks_read | bigint | local_blks_dirtied | bigint | local_blks_written | bigint | temp_blks_read | bigint | temp_blks_written | bigint | blk_read_time | dvojna natančnost | blk_write_time | dvojna natančnost | baseline_id | celo število | Indeksi: "pg_stat_history_pkey" PRIMARNI KLJUČ, btree (id) "database_idx" btree (database_id) "queryid_idx" btree (queryid) "snapshot_timestamp_idx" btree (snapshot_timestamp) Omejitve tujega ključa: "database_id_fk" TUJI KLJUČ (database_ id) REFERENCE baza podatkov(id ) ON DELETE CASCADE

Kot lahko vidite, je tabela samo kumulativni pogled podatkov pg_stat_statements v ciljni bazi podatkov.

Uporaba te tabele je zelo preprosta.

pg_stat_history bo predstavljal zbrano statistiko izvajanja poizvedbe za vsako uro. Na začetku vsake ure, po izpolnitvi tabele, statistika pg_stat_statements ponastavi z pg_stat_statements_reset().
Opomba: statistika se zbira za zahteve, ki trajajo več kot 1 sekundo.
Polnjenje tabele pg_stat_history

--pg_stat_history.sql
CREATE OR REPLACE FUNCTION pg_stat_history( ) RETURNS boolean AS $$
DECLARE
  endpoint_rec record ;
  database_rec record ;
  pg_stat_snapshot record ;
  current_snapshot_timestamp timestamp without time zone;
BEGIN
  current_snapshot_timestamp = date_trunc('minute',now());  
  
  FOR endpoint_rec IN SELECT * FROM endpoint 
  LOOP
    FOR database_rec IN SELECT * FROM database WHERE endpoint_id = endpoint_rec.id 
	  LOOP
	    
		RAISE NOTICE 'NEW SHAPSHOT IS CREATING';
		
		--Connect to the target DB	  
	    EXECUTE 'SELECT dblink_connect(''LINK1'',''host='||endpoint_rec.host||' dbname='||database_rec.name||' user=USER password=PASSWORD '')';
 
        RAISE NOTICE 'host % and dbname % ',endpoint_rec.host,database_rec.name;
		RAISE NOTICE 'Creating snapshot of pg_stat_statements for database %',database_rec.name;
		
		SELECT 
	      *
		INTO 
		  pg_stat_snapshot
	    FROM dblink('LINK1',
	      'SELECT 
	       dbid , SUM(calls),SUM(total_time),SUM(rows) ,SUM(shared_blks_hit) ,SUM(shared_blks_read) ,SUM(shared_blks_dirtied) ,SUM(shared_blks_written) , 
           SUM(local_blks_hit) , SUM(local_blks_read) , SUM(local_blks_dirtied) , SUM(local_blks_written) , SUM(temp_blks_read) , SUM(temp_blks_written) , SUM(blk_read_time) , SUM(blk_write_time)
	       FROM pg_stat_statements WHERE dbid=(SELECT oid from pg_database where datname=current_database() ) 
		   GROUP BY dbid
  	      '
	               )
	      AS t
	       ( dbid oid , calls bigint , 
  	         total_time double precision , 
	         rows bigint , shared_blks_hit bigint , shared_blks_read bigint ,shared_blks_dirtied bigint ,shared_blks_written	 bigint ,
             local_blks_hit	 bigint ,local_blks_read bigint , local_blks_dirtied bigint ,local_blks_written bigint ,
             temp_blks_read	 bigint ,temp_blks_written bigint ,
             blk_read_time double precision , blk_write_time double precision	  
	       );
		 
		INSERT INTO pg_stat_history
          ( 
		    snapshot_timestamp  ,database_id  ,
			dbid , calls  ,total_time ,
            rows ,shared_blks_hit  ,shared_blks_read  ,shared_blks_dirtied  ,shared_blks_written ,local_blks_hit , 	 	
            local_blks_read,local_blks_dirtied,local_blks_written,temp_blks_read,temp_blks_written, 	
            blk_read_time, blk_write_time 
		  )		  
	    VALUES
	      (
	       current_snapshot_timestamp ,
		   database_rec.id ,
	       pg_stat_snapshot.dbid ,pg_stat_snapshot.calls,
	       pg_stat_snapshot.total_time,
	       pg_stat_snapshot.rows ,pg_stat_snapshot.shared_blks_hit ,pg_stat_snapshot.shared_blks_read ,pg_stat_snapshot.shared_blks_dirtied ,pg_stat_snapshot.shared_blks_written , 
           pg_stat_snapshot.local_blks_hit , pg_stat_snapshot.local_blks_read , pg_stat_snapshot.local_blks_dirtied , pg_stat_snapshot.local_blks_written , 
	       pg_stat_snapshot.temp_blks_read , pg_stat_snapshot.temp_blks_written , pg_stat_snapshot.blk_read_time , pg_stat_snapshot.blk_write_time 	   
	      );		   
		  
        RAISE NOTICE 'Creating snapshot of pg_stat_statements for queries with min_time more than 1000ms';
	
        FOR pg_stat_snapshot IN
          --All queries with max_time greater than 1000 ms
	      SELECT 
	        *
	      FROM dblink('LINK1',
	        'SELECT 
	         dbid , userid ,queryid,query,calls,total_time,min_time ,max_time,mean_time, stddev_time ,rows ,shared_blks_hit ,
			 shared_blks_read ,shared_blks_dirtied ,shared_blks_written , 
             local_blks_hit , local_blks_read , local_blks_dirtied , 
			 local_blks_written , temp_blks_read , temp_blks_written , blk_read_time , 
			 blk_write_time
	         FROM pg_stat_statements 
			 WHERE dbid=(SELECT oid from pg_database where datname=current_database() AND min_time >= 1000 ) 
  	        '

	                  )
	        AS t
	         ( dbid oid , userid oid , queryid bigint ,query text , calls bigint , 
  	           total_time double precision ,min_time double precision	 ,max_time double precision	 , mean_time double precision	 ,  stddev_time double precision	 , 
	           rows bigint , shared_blks_hit bigint , shared_blks_read bigint ,shared_blks_dirtied bigint ,shared_blks_written	 bigint ,
               local_blks_hit	 bigint ,local_blks_read bigint , local_blks_dirtied bigint ,local_blks_written bigint ,
               temp_blks_read	 bigint ,temp_blks_written bigint ,
               blk_read_time double precision , blk_write_time double precision	  
	         )
	    LOOP
		  INSERT INTO pg_stat_history
          ( 
		    snapshot_timestamp  ,database_id  ,
			dbid ,userid  , queryid  , query  , calls  ,total_time ,min_time ,max_time ,mean_time ,stddev_time ,
            rows ,shared_blks_hit  ,shared_blks_read  ,shared_blks_dirtied  ,shared_blks_written ,local_blks_hit , 	 	
            local_blks_read,local_blks_dirtied,local_blks_written,temp_blks_read,temp_blks_written, 	
            blk_read_time, blk_write_time 
		  )		  
	      VALUES
	      (
	       current_snapshot_timestamp ,
		   database_rec.id ,
	       pg_stat_snapshot.dbid ,pg_stat_snapshot.userid ,pg_stat_snapshot.queryid,pg_stat_snapshot.query,pg_stat_snapshot.calls,
	       pg_stat_snapshot.total_time,pg_stat_snapshot.min_time ,pg_stat_snapshot.max_time,pg_stat_snapshot.mean_time, pg_stat_snapshot.stddev_time ,
	       pg_stat_snapshot.rows ,pg_stat_snapshot.shared_blks_hit ,pg_stat_snapshot.shared_blks_read ,pg_stat_snapshot.shared_blks_dirtied ,pg_stat_snapshot.shared_blks_written , 
           pg_stat_snapshot.local_blks_hit , pg_stat_snapshot.local_blks_read , pg_stat_snapshot.local_blks_dirtied , pg_stat_snapshot.local_blks_written , 
	       pg_stat_snapshot.temp_blks_read , pg_stat_snapshot.temp_blks_written , pg_stat_snapshot.blk_read_time , pg_stat_snapshot.blk_write_time 	   
	      );
		  
        END LOOP;

        PERFORM dblink_disconnect('LINK1');  
				
	  END LOOP ;--FOR database_rec IN SELECT * FROM database WHERE endpoint_id = endpoint_rec.id 
    
  END LOOP;

RETURN TRUE;  
END
$$ LANGUAGE plpgsql;

Kot rezultat, po določenem času v tabeli pg_stat_history imeli bomo nabor posnetkov vsebine tabele pg_stat_statements ciljno bazo podatkov.

Pravzaprav poročanje

Z uporabo preprostih poizvedb lahko dobite zelo uporabna in zanimiva poročila.

Zbrani podatki za določeno časovno obdobje

Zahteva

SELECT 
  database_id , 
  SUM(calls) AS calls ,SUM(total_time)  AS total_time ,
  SUM(rows) AS rows , SUM(shared_blks_hit)  AS shared_blks_hit,
  SUM(shared_blks_read) AS shared_blks_read ,
  SUM(shared_blks_dirtied) AS shared_blks_dirtied,
  SUM(shared_blks_written) AS shared_blks_written , 
  SUM(local_blks_hit) AS local_blks_hit , 
  SUM(local_blks_read) AS local_blks_read , 
  SUM(local_blks_dirtied) AS local_blks_dirtied , 
  SUM(local_blks_written)  AS local_blks_written,
  SUM(temp_blks_read) AS temp_blks_read, 
  SUM(temp_blks_written) temp_blks_written , 
  SUM(blk_read_time) AS blk_read_time , 
  SUM(blk_write_time) AS blk_write_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NULL AND
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY database_id ;

Čas D.B

to_char(interval '1 milisekunda' * pg_total_stat_history_rec.total_time, 'HH24:MI:SS.MS')

V/I čas

to_char(interval '1 milisekunda' * ( pg_total_stat_history_rec.blk_read_time + pg_total_stat_history_rec.blk_write_time), 'HH24:MI:SS.MS')

TOP10 SQL glede na total_time

Zahteva

SELECT 
  queryid , 
  SUM(calls) AS calls ,
  SUM(total_time)  AS total_time  	
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT 
GROUP BY queryid 
ORDER BY 3 DESC 
LIMIT 10
-------------------------------------------------- ------------------------------------ | TOP10 SQL PO SKUPNEM ČASU IZVAJANJA | #| queryid| klici| kliče %| skupni_čas (ms) | dbtime % +----+-----------+-----------+----------+------ --------------------+---------- | 1| 821760255| 2| .00001|00:03:23.141( 203141.681 ms.)| 5.42 | 2| 4152624390| 2| .00001|00:03:13.929( 193929.215 ms.)| 5.17 | 3| 1484454471| 4| .00001|00:02:09.129( 129129.057 ms.)| 3.44 | 4| 655729273| 1| .00000|00:02:01.869( 121869.981 ms.)| 3.25 | 5| 2460318461| 1| .00000|00:01:33.113( 93113.835 ms.)| 2.48 | 6| 2194493487| 4| .00001|00:00:17.377( 17377.868 ms.)| .46 | 7| 1053044345| 1| .00000|00:00:06.156( 6156.352 ms.)| .16 | 8| 3644780286| 1| .00000|00:00:01.063( 1063.830 ms.)| .03

TOP10 SQL glede na skupni V/I čas

Zahteva

SELECT 
  queryid , 
  SUM(calls) AS calls ,
  SUM(blk_read_time + blk_write_time)  AS io_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY  queryid 
ORDER BY 3 DESC 
LIMIT 10
-------------------------------------------------- ------------------------------------- | TOP10 SQL PO SKUPNEM V/I ČASU | #| queryid| klici| kliče %| V/I čas (ms)|db V/I čas % +----+----------+-----------+------ -----+--------------------------------+----------- -- | 1| 4152624390| 2| .00001|00:08:31.616( 511616.592 ms.)| 31.06. junij | 2| 821760255| 2| .00001|00:08:27.099( 507099.036 ms.)| 30.78 | 3| 655729273| 1| .00000|00:05:02.209( 302209.137 ms.)| 18.35 | 4| 2460318461| 1| .00000|00:04:05.981( 245981.117 ms.)| 14.93 | 5| 1484454471| 4| .00001|00:00:39.144( 39144.221 ms.)| 2.38 | 6| 2194493487| 4| .00001|00:00:18.182( 18182.816 ms.)| 1.10 | 7| 1053044345| 1| .00000|00:00:16.611( 16611.722 ms.)| 1.01 | 8| 3644780286| 1| .00000|00:00:00.436( 436.205 ms.)| .03

TOP10 SQL po najdaljšem času izvajanja

Zahteva

SELECT 
  id AS snapshotid , 
  queryid , 
  snapshot_timestamp ,  
  max_time 
FROM 
  pg_stat_history 
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
ORDER BY 4 DESC 
LIMIT 10

-------------------------------------------------- ------------------------------------ | TOP10 SQL PO NAJVEČJEM ČASU IZVAJANJA | #| posnetek| snapshotID| queryid| max_time (ms) +----+-----------------+----------+--------- --+------------------------------------------ | 1| 05.04.2019. 01. 03 4169:655729273| 00| 02| 01.869:121869.981:2( 04.04.2019 ms.) | 17| 00 4153:821760255| 00| 01| 41.570:101570.841:3( 04.04.2019 ms.) | 16| 00 4146:821760255| 00| 01| 41.570:101570.841:4( 04.04.2019 ms.) | 16| 00 4144:4152624390| 00| 01| 36.964:96964.607:5 (04.04.2019 ms.) | 17| 00 4151:4152624390| 00| 01| 36.964:96964.607:6 (05.04.2019 ms.) | 10| 00. 4188. 1484454471 00:01 | 33.452| 93452.150| 7:04.04.2019:17 (00 ms.) | 4150| 2460318461 00:01| 33.113| 93113.835| 8:04.04.2019:15( 00 ms.) | 4140| 1484454471 00:00| 11.892| 11892.302| 9:04.04.2019:16 (00 ms.) | 4145| 1484454471 00:00| 11.892| 11892.302| 10:04.04.2019:17 (00 ms.) | 4152| 1484454471 00:00| 11.892| 11892.302| XNUMX:XNUMX:XNUMX (XNUMX ms.)

TOP10 SQL by SHARED buffer branje/pisanje

Zahteva

SELECT 
  id AS snapshotid , 
  queryid ,
  snapshot_timestamp , 
  shared_blks_read , 
  shared_blks_written 
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND
  ( shared_blks_read > 0 OR shared_blks_written > 0 )
ORDER BY 4 DESC  , 5 DESC 
LIMIT 10
-------------------------------------------------- ------------------------------------ | NAJBOLJŠIH 10 SQL PO SKUPLJENEM VMESMNIKU BRANJE/PISANJE | #| posnetek| snapshotID| queryid| skupni bloki branje| deljeni bloki napiši +----+-----------------+----------+---------- -+--------------------+-------------------- | 1| 04.04.2019 17:00| 4153| 821760255| 797308| 0 | 2| 04.04.2019 16:00| 4146| 821760255| 797308| 0 | 3| 05.04.2019. 01. 03 4169:655729273| 797158| 0| 4| 04.04.2019 | 16| 00 4144:4152624390| 756514| 0| 5| 04.04.2019 | 17| 00 4151:4152624390| 756514| 0| 6| 04.04.2019 | 17| 00 4150:2460318461| 734117| 0| 7| 04.04.2019 | 17| 00 4155:3644780286| 52973| 0| 8| 05.04.2019 | 01| 03. 4168. 1053044345 52818:0| 9| 04.04.2019| 15| 00 | 4141| 2194493487 52813:0| 10| 04.04.2019| 16| 00 | 4147| 2194493487 52813:0| XNUMX| XNUMX| XNUMX| XNUMX ------------------------------------------------- --------------------------------------------------

Histogram porazdelitve poizvedb po največjem času izvajanja

zahteve

SELECT  
  MIN(max_time) AS hist_min  , 
  MAX(max_time) AS hist_max , 
  (( MAX(max_time) - MIN(min_time) ) / hist_columns ) as hist_width
FROM 
  pg_stat_history 
WHERE 
  queryid IS NOT NULL AND
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT ;

SELECT 
  SUM(calls) AS calls
FROM 
  pg_stat_history 
WHERE 
  queryid IS NOT NULL AND
  database_id =DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND 
  ( max_time >= hist_current_min AND  max_time < hist_current_max ) ;
|------------------------------------------------ ---------------------------------------------- | MAX_TIME HISTOGRAM | SKUPAJ KLICI : 33851920 | MIN ČAS : 00:00:01.063 | NAJVEČJI ČAS: 00:02:01.869 ---------------------------------- -------- ---------------------------- | min trajanje| največje trajanje| klici +---------------------------------+------------- ---------------------+---------- | 00:00:01.063 (1063.830 ms.) | 00:00:13.144 (13144.445 ms.) | 9 | 00:00:13.144 (13144.445 ms.) | 00:00:25.225( 25225.060 ms.) | 0 | 00:00:25.225( 25225.060 ms.) | 00:00:37.305 (37305.675 ms.) | 0 | 00:00:37.305 (37305.675 ms.) | 00:00:49.386 (49386.290 ms.) | 0 | 00:00:49.386 (49386.290 ms.) | 00:01:01.466( 61466.906 ms.) | 0 | 00:01:01.466( 61466.906 ms.) | 00:01:13.547( 73547.521 ms.) | 0 | 00:01:13.547( 73547.521 ms.) | 00:01:25.628 (85628.136 ms.) | 0 | 00:01:25.628 (85628.136 ms.) | 00:01:37.708 (97708.751 ms.) | 4 | 00:01:37.708 (97708.751 ms.) | 00:01:49.789 (109789.366 ms.) | 2 | 00:01:49.789 (109789.366 ms.) | 00:02:01.869( 121869.981 ms.) | 0

TOP10 posnetkov po poizvedbi na sekundo

zahteve

--pg_qps.sql
--Calculate Query Per Second 
CREATE OR REPLACE FUNCTION pg_qps( pg_stat_history_id integer ) RETURNS double precision AS $$
DECLARE
 pg_stat_history_rec record ;
 prev_pg_stat_history_id integer ;
 prev_pg_stat_history_rec record;
 total_seconds double precision ;
 result double precision;
BEGIN 
  result = 0 ;
  
  SELECT *
  INTO pg_stat_history_rec
  FROM 
    pg_stat_history
  WHERE id = pg_stat_history_id ;

  IF pg_stat_history_rec.snapshot_timestamp IS NULL 
  THEN
    RAISE EXCEPTION 'ERROR - Not found pg_stat_history for id = %',pg_stat_history_id;
  END IF ;  
  
 --RAISE NOTICE 'pg_stat_history_id = % , snapshot_timestamp = %', pg_stat_history_id , 
 pg_stat_history_rec.snapshot_timestamp ;
  
  SELECT 
    MAX(id)   
  INTO
    prev_pg_stat_history_id
  FROM
    pg_stat_history
  WHERE 
    database_id = pg_stat_history_rec.database_id AND
	queryid IS NULL AND
	id < pg_stat_history_rec.id ;

  IF prev_pg_stat_history_id IS NULL 
  THEN
    RAISE NOTICE 'Not found previous pg_stat_history shapshot for id = %',pg_stat_history_id;
	RETURN NULL ;
  END IF;
  
  SELECT *
  INTO prev_pg_stat_history_rec
  FROM 
    pg_stat_history
  WHERE id = prev_pg_stat_history_id ;
  
  --RAISE NOTICE 'prev_pg_stat_history_id = % , prev_snapshot_timestamp = %', prev_pg_stat_history_id , prev_pg_stat_history_rec.snapshot_timestamp ;    

  total_seconds = extract(epoch from ( pg_stat_history_rec.snapshot_timestamp - prev_pg_stat_history_rec.snapshot_timestamp ));
  
  --RAISE NOTICE 'total_seconds = % ', total_seconds ;    
  
  --RAISE NOTICE 'calls = % ', pg_stat_history_rec.calls ;      
  
  IF total_seconds > 0 
  THEN
    result = pg_stat_history_rec.calls / total_seconds ;
  ELSE
   result = 0 ; 
  END IF;
   
 RETURN result ;
END
$$ LANGUAGE plpgsql;


SELECT 
  id , 
  snapshot_timestamp ,
  calls , 	
  total_time , 
  ( select pg_qps( id )) AS QPS ,
  blk_read_time ,
  blk_write_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND
  ( select pg_qps( id )) IS NOT NULL 
ORDER BY 5 DESC 
LIMIT 10
|------------------------------------------------ ---------------------------------------------- | TOP10 posnetkov, razvrščenih po številu QueryPerSeconds -------------------------------------- ------ -------------------------------------------------- ------ -------------------------------------------- | #| posnetek| snapshotID| klici| skupni dbtime| QPS | V/I čas | V/I čas % +-----+-----------------+----------+------- ----+---------------------------------+---------- -+--------------------------------+----------- | 1| 04.04.2019 20:04| 4161| 5758631| 00:06:30.513( 390513.926 ms.)| 1573.396| 00:00:01.470( 1470.110 ms.)| .376 | 2| 04.04.2019 17:00| 4149| 3529197| 00:11:48.830( 708830.618 ms.)| 980.332| 00:12:47.834( 767834.052 ms.)| 108.324 | 3| 04.04.2019 16:00| 4143| 3525360| 00:10:13.492( 613492.351 ms.)| 979.267| 00:08:41.396( 521396.555 ms.)| 84.988 | 4| 04.04.2019 21:03| 4163| 2781536| 00:03:06.470( 186470.979 ms.)| 785.745| 00:00:00.249 (249.865 ms.)| .134 | 5| 04.04.2019 19:03| 4159| 2890362| 00:03:16.784( 196784.755 ms.)| 776.979| 00:00:01.441 (1441.386 ms.)| .732 | 6| 04.04.2019 14:00 | 4137| 2397326| 00:04:43.033( 283033.854 ms.)| 665.924| 00:00:00.024 (24.505 ms.)| .009 | 7| 04.04.2019 15:00| 4139| 2394416| 00:04:51.435( 291435.010 ms.)| 665.116| 00:00:12.025( 12025.895 ms.)| 4.126 | 8| 04.04.2019 13:00| 4135| 2373043| 00:04:26.791( 266791.988 ms.)| 659.179| 00:00:00.064 (64.261 ms.)| .024 | 9| 05.04.2019. 01. 03 4167:4387191| 00| 06| 51.380:411380.293:609.332( 00 ms.)| 05| 18.847:318847.407:77.507( 10 ms.)| 04.04.2019 | 18| 01 4157:1145596| 00| 01| 19.217:79217.372:313.004( 00 ms.)| 00| 01.319:1319.676:1.666( XNUMX ms.)| XNUMX

Urna zgodovina izvajanja s QueryPerSeconds in V/I časom

Zahteva

SELECT 
  id , 
  snapshot_timestamp ,
  calls , 	
  total_time , 
  ( select pg_qps( id )) AS QPS ,
  blk_read_time ,
  blk_write_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
ORDER BY 2
|-----------------------------------------------------------------------------------------------
| HOURLY EXECUTION HISTORY  WITH QueryPerSeconds and I/O Time
-----------------------------------------------------------------------------------------------------------------------------------------------
| QUERY PER SECOND HISTORY
|    #|          snapshot| snapshotID|      calls|                      total dbtime|        QPS|                          I/O time| I/O time %
+-----+------------------+-----------+-----------+----------------------------------+-----------+----------------------------------+-----------
|    1|  04.04.2019 11:00|       4131|       3747|  00:00:00.835(       835.374 ms.)|      1.041|  00:00:00.000(          .000 ms.)|       .000
|    2|  04.04.2019 12:00|       4133|    1002722|  00:01:52.419(    112419.376 ms.)|    278.534|  00:00:00.149(       149.105 ms.)|       .133
|    3|  04.04.2019 13:00|       4135|    2373043|  00:04:26.791(    266791.988 ms.)|    659.179|  00:00:00.064(        64.261 ms.)|       .024
|    4|  04.04.2019 14:00|       4137|    2397326|  00:04:43.033(    283033.854 ms.)|    665.924|  00:00:00.024(        24.505 ms.)|       .009
|    5|  04.04.2019 15:00|       4139|    2394416|  00:04:51.435(    291435.010 ms.)|    665.116|  00:00:12.025(     12025.895 ms.)|      4.126
|    6|  04.04.2019 16:00|       4143|    3525360|  00:10:13.492(    613492.351 ms.)|    979.267|  00:08:41.396(    521396.555 ms.)|     84.988
|    7|  04.04.2019 17:00|       4149|    3529197|  00:11:48.830(    708830.618 ms.)|    980.332|  00:12:47.834(    767834.052 ms.)|    108.324
|    8|  04.04.2019 18:01|       4157|    1145596|  00:01:19.217(     79217.372 ms.)|    313.004|  00:00:01.319(      1319.676 ms.)|      1.666
|    9|  04.04.2019 19:03|       4159|    2890362|  00:03:16.784(    196784.755 ms.)|    776.979|  00:00:01.441(      1441.386 ms.)|       .732
|   10|  04.04.2019 20:04|       4161|    5758631|  00:06:30.513(    390513.926 ms.)|   1573.396|  00:00:01.470(      1470.110 ms.)|       .376
|   11|  04.04.2019 21:03|       4163|    2781536|  00:03:06.470(    186470.979 ms.)|    785.745|  00:00:00.249(       249.865 ms.)|       .134
|   12|  04.04.2019 23:03|       4165|    1443155|  00:01:34.467(     94467.539 ms.)|    200.438|  00:00:00.015(        15.287 ms.)|       .016
|   13|  05.04.2019 01:03|       4167|    4387191|  00:06:51.380(    411380.293 ms.)|    609.332|  00:05:18.847(    318847.407 ms.)|     77.507
|   14|  05.04.2019 02:03|       4171|     189852|  00:00:10.989(     10989.899 ms.)|     52.737|  00:00:00.539(       539.110 ms.)|      4.906
|   15|  05.04.2019 03:01|       4173|       3627|  00:00:00.103(       103.000 ms.)|      1.042|  00:00:00.004(         4.131 ms.)|      4.010
|   16|  05.04.2019 04:00|       4175|       3627|  00:00:00.085(        85.235 ms.)|      1.025|  00:00:00.003(         3.811 ms.)|      4.471
|   17|  05.04.2019 05:00|       4177|       3747|  00:00:00.849(       849.454 ms.)|      1.041|  00:00:00.006(         6.124 ms.)|       .721
|   18|  05.04.2019 06:00|       4179|       3747|  00:00:00.849(       849.561 ms.)|      1.041|  00:00:00.000(          .051 ms.)|       .006
|   19|  05.04.2019 07:00|       4181|       3747|  00:00:00.839(       839.416 ms.)|      1.041|  00:00:00.000(          .062 ms.)|       .007
|   20|  05.04.2019 08:00|       4183|       3747|  00:00:00.846(       846.382 ms.)|      1.041|  00:00:00.000(          .007 ms.)|       .001
|   21|  05.04.2019 09:00|       4185|       3747|  00:00:00.855(       855.426 ms.)|      1.041|  00:00:00.000(          .065 ms.)|       .008
|   22|  05.04.2019 10:00|       4187|       3797|  00:01:40.150(    100150.165 ms.)|      1.055|  00:00:21.845(     21845.217 ms.)|     21.812

Besedilo vseh izbir SQL

Zahteva

SELECT 
  queryid , 
  query 
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY queryid , query

Skupaj

Kot lahko vidite, lahko na dokaj preprost način pridobite veliko koristnih informacij o obremenitvi in ​​stanju baze podatkov.

Opomba:Če popravite queryid v poizvedbah, potem bomo dobili zgodovino za ločeno zahtevo (zaradi prihranka prostora so poročila za ločeno zahtevo izpuščena).

Tako so statistični podatki o uspešnosti poizvedbe na voljo in zbrani.
Prva faza »zbiranje statističnih podatkov« je zaključena.

Lahko nadaljujete na drugo stopnjo - "konfiguriranje meritev uspešnosti".
Spremljanje učinkovitosti poizvedb PostgreSQL. 1. del - poročanje

Ampak to je povsem druga zgodba.

Se nadaljuje ...

Vir: www.habr.com

Dodaj komentar