PostgreSQL vaicājuma veiktspējas uzraudzība. 1.daļa - ziņošana

Inženieris - tulkojumā no latīņu valodas - iedvesmots.
Inženieris var darīt jebko. c) R. Dīzelis.
Epigrāfi.
PostgreSQL vaicājuma veiktspējas uzraudzība. 1.daļa - ziņošana
Vai stāsts par to, kāpēc datu bāzes administratoram ir jāatceras sava programmēšanas pagātne.

priekšvārds

Visi nosaukumi ir mainīti. Sakritības ir nejaušas. Materiāls atspoguļo tikai autora personīgo viedokli.

Garantiju atruna: Plānotā rakstu sērija nesaturēs detalizētu un precīzu izmantoto tabulu un skriptu aprakstu. Materiālus nevar izmantot uzreiz “KĀDI TĀ IR”.
Pirmkārt, lielā materiāla apjoma dēļ
otrkārt, pateicoties ciešajām attiecībām ar reāla klienta ražošanas bāzi.
Tāpēc rakstos būs tikai idejas un apraksti visvispārīgākajā formā.
Varbūt nākotnē sistēma pieaugs līdz līmenim, kas tiks publicēta GitHub, vai varbūt nē. Laiks rādīs.

Stāsta sākums - "Vai atceries, kā tas viss sākās'.
Rezultātā notikušais vispārīgākajā izteiksmē - "Sintēze kā viena no metodēm PostgreSQL veiktspējas uzlabošanai»

Kāpēc man tas viss ir vajadzīgs?

Nu, pirmkārt, lai neaizmirstu, atceroties krāšņās dienas pensijā.
Otrkārt, sistematizēt rakstīto. Jo dažreiz es sāku apjukt un aizmirst dažas daļas.

Nu, un vissvarīgākais ir tas, ka kādam tas var noderēt un palīdzēt izvairīties no riteņa no jauna izgudrošanas un grābekļa nesavākšanas. Citiem vārdiem sakot, uzlabojiet savu karmu (nevis Habrova). Jo visvērtīgākā lieta šajā pasaulē ir idejas. Galvenais ir atrast ideju. Taču idejas pārvēršana realitātē ir tīri tehnisks jautājums.

Tātad, sāksim, pamazām...

Problēmas formulēšana.

Pieejams:

PostgreSQL(10.5) datubāze, jauktas slodzes veids (OLTP+DSS), vidēji viegla slodze, atrodas AWS mākonī.
Nav datu bāzes uzraudzības, infrastruktūras uzraudzība tiek nodrošināta standarta AWS rīku veidā minimālā konfigurācijā.

Nepieciešams:

Pārraugiet datu bāzes veiktspēju un statusu, atrodiet un iegūstiet sākotnējo informāciju smago datu bāzes vaicājumu optimizēšanai.

Īss ievads vai risinājuma iespēju analīze

Sākumā mēģināsim analizēt problēmas risināšanas iespējas no inženiera ieguvumu un trūkumu salīdzinošās analīzes viedokļa un ļaujiet tiem, kam tas ir tiesības saskaņā ar personāla grafiku, nodarboties ar ieguvumiem un vadības zaudējumi.

1. iespēja — “Darbs pēc pieprasījuma”

Atstājam visu kā ir. Ja klientu kaut kas neapmierina datu bāzes vai aplikācijas funkcionalitāte, veiktspēja, viņš par to paziņos DBA inženieriem pa e-pastu vai izveidojot incidentu biļešu kastē.
Inženieris, saņēmis paziņojumu, sapratīs problēmu, piedāvās risinājumu vai noliks problēmu otrā pusē, cerot, ka viss atrisināsies pats no sevis, un vienalga, viss drīz aizmirsies.
Piparkūkas un virtuļi, zilumi un pumpasPiparkūkas un virtuļi:
1. Neko papildus nevajag darīt.
2. Vienmēr ir iespēja aizbildināties un ieskrūvēt.
3. Daudz laika, ko varat pavadīt pēc saviem ieskatiem.
Zilumi un izciļņi:
1. Agri vai vēlu klients padomās par eksistences būtību un universālo taisnīgumu šajā pasaulē un vēlreiz uzdos sev jautājumu - kāpēc es maksāju viņiem savu naudu? Sekas vienmēr ir vienas un tās pašas – jautājums tikai, kad klientam paliks garlaicīgi un pamāja ardievas. Un barotava būs tukša. Tas ir skumji.
2. Inženieru attīstība - nulle.
3. Grūtības darba plānošanā un iekraušanā

2. variants — “Dejošana ar tamburīniem, tvaicēšana un apavu uzvilkšana”

1. punkts-Kāpēc mums vajadzīga monitoringa sistēma, visu saņemsim ar pieprasījumiem. Mēs izpildām daudz dažādu vaicājumu datu vārdnīcai un dinamiskajiem skatiem, ieslēdzam visu veidu skaitītājus, ievietojam visu tabulās un periodiski analizējam sarakstus un tabulas. Rezultātā mums ir skaisti vai ne tik skaisti grafiki, tabulas, atskaites. Galvenais, lai būtu vairāk, vairāk.
2. punkts-Mēs ģenerējam aktivitāti un sākam visa tā analīzi.
3. punkts- Mēs gatavojam noteiktu dokumentu, mēs to saucam vienkārši - "kā mums vajadzētu izveidot datu bāzi."
4. punkts-Pasūtītājs, redzot visu šo grafiku un skaitļu krāšņumu, ir bērnišķīgā, naivā pārliecībā - tagad mums viss nostrādās, drīz. Un viņš viegli un nesāpīgi šķiras no saviem finanšu resursiem. Arī vadība ir pārliecināta, ka mūsu inženieri strādā lieliski. Maksimālā ielāde.
5. punkts- Regulāri atkārtojiet 1. darbību.
Piparkūkas un virtuļi, zilumi un pumpasPiparkūkas un virtuļi:
1. Vadītāju un inženieru dzīve ir vienkārša, paredzama un aktivitātes pilna. Viss kūsā, visi ir aizņemti.
2. Arī klienta dzīve nav slikta - viņš vienmēr ir pārliecināts, ka tikai nedaudz jāpacieš, un viss izdosies. Tas nepaliek labāk, pasaule ir negodīga, nākamajā dzīvē jums veiksies.
Zilumi un izciļņi:
1. Agri vai vēlu atradīsies kāds ātrāks līdzīga pakalpojuma sniedzējs, kurš darīs to pašu, bet nedaudz lētāk. Un, ja rezultāts ir vienāds, kāpēc maksāt vairāk. Kas atkal novedīs pie barotavas pazušanas.
2. Tas ir garlaicīgi. Cik garlaicīga ir jebkura bezjēdzīga darbība.
3. Tāpat kā iepriekšējā versijā, nav izstrādes. Bet inženierim mīnuss ir tāds, ka atšķirībā no pirmās iespējas jums pastāvīgi jāģenerē IBD. Un tas prasa laiku. Kuru varat iztērēt sava mīļotā labā. Tā kā jūs nevarat parūpēties par sevi, neviens par jums nerūpējas.

3. iespēja — jums nav jāizgudro velosipēds, jums tas vienkārši jāiegādājas un jābrauc.

Ne velti citu kompāniju inženieri ēd picu ar alu (ak, Sanktpēterburgas slavas laiki 90. gados). Izmantosim uzraudzības sistēmas, kas ir izgatavotas, atkļūdotas un darbojas, un vispārīgi runājot par labu (labi, vismaz to radītājiem).
Piparkūkas un virtuļi, zilumi un pumpasPiparkūkas un virtuļi:
1. Nav jātērē laiks, izdomājot kaut ko, kas jau ir izgudrots. Paņemiet to un izmantojiet to.
2. Monitoringa sistēmas nav muļķu rakstītas un tās, protams, noder.
3. Darba uzraudzības sistēmas parasti nodrošina noderīgu filtrētu informāciju.
Zilumi un izciļņi:
1. Inženieris šajā gadījumā nav inženieris, bet tikai kāda cita produkta lietotājs vai lietotājs.
2. Klientam ir jābūt pārliecinātam par nepieciešamību iegādāties kaut ko tādu, ko viņš, vispārīgi runājot, nevēlas saprast un nedrīkst, un kopumā gada budžets ir apstiprināts un nemainīsies. Pēc tam jums ir jāpiešķir atsevišķs resurss un jākonfigurē tas noteiktai sistēmai. Tie. vispirms ir jāmaksā, jāmaksā un vēlreiz jāmaksā. Un klients ir skops. Tā ir šīs dzīves norma.

Ko darīt - Černiševskis? Jūsu jautājums ir ļoti aktuāls. (ar)

Šajā konkrētajā gadījumā un pašreizējā situācijā varat to darīt nedaudz savādāk - izveidosim savu uzraudzības sistēmu.
PostgreSQL vaicājuma veiktspējas uzraudzība. 1.daļa - ziņošana
Protams, ne sistēma, šī vārda pilnā nozīmē, tā ir pārāk skaļa un pārgalvīga, taču vismaz kaut kā atvieglo jūsu uzdevumu un apkopo vairāk informācijas, lai atrisinātu darbības traucējumus. Lai nenonāktu situācijā - “ej tur, es nezinu kur, atrodi kaut ko, es nezinu ko”.

Kādi ir šīs opcijas plusi un mīnusi:

Plusi:
1. Tas ir interesanti. Nu, vismaz tas ir interesantāks par pastāvīgo "samazināt datu failu, mainīt tabulas vietu utt."
2. Tās ir jaunas prasmes un jauna attīstība. Kas agri vai vēlu dos tev pelnītas piparkūkas un virtuļus.
Mīnusi:
1. Būs jāstrādā. Smagi strādāt.
2. Jums būs regulāri jāskaidro visu darbību jēga un perspektīvas.
3. Kaut kas būs jāupurē, jo vienīgais inženierim pieejamais resurss - laiks - ir ierobežots ar Visumu.
4. Sliktākā un nepatīkamākā lieta - rezultāts var būt muļķības, piemēram, "Ne pele, nevis varde, bet nezināms dzīvnieks."

Kas neriskē, tas nedzer šampanieti.
Tātad - jautrība sākas.

Vispārējā ideja - shematiski

PostgreSQL vaicājuma veiktspējas uzraudzība. 1.daļa - ziņošana
(Ilustrācija ņemta no raksta «Sintēze kā viena no metodēm PostgreSQL veiktspējas uzlabošanai")

Paskaidrojums:

  • Standarta PostgreSQL paplašinājums “pg_stat_statements” ir instalēts mērķa datu bāzē.
  • Uzraudzības datu bāzē mēs izveidojam pakalpojumu tabulu kopu pg_stat_statements vēstures glabāšanai sākotnējā posmā un metrikas iestatīšanai un uzraudzībai nākotnē.
  • Uzraudzības resursdatorā mēs izveidojam bash skriptu kopu, tostarp tos, kas paredzēti incidentu ģenerēšanai biļešu sistēmā.

Servisa galdi

Pirmkārt, shematisks vienkāršots ERD, kas notika beigās:
PostgreSQL vaicājuma veiktspējas uzraudzība. 1.daļa - ziņošana
Īss tabulu aprakstsgalapunkts — resursdators, savienojuma punkts ar gadījumu
datubāze - datu bāzes parametri
pg_stat_history - vēsturiska tabula mērķa datu bāzes skata pg_stat_statements pagaidu momentuzņēmumu glabāšanai
metriskā_vārdnīca - veiktspējas rādītāju vārdnīca
metric_config — atsevišķu metriku konfigurēšana
metriskā — konkrēts rādītājs pieprasījumam, kas tiek uzraudzīts
metric_alert_history - veiktspējas brīdinājumu vēsture
log_query — pakalpojumu tabula parsētu ierakstu glabāšanai no PostgreSQL žurnālfaila, kas lejupielādēts no AWS
bāzes — par bāzi izmantoto laika periodu parametri
kontrolpunkts — metrikas konfigurācija datu bāzes statusa pārbaudei
checkpoint_alert_history — datu bāzes veselības pārbaudes metrikas brīdinājumu vēsture
pg_stat_db_queries — aktīvo pieprasījumu apkalpošanas tabula
Aktivitāšu vēsture — darbību žurnāla pakalpojumu tabula
trap_oid — lamatas konfigurācijas pakalpojumu tabula

1. posms – apkopojiet statistisko informāciju par veiktspēju un saņemiet atskaites

Statistikas informācijas glabāšanai tiek izmantota tabula pg_stat_history
pg_stat_history tabulas struktūra

                                          Tabula "public.pg_stat_history" Kolonna | Tips | Modifikatori---------------------+-------------------------- -+------------------------------------------ id | vesels skaitlis | nav nulles noklusējuma nextval('pg_stat_history_id_seq'::regclass) snapshot_timestamp | laikspiedols bez laika joslas | datu bāzes_id | vesels skaitlis | dbid | oid | lietotāja ID | oid | queryid | bigint | vaicājums | teksts | zvani | bigint | kopējais_laiks | dubultā precizitāte | min_laiks | dubultā precizitāte | max_time | dubultā precizitāte | vidējais_laiks | dubultā precizitāte | stddev_time | dubultā precizitāte | rindas | bigint | shared_blks_hit | bigint | shared_blks_read | bigint | shared_blks_dirtied | bigint | shared_blks_written | bigint | local_blks_hit | bigint | local_blks_read | bigint | local_blks_dirtied | bigint | local_blks_written | bigint | temp_blks_read | bigint | temp_blks_written | bigint | blk_read_time | dubultā precizitāte | blk_write_time | dubultā precizitāte | bāzes līnijas_id | vesels skaitlis | Indeksi: "pg_stat_history_pkey" PRIMĀRĀ ATSLĒGA, btree (id) "database_idx" btree (database_id) "queryid_idx" btree (queryid) "snapshot_timestamp_idx" btree (snapshot_timestamp) FIRMA_Key_key id) ATSAUCES datu bāze(id ) PAR KASKĀDES DZĒŠANU

Kā redzat, tabula ir tikai kumulatīvi skata dati pg_stat_statements mērķa datu bāzē.

Šīs tabulas izmantošana ir ļoti vienkārša

pg_stat_history attēlos uzkrāto statistiku par vaicājumu izpildi par katru stundu. Katras stundas sākumā pēc tabulas aizpildīšanas statistika pg_stat_statements atiestatīt ar pg_stat_statements_reset().
Piezīme: Statistika tiek apkopota par vaicājumiem, kuru izpildes ilgums pārsniedz 1 sekundi.
Tabulas pg_stat_history aizpildīšana

--pg_stat_history.sql
CREATE OR REPLACE FUNCTION pg_stat_history( ) RETURNS boolean AS $$
DECLARE
  endpoint_rec record ;
  database_rec record ;
  pg_stat_snapshot record ;
  current_snapshot_timestamp timestamp without time zone;
BEGIN
  current_snapshot_timestamp = date_trunc('minute',now());  
  
  FOR endpoint_rec IN SELECT * FROM endpoint 
  LOOP
    FOR database_rec IN SELECT * FROM database WHERE endpoint_id = endpoint_rec.id 
	  LOOP
	    
		RAISE NOTICE 'NEW SHAPSHOT IS CREATING';
		
		--Connect to the target DB	  
	    EXECUTE 'SELECT dblink_connect(''LINK1'',''host='||endpoint_rec.host||' dbname='||database_rec.name||' user=USER password=PASSWORD '')';
 
        RAISE NOTICE 'host % and dbname % ',endpoint_rec.host,database_rec.name;
		RAISE NOTICE 'Creating snapshot of pg_stat_statements for database %',database_rec.name;
		
		SELECT 
	      *
		INTO 
		  pg_stat_snapshot
	    FROM dblink('LINK1',
	      'SELECT 
	       dbid , SUM(calls),SUM(total_time),SUM(rows) ,SUM(shared_blks_hit) ,SUM(shared_blks_read) ,SUM(shared_blks_dirtied) ,SUM(shared_blks_written) , 
           SUM(local_blks_hit) , SUM(local_blks_read) , SUM(local_blks_dirtied) , SUM(local_blks_written) , SUM(temp_blks_read) , SUM(temp_blks_written) , SUM(blk_read_time) , SUM(blk_write_time)
	       FROM pg_stat_statements WHERE dbid=(SELECT oid from pg_database where datname=current_database() ) 
		   GROUP BY dbid
  	      '
	               )
	      AS t
	       ( dbid oid , calls bigint , 
  	         total_time double precision , 
	         rows bigint , shared_blks_hit bigint , shared_blks_read bigint ,shared_blks_dirtied bigint ,shared_blks_written	 bigint ,
             local_blks_hit	 bigint ,local_blks_read bigint , local_blks_dirtied bigint ,local_blks_written bigint ,
             temp_blks_read	 bigint ,temp_blks_written bigint ,
             blk_read_time double precision , blk_write_time double precision	  
	       );
		 
		INSERT INTO pg_stat_history
          ( 
		    snapshot_timestamp  ,database_id  ,
			dbid , calls  ,total_time ,
            rows ,shared_blks_hit  ,shared_blks_read  ,shared_blks_dirtied  ,shared_blks_written ,local_blks_hit , 	 	
            local_blks_read,local_blks_dirtied,local_blks_written,temp_blks_read,temp_blks_written, 	
            blk_read_time, blk_write_time 
		  )		  
	    VALUES
	      (
	       current_snapshot_timestamp ,
		   database_rec.id ,
	       pg_stat_snapshot.dbid ,pg_stat_snapshot.calls,
	       pg_stat_snapshot.total_time,
	       pg_stat_snapshot.rows ,pg_stat_snapshot.shared_blks_hit ,pg_stat_snapshot.shared_blks_read ,pg_stat_snapshot.shared_blks_dirtied ,pg_stat_snapshot.shared_blks_written , 
           pg_stat_snapshot.local_blks_hit , pg_stat_snapshot.local_blks_read , pg_stat_snapshot.local_blks_dirtied , pg_stat_snapshot.local_blks_written , 
	       pg_stat_snapshot.temp_blks_read , pg_stat_snapshot.temp_blks_written , pg_stat_snapshot.blk_read_time , pg_stat_snapshot.blk_write_time 	   
	      );		   
		  
        RAISE NOTICE 'Creating snapshot of pg_stat_statements for queries with min_time more than 1000ms';
	
        FOR pg_stat_snapshot IN
          --All queries with max_time greater than 1000 ms
	      SELECT 
	        *
	      FROM dblink('LINK1',
	        'SELECT 
	         dbid , userid ,queryid,query,calls,total_time,min_time ,max_time,mean_time, stddev_time ,rows ,shared_blks_hit ,
			 shared_blks_read ,shared_blks_dirtied ,shared_blks_written , 
             local_blks_hit , local_blks_read , local_blks_dirtied , 
			 local_blks_written , temp_blks_read , temp_blks_written , blk_read_time , 
			 blk_write_time
	         FROM pg_stat_statements 
			 WHERE dbid=(SELECT oid from pg_database where datname=current_database() AND min_time >= 1000 ) 
  	        '

	                  )
	        AS t
	         ( dbid oid , userid oid , queryid bigint ,query text , calls bigint , 
  	           total_time double precision ,min_time double precision	 ,max_time double precision	 , mean_time double precision	 ,  stddev_time double precision	 , 
	           rows bigint , shared_blks_hit bigint , shared_blks_read bigint ,shared_blks_dirtied bigint ,shared_blks_written	 bigint ,
               local_blks_hit	 bigint ,local_blks_read bigint , local_blks_dirtied bigint ,local_blks_written bigint ,
               temp_blks_read	 bigint ,temp_blks_written bigint ,
               blk_read_time double precision , blk_write_time double precision	  
	         )
	    LOOP
		  INSERT INTO pg_stat_history
          ( 
		    snapshot_timestamp  ,database_id  ,
			dbid ,userid  , queryid  , query  , calls  ,total_time ,min_time ,max_time ,mean_time ,stddev_time ,
            rows ,shared_blks_hit  ,shared_blks_read  ,shared_blks_dirtied  ,shared_blks_written ,local_blks_hit , 	 	
            local_blks_read,local_blks_dirtied,local_blks_written,temp_blks_read,temp_blks_written, 	
            blk_read_time, blk_write_time 
		  )		  
	      VALUES
	      (
	       current_snapshot_timestamp ,
		   database_rec.id ,
	       pg_stat_snapshot.dbid ,pg_stat_snapshot.userid ,pg_stat_snapshot.queryid,pg_stat_snapshot.query,pg_stat_snapshot.calls,
	       pg_stat_snapshot.total_time,pg_stat_snapshot.min_time ,pg_stat_snapshot.max_time,pg_stat_snapshot.mean_time, pg_stat_snapshot.stddev_time ,
	       pg_stat_snapshot.rows ,pg_stat_snapshot.shared_blks_hit ,pg_stat_snapshot.shared_blks_read ,pg_stat_snapshot.shared_blks_dirtied ,pg_stat_snapshot.shared_blks_written , 
           pg_stat_snapshot.local_blks_hit , pg_stat_snapshot.local_blks_read , pg_stat_snapshot.local_blks_dirtied , pg_stat_snapshot.local_blks_written , 
	       pg_stat_snapshot.temp_blks_read , pg_stat_snapshot.temp_blks_written , pg_stat_snapshot.blk_read_time , pg_stat_snapshot.blk_write_time 	   
	      );
		  
        END LOOP;

        PERFORM dblink_disconnect('LINK1');  
				
	  END LOOP ;--FOR database_rec IN SELECT * FROM database WHERE endpoint_id = endpoint_rec.id 
    
  END LOOP;

RETURN TRUE;  
END
$$ LANGUAGE plpgsql;

Rezultātā pēc kāda laika tabulā pg_stat_history mums būs tabulas satura momentuzņēmumu komplekts pg_stat_statements mērķa datu bāze.

Patiesībā ziņo

Izmantojot vienkāršus vaicājumus, varat iegūt diezgan noderīgus un interesantus pārskatus.

Apkopoti dati par noteiktu laika periodu

Pretenzija

SELECT 
  database_id , 
  SUM(calls) AS calls ,SUM(total_time)  AS total_time ,
  SUM(rows) AS rows , SUM(shared_blks_hit)  AS shared_blks_hit,
  SUM(shared_blks_read) AS shared_blks_read ,
  SUM(shared_blks_dirtied) AS shared_blks_dirtied,
  SUM(shared_blks_written) AS shared_blks_written , 
  SUM(local_blks_hit) AS local_blks_hit , 
  SUM(local_blks_read) AS local_blks_read , 
  SUM(local_blks_dirtied) AS local_blks_dirtied , 
  SUM(local_blks_written)  AS local_blks_written,
  SUM(temp_blks_read) AS temp_blks_read, 
  SUM(temp_blks_written) temp_blks_written , 
  SUM(blk_read_time) AS blk_read_time , 
  SUM(blk_write_time) AS blk_write_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NULL AND
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY database_id ;

DB laiks

to_char(intervalls '1 milisekunde' * pg_total_stat_history_rec.total_time, 'HH24:MI:SS.MS')

I/O laiks

to_char(interval '1 milisekunde' * ( pg_total_stat_history_rec.blk_read_time + pg_total_stat_history_rec.blk_write_time ), 'HH24:MI:SS.MS')

TOP10 SQL pēc total_time

Pretenzija

SELECT 
  queryid , 
  SUM(calls) AS calls ,
  SUM(total_time)  AS total_time  	
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT 
GROUP BY queryid 
ORDER BY 3 DESC 
LIMIT 10
-------------------------------------------------- ------------------------------------ | TOP10 SQL PĒC KOPĒJĀ IZPILDES LAIKA | #| queryid| zvani| zvani %| kopējais_laiks (ms) | dbtime % +----------+------------+------------+-----------+ ------ ---------------------------+----------- | 1| 821760255| 2| .00001|00:03:23.141( 203141.681 ms.)| 5.42 | 2| 4152624390| 2| .00001|00:03:13.929( 193929.215 ms.)| 5.17 | 3| 1484454471| 4| .00001|00:02:09.129( 129129.057 ms.)| 3.44 | 4| 655729273| 1| .00000|00:02:01.869( 121869.981 ms.)| 3.25 | 5| 2460318461| 1| .00000|00:01:33.113( 93113.835 ms.)| 2.48 | 6| 2194493487| 4| .00001|00:00:17.377( 17377.868 ms.)| .46 | 7| 1053044345| 1| .00000|00:00:06.156( 6156.352 ms.)| .16 | 8| 3644780286| 1| .00000|00:00:01.063( 1063.830 ms.)| .03

TOP10 SQL pēc kopējā I/O laika

Pretenzija

SELECT 
  queryid , 
  SUM(calls) AS calls ,
  SUM(blk_read_time + blk_write_time)  AS io_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY  queryid 
ORDER BY 3 DESC 
LIMIT 10
-------------------------------------------------- --------------------------------------- | TOP10 SQL PĒC KOPĒJĀ I/O LAIKA | #| queryid| zvani| zvani %| I/O laiks (ms)|db I/O laiks % +----+-----------+-----------+------- -----------+---------------------------------+------ ------ -- | 1| 4152624390| 2| .00001|00:08:31.616( 511616.592 ms.)| 31.06 | 2| 821760255| 2| .00001|00:08:27.099( 507099.036 ms.)| 30.78 | 3| 655729273| 1| .00000|00:05:02.209( 302209.137 ms.)| 18.35 | 4| 2460318461| 1| .00000|00:04:05.981( 245981.117 ms.)| 14.93 | 5| 1484454471| 4| .00001|00:00:39.144( 39144.221 ms.)| 2.38 | 6| 2194493487| 4| .00001|00:00:18.182( 18182.816 ms.)| 1.10 | 7| 1053044345| 1| .00000|00:00:16.611( 16611.722 ms.)| 1.01 | 8| 3644780286| 1| .00000|00:00:00.436( 436.205 ms.)| .03

TOP10 SQL pēc maksimālā izpildes laika

Pretenzija

SELECT 
  id AS snapshotid , 
  queryid , 
  snapshot_timestamp ,  
  max_time 
FROM 
  pg_stat_history 
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
ORDER BY 4 DESC 
LIMIT 10

-------------------------------------------------- ---------------------------------------- | TOP10 SQL BY MAX IZPILDES LAIKA | #| momentuzņēmums| momentuzņēmuma ID| queryid| max_time (ms) +----+-------------------+------------+---------- --+---------------------------------------- | 1| 05.04.2019/01/03 4169:655729273| 00| 02| 01.869:121869.981:2( 04.04.2019 ms.) | 17| 00/4153/821760255 00:01| 41.570| 101570.841| 3:04.04.2019:16( 00 ms.) | 4146| 821760255/00/01 41.570:101570.841| 4| 04.04.2019| 16:00:4144( 4152624390 ms.) | 00| 01/36.964/96964.607 5:04.04.2019| 17| 00| 4151:4152624390:00(01 ms.) | 36.964| 96964.607/6/05.04.2019 10:00| 4188| 1484454471| 00:01:33.452(93452.150 ms.) | 7| 04.04.2019/17/00 4150:2460318461| 00| 01| 33.113:93113.835:8( 04.04.2019 ms.) | 15| 00/4140/1484454471 00:00| 11.892| 11892.302| 9:04.04.2019:16(00 ms.) | 4145| 1484454471/00/00 11.892:11892.302| 10| 04.04.2019| 17:00:4152( 1484454471 ms.) | 00| 00/11.892/11892.302 XNUMX:XNUMX| XNUMX| XNUMX| XNUMX:XNUMX:XNUMX( XNUMX ms.) | XNUMX| XNUMX/XNUMX/XNUMX XNUMX:XNUMX| XNUMX| XNUMX| XNUMX:XNUMX:XNUMX( XNUMX ms.)

TOP10 SQL, izmantojot SHARED bufera lasīšanu/rakstīšanu

Pretenzija

SELECT 
  id AS snapshotid , 
  queryid ,
  snapshot_timestamp , 
  shared_blks_read , 
  shared_blks_written 
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND
  ( shared_blks_read > 0 OR shared_blks_written > 0 )
ORDER BY 4 DESC  , 5 DESC 
LIMIT 10
-------------------------------------------------- ------------------------------------------- | TOP10 SQL PĒC KOPĪGOTĀ BUFERA LASĪŠANA/RAKSTĪŠANA | #| momentuzņēmums| momentuzņēmuma ID| queryid| koplietotie bloki lasīt| koplietotie bloki rakstiet +----+------------------+------------+---------- -+---------------------+---------------------- | 1| 04.04.2019/17/00 4153:821760255| 797308| 0| 2| 04.04.2019 | 16| 00/4146/821760255 797308:0| 3| 05.04.2019| 01| 03 | 4169| 655729273/797158/0 4:04.04.2019| 16| 00| 4144| 4152624390 | 756514| 0/5/04.04.2019 17:00| 4151| 4152624390| 756514| 0 | 6| 04.04.2019/17/00 4150:2460318461| 734117| 0| 7| 04.04.2019 | 17| 00/4155/3644780286 52973:0| 8| 05.04.2019| 01| 03 | 4168| 1053044345/52818/0 9:04.04.2019| 15| 00| 4141| 2194493487 | 52813| 0/10/04.04.2019 16:00| 4147| 2194493487| 52813| 0 | XNUMX| XNUMX/XNUMX/XNUMX XNUMX:XNUMX| XNUMX| XNUMX| XNUMX| XNUMX | XNUMX| XNUMX/XNUMX/XNUMX XNUMX:XNUMX| XNUMX| XNUMX| XNUMX| XNUMX -------------------------------------------------- -------------------------------------------

Pieprasījumu sadalījuma histogramma pēc maksimālā izpildes laika

pieprasījumi

SELECT  
  MIN(max_time) AS hist_min  , 
  MAX(max_time) AS hist_max , 
  (( MAX(max_time) - MIN(min_time) ) / hist_columns ) as hist_width
FROM 
  pg_stat_history 
WHERE 
  queryid IS NOT NULL AND
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT ;

SELECT 
  SUM(calls) AS calls
FROM 
  pg_stat_history 
WHERE 
  queryid IS NOT NULL AND
  database_id =DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND 
  ( max_time >= hist_current_min AND  max_time < hist_current_max ) ;
|------------------------------------------------- - ---------------------------------------------- | MAX_TIME HISTOGRAMMA | KOPĀ ZVANU: 33851920 | MIN. LAIKS: 00:00:01.063 | MAKSIMĀLAIS LAIKS: 00:02:01.869 ------------------------------------------- ---------------------------------------- | min ilgums| max ilgums| zvani +-----------------------------------+-------------- ---------------------+----------- | 00:00:01.063( 1063.830 ms.) | 00:00:13.144( 13144.445 ms.) | 9 | 00:00:13.144( 13144.445 ms.) | 00:00:25.225( 25225.060 ms.) | 0 | 00:00:25.225( 25225.060 ms.) | 00:00:37.305( 37305.675 ms.) | 0 | 00:00:37.305( 37305.675 ms.) | 00:00:49.386( 49386.290 ms.) | 0 | 00:00:49.386( 49386.290 ms.) | 00:01:01.466( 61466.906 ms.) | 0 | 00:01:01.466( 61466.906 ms.) | 00:01:13.547( 73547.521 ms.) | 0 | 00:01:13.547( 73547.521 ms.) | 00:01:25.628( 85628.136 ms.) | 0 | 00:01:25.628( 85628.136 ms.) | 00:01:37.708( 97708.751 ms.) | 4 | 00:01:37.708( 97708.751 ms.) | 00:01:49.789( 109789.366 ms.) | 2 | 00:01:49.789( 109789.366 ms.) | 00:02:01.869( 121869.981 ms.) | 0

TOP10 momentuzņēmumi pēc vaicājuma sekundē

pieprasījumi

--pg_qps.sql
--Calculate Query Per Second 
CREATE OR REPLACE FUNCTION pg_qps( pg_stat_history_id integer ) RETURNS double precision AS $$
DECLARE
 pg_stat_history_rec record ;
 prev_pg_stat_history_id integer ;
 prev_pg_stat_history_rec record;
 total_seconds double precision ;
 result double precision;
BEGIN 
  result = 0 ;
  
  SELECT *
  INTO pg_stat_history_rec
  FROM 
    pg_stat_history
  WHERE id = pg_stat_history_id ;

  IF pg_stat_history_rec.snapshot_timestamp IS NULL 
  THEN
    RAISE EXCEPTION 'ERROR - Not found pg_stat_history for id = %',pg_stat_history_id;
  END IF ;  
  
 --RAISE NOTICE 'pg_stat_history_id = % , snapshot_timestamp = %', pg_stat_history_id , 
 pg_stat_history_rec.snapshot_timestamp ;
  
  SELECT 
    MAX(id)   
  INTO
    prev_pg_stat_history_id
  FROM
    pg_stat_history
  WHERE 
    database_id = pg_stat_history_rec.database_id AND
	queryid IS NULL AND
	id < pg_stat_history_rec.id ;

  IF prev_pg_stat_history_id IS NULL 
  THEN
    RAISE NOTICE 'Not found previous pg_stat_history shapshot for id = %',pg_stat_history_id;
	RETURN NULL ;
  END IF;
  
  SELECT *
  INTO prev_pg_stat_history_rec
  FROM 
    pg_stat_history
  WHERE id = prev_pg_stat_history_id ;
  
  --RAISE NOTICE 'prev_pg_stat_history_id = % , prev_snapshot_timestamp = %', prev_pg_stat_history_id , prev_pg_stat_history_rec.snapshot_timestamp ;    

  total_seconds = extract(epoch from ( pg_stat_history_rec.snapshot_timestamp - prev_pg_stat_history_rec.snapshot_timestamp ));
  
  --RAISE NOTICE 'total_seconds = % ', total_seconds ;    
  
  --RAISE NOTICE 'calls = % ', pg_stat_history_rec.calls ;      
  
  IF total_seconds > 0 
  THEN
    result = pg_stat_history_rec.calls / total_seconds ;
  ELSE
   result = 0 ; 
  END IF;
   
 RETURN result ;
END
$$ LANGUAGE plpgsql;


SELECT 
  id , 
  snapshot_timestamp ,
  calls , 	
  total_time , 
  ( select pg_qps( id )) AS QPS ,
  blk_read_time ,
  blk_write_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND
  ( select pg_qps( id )) IS NOT NULL 
ORDER BY 5 DESC 
LIMIT 10
|------------------------------------------------- - ---------------------------------------------- | TOP10 momentuzņēmumi, kas sakārtoti pēc QueryPerSeconds skaitļiem --------------------------------------------- -------------------------------------------------- -------------------------------------------------- | #| momentuzņēmums| momentuzņēmuma ID| zvani| kopējais dbtime| QPS| I/O laiks| I/O laiks % +-----+-------------------+------------+-------- ----+-----------------------------------+----------- -+------------------------+------------ | 1| 04.04.2019/20/04 4161:5758631| 00| 06| 30.513:390513.926:1573.396( 00 ms.)| 00| 01.470:1470.110:376( 2 ms.)| .04.04.2019 | 17| 00/4149/3529197 00:11| 48.830| 708830.618| 980.332:00:12( 47.834 ms.)| 767834.052| 108.324:3:04.04.2019( 16 ms.)| 00 | 4143| 3525360/00/10 13.492:613492.351| 979.267| 00| 08:41.396:521396.555( 84.988 ms.)| 4| 04.04.2019:21:03(4163 ms.)| 2781536 | 00| 03/06.470/186470.979 785.745:00| 00| 00.249| 249.865:134:5( 04.04.2019 ms.)| 19| 03:4159:2890362(00 ms.)| .03 | 16.784| 196784.755 776.979:00| 00| 01.441| 1441.386:732:6( 04.04.2019 ms.)| 14| 00:4137:2397326( 00 ms.)| .04 | 43.033| 283033.854/665.924/00 00:00.024| 24.505| 009| 7:04.04.2019:15( 00 ms.)| 4139| 2394416:00:04(51.435 ms.)| .291435.010 | 665.116| 00/00/12.025 12025.895:4.126| 8| 04.04.2019| 13:00:4135( 2373043 ms.)| 00| 04:26.791:266791.988( 659.179 ms.)| 00 | 00| 00.064 64.261:024| 9| 05.04.2019| 01:03:4167( 4387191 ms.)| 00| 06:51.380:411380.293( 609.332 ms.)| .00 | 05| 18.847/318847.407/77.507 10:04.04.2019| 18| 01| 4157:1145596:00( 01 ms.)| 19.217| 79217.372:313.004:00( 00 ms.)| 01.319 | 1319.676| 1.666/XNUMX/XNUMX XNUMX:XNUMX| XNUMX| XNUMX| XNUMX:XNUMX:XNUMX( XNUMX ms.)| XNUMX| XNUMX:XNUMX:XNUMX( XNUMX ms.)| XNUMX

Stundu izpildes vēsture ar QueryPerSeconds un I/O laiku

Pretenzija

SELECT 
  id , 
  snapshot_timestamp ,
  calls , 	
  total_time , 
  ( select pg_qps( id )) AS QPS ,
  blk_read_time ,
  blk_write_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
ORDER BY 2
|-----------------------------------------------------------------------------------------------
| HOURLY EXECUTION HISTORY  WITH QueryPerSeconds and I/O Time
-----------------------------------------------------------------------------------------------------------------------------------------------
| QUERY PER SECOND HISTORY
|    #|          snapshot| snapshotID|      calls|                      total dbtime|        QPS|                          I/O time| I/O time %
+-----+------------------+-----------+-----------+----------------------------------+-----------+----------------------------------+-----------
|    1|  04.04.2019 11:00|       4131|       3747|  00:00:00.835(       835.374 ms.)|      1.041|  00:00:00.000(          .000 ms.)|       .000
|    2|  04.04.2019 12:00|       4133|    1002722|  00:01:52.419(    112419.376 ms.)|    278.534|  00:00:00.149(       149.105 ms.)|       .133
|    3|  04.04.2019 13:00|       4135|    2373043|  00:04:26.791(    266791.988 ms.)|    659.179|  00:00:00.064(        64.261 ms.)|       .024
|    4|  04.04.2019 14:00|       4137|    2397326|  00:04:43.033(    283033.854 ms.)|    665.924|  00:00:00.024(        24.505 ms.)|       .009
|    5|  04.04.2019 15:00|       4139|    2394416|  00:04:51.435(    291435.010 ms.)|    665.116|  00:00:12.025(     12025.895 ms.)|      4.126
|    6|  04.04.2019 16:00|       4143|    3525360|  00:10:13.492(    613492.351 ms.)|    979.267|  00:08:41.396(    521396.555 ms.)|     84.988
|    7|  04.04.2019 17:00|       4149|    3529197|  00:11:48.830(    708830.618 ms.)|    980.332|  00:12:47.834(    767834.052 ms.)|    108.324
|    8|  04.04.2019 18:01|       4157|    1145596|  00:01:19.217(     79217.372 ms.)|    313.004|  00:00:01.319(      1319.676 ms.)|      1.666
|    9|  04.04.2019 19:03|       4159|    2890362|  00:03:16.784(    196784.755 ms.)|    776.979|  00:00:01.441(      1441.386 ms.)|       .732
|   10|  04.04.2019 20:04|       4161|    5758631|  00:06:30.513(    390513.926 ms.)|   1573.396|  00:00:01.470(      1470.110 ms.)|       .376
|   11|  04.04.2019 21:03|       4163|    2781536|  00:03:06.470(    186470.979 ms.)|    785.745|  00:00:00.249(       249.865 ms.)|       .134
|   12|  04.04.2019 23:03|       4165|    1443155|  00:01:34.467(     94467.539 ms.)|    200.438|  00:00:00.015(        15.287 ms.)|       .016
|   13|  05.04.2019 01:03|       4167|    4387191|  00:06:51.380(    411380.293 ms.)|    609.332|  00:05:18.847(    318847.407 ms.)|     77.507
|   14|  05.04.2019 02:03|       4171|     189852|  00:00:10.989(     10989.899 ms.)|     52.737|  00:00:00.539(       539.110 ms.)|      4.906
|   15|  05.04.2019 03:01|       4173|       3627|  00:00:00.103(       103.000 ms.)|      1.042|  00:00:00.004(         4.131 ms.)|      4.010
|   16|  05.04.2019 04:00|       4175|       3627|  00:00:00.085(        85.235 ms.)|      1.025|  00:00:00.003(         3.811 ms.)|      4.471
|   17|  05.04.2019 05:00|       4177|       3747|  00:00:00.849(       849.454 ms.)|      1.041|  00:00:00.006(         6.124 ms.)|       .721
|   18|  05.04.2019 06:00|       4179|       3747|  00:00:00.849(       849.561 ms.)|      1.041|  00:00:00.000(          .051 ms.)|       .006
|   19|  05.04.2019 07:00|       4181|       3747|  00:00:00.839(       839.416 ms.)|      1.041|  00:00:00.000(          .062 ms.)|       .007
|   20|  05.04.2019 08:00|       4183|       3747|  00:00:00.846(       846.382 ms.)|      1.041|  00:00:00.000(          .007 ms.)|       .001
|   21|  05.04.2019 09:00|       4185|       3747|  00:00:00.855(       855.426 ms.)|      1.041|  00:00:00.000(          .065 ms.)|       .008
|   22|  05.04.2019 10:00|       4187|       3797|  00:01:40.150(    100150.165 ms.)|      1.055|  00:00:21.845(     21845.217 ms.)|     21.812

Visu SQL atlases teksts

Pretenzija

SELECT 
  queryid , 
  query 
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY queryid , query

Kopsavilkums

Kā redzat, izmantojot diezgan vienkāršus līdzekļus, jūs varat iegūt daudz noderīgas informācijas par datu bāzes darba slodzi un stāvokli.

Piezīme:Ja vaicājumos ierakstīsim vaicājumu ID, mēs iegūsim atsevišķa vaicājuma vēsturi (lai ietaupītu vietu, atsevišķa vaicājuma atskaites tiek izlaistas).

Tātad statistikas dati par vaicājumu veiktspēju ir pieejami un apkopoti.
Ir pabeigts pirmais posms “statistikas datu vākšana”.

Varat pāriet uz otro posmu - “veiktspējas metrikas iestatīšana”.
PostgreSQL vaicājuma veiktspējas uzraudzība. 1.daļa - ziņošana

Bet tas ir pavisam cits stāsts.

Lai varētu turpināt ...

Avots: www.habr.com

Pievieno komentāru