Iwwerwachung PostgreSQL Ufro Leeschtung. Deel 1 - Berichterstattung

Ingenieur - aus Latäin iwwersat - inspiréiert.
En Ingenieur kann alles maachen. (c) R. Diesel.
Epigraphen.
Iwwerwachung PostgreSQL Ufro Leeschtung. Deel 1 - Berichterstattung
Oder eng Geschicht iwwer firwat en Datebankadministrator seng programméiere Vergaangenheet erënnere muss.

Viruerteel

All Nimm goufen geännert. D'Zoufall sinn zoufälleg. D'Material representéiert nëmmen déi perséinlech Meenung vum Auteur.

Verzichterklärung vu Garantien: Déi geplangten Serie vun Artikelen enthält keng detailléiert a korrekt Beschreiwung vun den benotzten Dëscher a Skripte. D'Materialien kënnen net direkt "AS IS" benotzt ginn.
Als éischt, wéinst dem grousse Volumen vum Material,
zweetens, wéinst der enker Relatioun mat der Produktioun Basis vun engem real Client.
Dofir enthalen d'Artikelen nëmmen Iddien a Beschreiwungen an der allgemengster Form.
Vläicht an Zukunft wäert de System op den Niveau wuessen fir op GitHub gepost ze ginn, oder vläicht net. Zäit wäert weisen.

Den Ufank vun der Geschicht - "Erënnert Dir Iech wéi et alles ugefaang huet".
Wat als Resultat geschitt ass, am allgemengsten - "Synthese als eng vun de Methoden fir d'PostgreSQL Leeschtung ze verbesseren»

Firwat brauch ech dat alles?

Gutt, éischtens, fir net ze vergiessen, un déi glorräich Deeg an der Pensioun ze erënneren.
Zweetens, dat wat geschriwwen ass ze systematiséieren. Well heiansdo fänken ech un duercherneen ze ginn a verschidden Deeler ze vergiessen.

Gutt, an dat Wichtegst ass datt et fir een ka praktesch kommen an hinnen hëllefen ze vermeiden d'Rad nei ze erfannen an net eng Rake ze sammelen. An anere Wierder, verbessert Är Karma (net Khabrov's). Well déi wäertvollst Saach op dëser Welt ass Iddien. Den Haapt Saach ass eng Iddi ze fannen. Awer eng Iddi an d'Realitéit ëmzewandelen ass eng reng technesch Fro.

Also, loosst eis ufänken, lues a lues ...

Formuléierung vum Problem.

Verfügbar:

PostgreSQL(10.5) Datebank, gemëschte Laaschttyp (OLTP+DSS), mëttel-liicht Belaaschtung, an der AWS Cloud.
Et gëtt keng Datebank Iwwerwachung; Infrastruktur Iwwerwaachung gëtt a Form vun Standard AWS Tools an enger minimaler Konfiguratioun geliwwert.

Erfuerderlech:

Iwwerwaacht d'Performance an de Status vun der Datebank, fann an hunn initial Informatioun fir schwéier Datebankufroen ze optimiséieren.

Kuerz Aféierung oder Analyse vun Léisung Optiounen

Fir unzefänken, loosst eis probéieren d'Optioune fir de Problem ze léisen aus der Siicht vun enger komparativer Analyse vun de Virdeeler an Nodeeler fir den Ingenieur ze analyséieren, a loosse déi, déi d'Recht op et no der Personalplang hunn, mat de Virdeeler an Verloschter vun Gestioun.

Optioun 1 - "Op Ufro schaffen"

Mir loossen alles sou wéi et ass. Wann de Client net mat eppes an der Funktionalitéit, der Leeschtung vun der Datebank oder der Applikatioun zefridden ass, informéiert hien d'DBA Ingenieuren per E-Mail oder andeems en Tëschefall am Ticket Schacht erstellt.
Den Ingenieur, deen d'Notifikatioun kritt huet, wäert de Problem verstoen, eng Léisung ubidden oder de Problem op de Réckbrenner setzen, an der Hoffnung datt alles sech selwer léist, a souwisou wäert alles séier vergiess ginn.
Gingerbread an Donuts, Plooschteren a KnollenGingerbread an Donuts:
1. Et ass net néideg eppes extra ze maachen.
2. Et gëtt ëmmer d'Méiglechkeet Excusen ze maachen an ze schrauwen.
3. Vill Zäit, datt Dir op Är eegen Diskretioun verbréngen kann.
Plooschteren a Knascht:
1. Fréier oder spéider wäert de Client iwwer d'Essenz vun der Existenz an der universeller Gerechtegkeet an dëser Welt denken a sech nach eng Kéier d'Fro stellen - firwat bezuelen ech hinnen meng Suen? D'Konsequenz ass ëmmer déiselwecht - déi eenzeg Fro ass wéini de Client sech langweilen an Äddi wénkt. An de Feeder wäert eidel sinn. Et ass traureg.
2. Ingenieur Entwécklung - null.
3. Schwieregkeeten an der Planung Aarbecht a Luede

Optioun 2- "Mat Tambourinen danzen, dampen a Schong undoen"

Paragraf 1-Firwat brauche mir en Iwwerwaachungssystem, mir kréien alles mat Ufroen. Mir lafen eng Rëtsch vun all Zorte vu Ufroen op d'Daten Wierderbuch an dynamesch Vue, schalt all Zorte vu counters, alles an Dëscher, a periodesch analyséieren Lëschten an Dëscher. Als Resultat hu mir schéin oder net sou schéin Grafiken, Dëscher, Berichter. Den Haapt Saach ass méi ze hunn, méi.
Paragraf 2-Mir generéieren Aktivitéit a starten d'Analyse vun all deem.
Paragraf 3-Mir preparéieren e bestëmmt Dokument, mir nennen dëst Dokument einfach - "wéi solle mir eng Datebank opbauen."
Paragraf 4-De Client, all dës Glanz vu Grafiken an Zuelen ze gesinn, ass an engem kandlecht, naivt Vertrauen - elo wäert alles fir eis schaffen, geschwënn. An, hien deelt einfach a schmerzlos mat senge finanzielle Ressourcen. D'Gestioun ass och zouversiichtlech datt eis Ingenieuren super schaffen. Maximum lueden.
Paragraf 5- Widderhuelen Schrëtt 1 regelméisseg.
Gingerbread an Donuts, Plooschteren a KnollenGingerbread an Donuts:
1. D'Liewe vu Manager an Ingenieuren ass einfach, prévisibel a voller Aktivitéit. Alles schwëmmt, jiddereen ass beschäftegt.
2. D'Liewen vum Client ass och net schlecht - hien ass ëmmer sécher datt hien just e bësse Gedold muss sinn an alles funktionnéiert. Et gëtt net besser, gutt, d'Welt ass ongerecht, am nächste Liewen wäert Dir Gléck hunn.
Plooschteren a Knascht:
1. Fréier oder spéider gëtt et e méi schnelle Fournisseur vun engem ähnlechen Service, deen datselwecht mécht, awer e bësse méi bëlleg. A wann d'Resultat d'selwecht ass, firwat méi bezuelen. Wat erëm zum Verschwannen vum Feeder féiert.
2. Et ass langweileg. Wéi langweileg all sënnlos Aktivitéit ass.
3. Wéi an der viregter Versioun gëtt et keng Entwécklung. Awer fir en Ingenieur ass den Nodeel datt Dir, am Géigesaz zu der éischter Optioun, dauernd eng IBD generéiere musst. An dat brauch Zäit. Déi Dir kënnt fir de Benefice vun Ärem Léifsten ausginn. Well Dir kënnt net ëm Iech selwer këmmeren, kee gëtt Verdammt iwwer Iech.

Optioun 3 - Dir musst net e Vëlo erfannen, Dir musst et just kafen a fueren.

Et ass net fir näischt, datt Ingenieuren aus anere Firmen Pizza mat Béier iessen (oh, d'Herrlechkeet Deeg vu St. Petersburg an den 90er). Loosst eis Iwwerwaachungssystemer benotzen déi gemaach, debugged a funktionnéieren, an allgemeng profitéieren (gutt, op d'mannst fir hir Creatoren).
Gingerbread an Donuts, Plooschteren a KnollenGingerbread an Donuts:
1. Et ass net néideg Zäit ze verschwenden mat eppes ze kommen, wat schonn erfonnt gouf. Huelt et a benotzt et.
2. Iwwerwaachungssystemer ginn net vun Narren geschriwwen a si sinn natierlech nëtzlech.
3. Aarbecht Iwwerwachung Systemer normalerweis nëtzlech gefiltert Informatiounen.
Plooschteren a Knascht:
1. Den Ingenieur an dësem Fall ass keen Ingenieur, mee just e Benotzer vun engem aneren säi Produkt. Oder e Benotzer.
2. De Client muss iwwerzeegt sinn vun der Noutwennegkeet eppes ze kafen, wat hien am allgemengen net wëll verstoen an net soll, an allgemeng ass de Budget fir d'Joer guttgeheescht a wäert sech net änneren. Da musst Dir eng separat Ressource allocéieren an et fir e spezifesche System konfiguréieren. Déi. éischt musst Dir bezuelen, bezuelen an erëm bezuelen. An de Client ass knaschteg. Dëst ass d'Norm vun dësem Liewen.

Wat ze maachen - Chernyshevsky? Är Fro ass ganz pertinent. (mat)

An dësem besonnesche Fall an der aktueller Situatioun, kënnt Dir et e bëssen anescht maachen - loosst eis eisen eegene Iwwerwaachungssystem maachen.
Iwwerwachung PostgreSQL Ufro Leeschtung. Deel 1 - Berichterstattung
Gutt, net e System, natierlech, am vollen Sënn vum Wuert, dat ass ze haart a viraussiichtlech, awer op d'mannst iergendwéi maachen Är Aufgab méi einfach a sammelen méi Informatioun fir Leeschtungsfäll ze léisen. Fir Iech net an enger Situatioun ze fannen - "goen dohinner, ech weess net wou, fannen eppes, ech weess net wat."

Wat sinn d'Virdeeler an Nodeeler vun dëser Optioun:

Pros:
1. Dëst ass interessant. Gutt, op d'mannst ass et méi interessant wéi déi konstant "Datedatei schrumpfen, Dëschraum änneren, etc."
2. Dëst sinn nei Kompetenzen an nei Entwécklung. Deen desto oder spéider Iech wuelverdéngt Pefferkuchen an Donuts gëtt.
Muecht:
1. Dir musst schaffen. Schwéier schaffen.
2. Dir musst regelméisseg d'Bedeitung an d'Perspektiven vun allen Aktivitéiten erklären.
3. Eppes muss geaffert ginn, well déi eenzeg Ressource, déi en Ingenieur zur Verfügung huet - Zäit - ass vum Universum limitéiert.
4. Dat Schlëmmst an am meeschte désagréabel - d'Resultat ka Bullshit sinn wéi "Net eng Maus, net e Fräsch, awer en onbekannt Déier."

Déi, déi keng Risiken huelen, drénken net Schampes.
Also - de Spaass fänkt un.

Allgemeng Iddi - schematesch

Iwwerwachung PostgreSQL Ufro Leeschtung. Deel 1 - Berichterstattung
(Illustratioun aus dem Artikel geholl «Synthese als eng vun de Methoden fir d'PostgreSQL Leeschtung ze verbesseren»)

Erklärung:

  • D'Standard PostgreSQL Extensioun "pg_stat_statements" ass an der Zildatabase installéiert.
  • An der Iwwerwaachungsdatenbank erstelle mir eng Rei vu Servicetabellen fir d'Geschicht vun pg_stat_statements an der éischter Etapp ze späicheren a fir Metriken opzestellen an an Zukunft ze iwwerwaachen
  • Op der Iwwerwaachungshost kreéiere mir eng Rei vu Bash Scripten, dorënner déi fir Tëschefäll am Ticketsystem ze generéieren.

Service Dëscher

Als éischt, eng schematesch vereinfacht ERD, wat um Enn geschitt ass:
Iwwerwachung PostgreSQL Ufro Leeschtung. Deel 1 - Berichterstattung
Kuerz Beschreiwung vun DëscherEndpunkt - Host, Verbindungspunkt mat der Instanz
Datebank - Datebank Parameteren
pg_stat_history - eng historesch Tabell fir temporär Schnappschëss vun der pg_stat_statements Vue vun der Zildatenbank ze späicheren
metric_glossary - Wierderbuch vun Performance Metriken
metric_config - Konfiguratioun vun eenzelne Metriken
Metrric - eng spezifesch Metrik fir d'Ufro déi iwwerwaacht gëtt
metric_alert_history - Geschicht vun Leeschtung Warnungen
log_query - e Service-Tabelle fir gespäichert Opzeechnunge vun enger PostgreSQL-Logdatei ze späicheren, déi vun AWS erofgelueden ass
Baseline - Parameteren vun den Zäitperioden déi als Basis benotzt ginn
Kontrollpunkt - Konfiguratioun vu Metriken fir de Status vun der Datebank ze kontrolléieren
checkpoint_alert_history - Warnungsgeschicht vun der Datebank Gesondheetscheck Metriken
pg_stat_db_queries - Service Dësch vun aktiv Ufroen
Aktivitéit_log - Aktivitéit Log Service Dësch
trap_oid - Trap Configuratioun Service Dësch

Stage 1 - sammelt statistesch Informatioun iwwer Leeschtung a kritt Berichter

Eng Tabell gëtt benotzt fir statistesch Informatioun ze späicheren pg_stat_history
pg_stat_history Tabellstruktur

                                          Tabell "public.pg_stat_history" Kolonn | Typ | Modifiers------------------------ -+------------------------------------------------ id | ganzer | not null default nextval('pg_stat_history_id_seq'::regclass) snapshot_timestamp | Zäitstempel ouni Zäitzone | database_id | ganzer | dbid | idd | Benotzerid | idd | queryid | grouss | Ufro | Text | rifft | grouss | Gesamtzeit | duebel Präzisioun | min_zeit | duebel Präzisioun | max_zeit | duebel Präzisioun | mean_zeit | duebel Präzisioun | stddev_zeit | duebel Präzisioun | Reihen | grouss | shared_blks_hit | grouss | shared_blks_read | grouss | shared_blks_dirtied | grouss | shared_blks_written | grouss | local_blks_hit | grouss | local_blks_read | grouss | local_blks_dirtied | grouss | local_blks_geschriwwe | grouss | temp_blks_read | grouss | temp_blks_geschriwwe | grouss | blk_read_time | duebel Präzisioun | blk_write_time | duebel Präzisioun | baseline_id | ganzer | Indexen: "pg_stat_history_pkey" PRIMARY KEY, btree (id) "database_idx" btree (database_id) "queryid_idx" btree (queryid) "snapshot_timestamp_idx" btree (snapshot_timestamp) Auslänner-Schlëssel Aschränkungen: "database_id_kEYid" (database_id_f. ) OP LÄSCHEN CASCADE

Wéi Dir kënnt gesinn, ass den Dësch just déi kumulativ Vue Daten pg_stat_statements an der Zil-Datebank.

Dësen Dësch benotzen ass ganz einfach

pg_stat_history wäert akkumuléiert Statistike vun Ufro Ausféierung fir all Stonn representéieren. Um Ufank vun all Stonn, no der Tabell ausfëllen, Statistiken pg_stat_statements zréckgesat mat pg_stat_statements_reset().
Opgepasst: Statistike gi gesammelt fir Ufroe mat Ausféierungsdauer vu méi wéi 1 Sekonn.
Populatioun vun der Tabell pg_stat_history

--pg_stat_history.sql
CREATE OR REPLACE FUNCTION pg_stat_history( ) RETURNS boolean AS $$
DECLARE
  endpoint_rec record ;
  database_rec record ;
  pg_stat_snapshot record ;
  current_snapshot_timestamp timestamp without time zone;
BEGIN
  current_snapshot_timestamp = date_trunc('minute',now());  
  
  FOR endpoint_rec IN SELECT * FROM endpoint 
  LOOP
    FOR database_rec IN SELECT * FROM database WHERE endpoint_id = endpoint_rec.id 
	  LOOP
	    
		RAISE NOTICE 'NEW SHAPSHOT IS CREATING';
		
		--Connect to the target DB	  
	    EXECUTE 'SELECT dblink_connect(''LINK1'',''host='||endpoint_rec.host||' dbname='||database_rec.name||' user=USER password=PASSWORD '')';
 
        RAISE NOTICE 'host % and dbname % ',endpoint_rec.host,database_rec.name;
		RAISE NOTICE 'Creating snapshot of pg_stat_statements for database %',database_rec.name;
		
		SELECT 
	      *
		INTO 
		  pg_stat_snapshot
	    FROM dblink('LINK1',
	      'SELECT 
	       dbid , SUM(calls),SUM(total_time),SUM(rows) ,SUM(shared_blks_hit) ,SUM(shared_blks_read) ,SUM(shared_blks_dirtied) ,SUM(shared_blks_written) , 
           SUM(local_blks_hit) , SUM(local_blks_read) , SUM(local_blks_dirtied) , SUM(local_blks_written) , SUM(temp_blks_read) , SUM(temp_blks_written) , SUM(blk_read_time) , SUM(blk_write_time)
	       FROM pg_stat_statements WHERE dbid=(SELECT oid from pg_database where datname=current_database() ) 
		   GROUP BY dbid
  	      '
	               )
	      AS t
	       ( dbid oid , calls bigint , 
  	         total_time double precision , 
	         rows bigint , shared_blks_hit bigint , shared_blks_read bigint ,shared_blks_dirtied bigint ,shared_blks_written	 bigint ,
             local_blks_hit	 bigint ,local_blks_read bigint , local_blks_dirtied bigint ,local_blks_written bigint ,
             temp_blks_read	 bigint ,temp_blks_written bigint ,
             blk_read_time double precision , blk_write_time double precision	  
	       );
		 
		INSERT INTO pg_stat_history
          ( 
		    snapshot_timestamp  ,database_id  ,
			dbid , calls  ,total_time ,
            rows ,shared_blks_hit  ,shared_blks_read  ,shared_blks_dirtied  ,shared_blks_written ,local_blks_hit , 	 	
            local_blks_read,local_blks_dirtied,local_blks_written,temp_blks_read,temp_blks_written, 	
            blk_read_time, blk_write_time 
		  )		  
	    VALUES
	      (
	       current_snapshot_timestamp ,
		   database_rec.id ,
	       pg_stat_snapshot.dbid ,pg_stat_snapshot.calls,
	       pg_stat_snapshot.total_time,
	       pg_stat_snapshot.rows ,pg_stat_snapshot.shared_blks_hit ,pg_stat_snapshot.shared_blks_read ,pg_stat_snapshot.shared_blks_dirtied ,pg_stat_snapshot.shared_blks_written , 
           pg_stat_snapshot.local_blks_hit , pg_stat_snapshot.local_blks_read , pg_stat_snapshot.local_blks_dirtied , pg_stat_snapshot.local_blks_written , 
	       pg_stat_snapshot.temp_blks_read , pg_stat_snapshot.temp_blks_written , pg_stat_snapshot.blk_read_time , pg_stat_snapshot.blk_write_time 	   
	      );		   
		  
        RAISE NOTICE 'Creating snapshot of pg_stat_statements for queries with min_time more than 1000ms';
	
        FOR pg_stat_snapshot IN
          --All queries with max_time greater than 1000 ms
	      SELECT 
	        *
	      FROM dblink('LINK1',
	        'SELECT 
	         dbid , userid ,queryid,query,calls,total_time,min_time ,max_time,mean_time, stddev_time ,rows ,shared_blks_hit ,
			 shared_blks_read ,shared_blks_dirtied ,shared_blks_written , 
             local_blks_hit , local_blks_read , local_blks_dirtied , 
			 local_blks_written , temp_blks_read , temp_blks_written , blk_read_time , 
			 blk_write_time
	         FROM pg_stat_statements 
			 WHERE dbid=(SELECT oid from pg_database where datname=current_database() AND min_time >= 1000 ) 
  	        '

	                  )
	        AS t
	         ( dbid oid , userid oid , queryid bigint ,query text , calls bigint , 
  	           total_time double precision ,min_time double precision	 ,max_time double precision	 , mean_time double precision	 ,  stddev_time double precision	 , 
	           rows bigint , shared_blks_hit bigint , shared_blks_read bigint ,shared_blks_dirtied bigint ,shared_blks_written	 bigint ,
               local_blks_hit	 bigint ,local_blks_read bigint , local_blks_dirtied bigint ,local_blks_written bigint ,
               temp_blks_read	 bigint ,temp_blks_written bigint ,
               blk_read_time double precision , blk_write_time double precision	  
	         )
	    LOOP
		  INSERT INTO pg_stat_history
          ( 
		    snapshot_timestamp  ,database_id  ,
			dbid ,userid  , queryid  , query  , calls  ,total_time ,min_time ,max_time ,mean_time ,stddev_time ,
            rows ,shared_blks_hit  ,shared_blks_read  ,shared_blks_dirtied  ,shared_blks_written ,local_blks_hit , 	 	
            local_blks_read,local_blks_dirtied,local_blks_written,temp_blks_read,temp_blks_written, 	
            blk_read_time, blk_write_time 
		  )		  
	      VALUES
	      (
	       current_snapshot_timestamp ,
		   database_rec.id ,
	       pg_stat_snapshot.dbid ,pg_stat_snapshot.userid ,pg_stat_snapshot.queryid,pg_stat_snapshot.query,pg_stat_snapshot.calls,
	       pg_stat_snapshot.total_time,pg_stat_snapshot.min_time ,pg_stat_snapshot.max_time,pg_stat_snapshot.mean_time, pg_stat_snapshot.stddev_time ,
	       pg_stat_snapshot.rows ,pg_stat_snapshot.shared_blks_hit ,pg_stat_snapshot.shared_blks_read ,pg_stat_snapshot.shared_blks_dirtied ,pg_stat_snapshot.shared_blks_written , 
           pg_stat_snapshot.local_blks_hit , pg_stat_snapshot.local_blks_read , pg_stat_snapshot.local_blks_dirtied , pg_stat_snapshot.local_blks_written , 
	       pg_stat_snapshot.temp_blks_read , pg_stat_snapshot.temp_blks_written , pg_stat_snapshot.blk_read_time , pg_stat_snapshot.blk_write_time 	   
	      );
		  
        END LOOP;

        PERFORM dblink_disconnect('LINK1');  
				
	  END LOOP ;--FOR database_rec IN SELECT * FROM database WHERE endpoint_id = endpoint_rec.id 
    
  END LOOP;

RETURN TRUE;  
END
$$ LANGUAGE plpgsql;

Als Resultat, no puer Zäit an der Tabell pg_stat_history mir wäerten eng Rei vu Schnappschëss vum Dëschinhalt hunn pg_stat_statements Zil Datebank.

Eigentlech Berichterstattung

Mat einfachen Ufroen kënnt Dir ganz nëtzlech an interessant Berichter kréien.

Aggregéiert Daten fir eng bestëmmten Zäitperiod

Ufro

SELECT 
  database_id , 
  SUM(calls) AS calls ,SUM(total_time)  AS total_time ,
  SUM(rows) AS rows , SUM(shared_blks_hit)  AS shared_blks_hit,
  SUM(shared_blks_read) AS shared_blks_read ,
  SUM(shared_blks_dirtied) AS shared_blks_dirtied,
  SUM(shared_blks_written) AS shared_blks_written , 
  SUM(local_blks_hit) AS local_blks_hit , 
  SUM(local_blks_read) AS local_blks_read , 
  SUM(local_blks_dirtied) AS local_blks_dirtied , 
  SUM(local_blks_written)  AS local_blks_written,
  SUM(temp_blks_read) AS temp_blks_read, 
  SUM(temp_blks_written) temp_blks_written , 
  SUM(blk_read_time) AS blk_read_time , 
  SUM(blk_write_time) AS blk_write_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NULL AND
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY database_id ;

DB Zeit

to_char(Intervall '1 millisecond' * pg_total_stat_history_rec.total_time, 'HH24:MI:SS.MS')

I/O Zäit

to_char(Intervall '1 Millisecond' * ( pg_total_stat_history_rec.blk_read_time + pg_total_stat_history_rec.blk_write_time ), 'HH24:MI:SS.MS')

TOP10 SQL duerch total_time

Ufro

SELECT 
  queryid , 
  SUM(calls) AS calls ,
  SUM(total_time)  AS total_time  	
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT 
GROUP BY queryid 
ORDER BY 3 DESC 
LIMIT 10
-------------------------------------------------- ----------------------------------- | TOP10 SQL VUN TOTAL EXECUTION TIME | #| queryid| rifft| rifft Réng Gesamtzeit (ms) | dbtime % +---------------------------+ ------ --------------------------+----------- | 1| 821760255| 2| .00001|00:03:23.141( 203141.681 ms.)| 5.42 | 2| 4152624390| 2| .00001|00:03:13.929( 193929.215 ms.)| 5.17 | 3| 1484454471| 4| an .00001|00:02:09.129( 129129.057 ms.)| 3.44 | 4| an 655729273| 1| .00000|00:02:01.869( 121869.981 ms.)| 3.25 | 5| vun 2460318461| 1| .00000|00:01:33.113( 93113.835 ms.)| 2.48 | 6| vun 2194493487| 4| an .00001|00:00:17.377( 17377.868 ms.)| .46 | 7| vun 1053044345| 1| .00000|00:00:06.156( 6156.352 ms.)| .16 | 8| vun 3644780286| 1| .00000|00:00:01.063( 1063.830 ms.)| .03

TOP10 SQL duerch total I/O Zäit

Ufro

SELECT 
  queryid , 
  SUM(calls) AS calls ,
  SUM(blk_read_time + blk_write_time)  AS io_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY  queryid 
ORDER BY 3 DESC 
LIMIT 10
-------------------------------------------------- --------------------------------------- | TOP10 SQL VUM TOTAL ech / O TIME | #| queryid| rifft| rifft Réng I/O-Zeit (ms)|db I/O-Zeit % +----+------------+-----------+------ ----------+--------------------------------+---- ------ -- | 1| 4152624390| 2| .00001|00:08:31.616( 511616.592 ms.)| 31.06 | 2| 821760255| 2| .00001|00:08:27.099( 507099.036 ms.)| 30.78 | 3| 655729273| 1| .00000|00:05:02.209( 302209.137 ms.)| 18.35 Uhr | 4| an 2460318461| 1| .00000|00:04:05.981( 245981.117 ms.)| 14.93 | 5| vun 1484454471| 4| an .00001|00:00:39.144( 39144.221 ms.)| 2.38 | 6| vun 2194493487| 4| an .00001|00:00:18.182( 18182.816 ms.)| 1.10 | 7| vun 1053044345| 1| .00000|00:00:16.611( 16611.722 ms.)| 1.01 | 8| vun 3644780286| 1| .00000|00:00:00.436( 436.205 ms.)| .03

TOP10 SQL duerch maximal Zäit vun Ausféierung

Ufro

SELECT 
  id AS snapshotid , 
  queryid , 
  snapshot_timestamp ,  
  max_time 
FROM 
  pg_stat_history 
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
ORDER BY 4 DESC 
LIMIT 10

-------------------------------------------------- ----------------------------------------------- | TOP10 SQL BY MAX EXECUTION TIME | #| Snapshot| snapshotID| queryid| max_time (ms) +----+-------------------- --+----------------------------------------------------- | 1| 05.04.2019 01:03| 4169| 655729273| 00:02:01.869( 121869.981 ms.) | 2| 04.04.2019 17:00 Uhr| 4153| 821760255| 00:01:41.570( 101570.841 ms.) | 3| 04.04.2019 16:00 Uhr| 4146| 821760255| 00:01:41.570( 101570.841 ms.) | 4| an 04.04.2019 16:00 Uhr| 4144| 4152624390| 00:01:36.964(96964.607 ms.) | 5| vun 04.04.2019 17:00 Uhr| 4151| 4152624390| 00:01:36.964(96964.607 ms.) | 6| vun 05.04.2019 10:00 Uhr| 4188| 1484454471| 00:01:33.452( 93452.150 ms.) | 7| vun 04.04.2019 17:00 Uhr| 4150| 2460318461| 00:01:33.113(93113.835 ms.) | 8| vun 04.04.2019 15:00 Uhr| 4140| 1484454471| 00:00:11.892( 11892.302 ms.) | 9| vun 04.04.2019 16:00 Uhr| 4145| 1484454471| 00:00:11.892( 11892.302 ms.) | 10| an 04.04.2019 17:00 Uhr| 4152| 1484454471| 00:00:11.892 (11892.302 ms.)

TOP10 SQL vum SHARED Puffer liesen / schreiwen

Ufro

SELECT 
  id AS snapshotid , 
  queryid ,
  snapshot_timestamp , 
  shared_blks_read , 
  shared_blks_written 
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND
  ( shared_blks_read > 0 OR shared_blks_written > 0 )
ORDER BY 4 DESC  , 5 DESC 
LIMIT 10
-------------------------------------------------- ------------------------------------------ | TOP10 SQL VUM gedeelt Buffer VIRLIESEN / OPSCHREIWEN | #| Snapshot| snapshotID| queryid| gedeelt Blocks liesen| gedeelt Blöcke schreiwen +----+----------------------- ------------------------------------------------------- 1| 04.04.2019 17:00 Uhr| 4153| 821760255| 797308| 0 | 2| 04.04.2019 16:00 Uhr| 4146| 821760255| 797308| 0 | 3| 05.04.2019 01:03| 4169| 655729273| 797158| 0 | 4| an 04.04.2019 16:00 Uhr| 4144| 4152624390| 756514| 0 | 5| vun 04.04.2019 17:00 Uhr| 4151| 4152624390| 756514| 0 | 6| vun 04.04.2019 17:00 Uhr| 4150| 2460318461| 734117| 0 | 7| vun 04.04.2019 17:00 Uhr| 4155| 3644780286| 52973| 0 | 8| vun 05.04.2019 01:03| 4168| 1053044345| 52818| 0 | 9| vun 04.04.2019 15:00 Uhr| 4141| 2194493487| 52813| 0 | 10| an 04.04.2019 16:00 Uhr| 4147| 2194493487| 52813| 0 -------------------------------------------------- ------------------------------------------

Histogram vun Ufro Verdeelung duerch maximal Ausféierung Zäit

Demanden

SELECT  
  MIN(max_time) AS hist_min  , 
  MAX(max_time) AS hist_max , 
  (( MAX(max_time) - MIN(min_time) ) / hist_columns ) as hist_width
FROM 
  pg_stat_history 
WHERE 
  queryid IS NOT NULL AND
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT ;

SELECT 
  SUM(calls) AS calls
FROM 
  pg_stat_history 
WHERE 
  queryid IS NOT NULL AND
  database_id =DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND 
  ( max_time >= hist_current_min AND  max_time < hist_current_max ) ;
|-------------------------------------------------------- -------------------------------------------- | MAX_TIME HISTOGRAM | TOTAL Uriff: 33851920 | MIN ZEIT: 00:00:01.063 | MAX ZEIT: 00:02:01.869 ------------------------------------------ ----------------------------------------------- | min Dauer| maximal Dauer| rifft +----------------------- ----------------------+----------- | 00:00:01.063( 1063.830 ms.) | 00:00:13.144( 13144.445 ms.) | 9 | 00:00:13.144( 13144.445 ms.) | 00:00:25.225( 25225.060 ms.) | 0 | 00:00:25.225( 25225.060 ms.) | 00:00:37.305( 37305.675 ms.) | 0 | 00:00:37.305( 37305.675 ms.) | 00:00:49.386( 49386.290 ms.) | 0 | 00:00:49.386( 49386.290 ms.) | 00:01:01.466( 61466.906 ms.) | 0 | 00:01:01.466( 61466.906 ms.) | 00:01:13.547( 73547.521 ms.) | 0 | 00:01:13.547( 73547.521 ms.) | 00:01:25.628( 85628.136 ms.) | 0 | 00:01:25.628( 85628.136 ms.) | 00:01:37.708( 97708.751 ms.) | 4 | 00:01:37.708( 97708.751 ms.) | 00:01:49.789( 109789.366 ms.) | 2 | 00:01:49.789( 109789.366 ms.) | 00:02:01.869( 121869.981 ms.) | 0

TOP10 Snapshots duerch Query pro Sekonn

Demanden

--pg_qps.sql
--Calculate Query Per Second 
CREATE OR REPLACE FUNCTION pg_qps( pg_stat_history_id integer ) RETURNS double precision AS $$
DECLARE
 pg_stat_history_rec record ;
 prev_pg_stat_history_id integer ;
 prev_pg_stat_history_rec record;
 total_seconds double precision ;
 result double precision;
BEGIN 
  result = 0 ;
  
  SELECT *
  INTO pg_stat_history_rec
  FROM 
    pg_stat_history
  WHERE id = pg_stat_history_id ;

  IF pg_stat_history_rec.snapshot_timestamp IS NULL 
  THEN
    RAISE EXCEPTION 'ERROR - Not found pg_stat_history for id = %',pg_stat_history_id;
  END IF ;  
  
 --RAISE NOTICE 'pg_stat_history_id = % , snapshot_timestamp = %', pg_stat_history_id , 
 pg_stat_history_rec.snapshot_timestamp ;
  
  SELECT 
    MAX(id)   
  INTO
    prev_pg_stat_history_id
  FROM
    pg_stat_history
  WHERE 
    database_id = pg_stat_history_rec.database_id AND
	queryid IS NULL AND
	id < pg_stat_history_rec.id ;

  IF prev_pg_stat_history_id IS NULL 
  THEN
    RAISE NOTICE 'Not found previous pg_stat_history shapshot for id = %',pg_stat_history_id;
	RETURN NULL ;
  END IF;
  
  SELECT *
  INTO prev_pg_stat_history_rec
  FROM 
    pg_stat_history
  WHERE id = prev_pg_stat_history_id ;
  
  --RAISE NOTICE 'prev_pg_stat_history_id = % , prev_snapshot_timestamp = %', prev_pg_stat_history_id , prev_pg_stat_history_rec.snapshot_timestamp ;    

  total_seconds = extract(epoch from ( pg_stat_history_rec.snapshot_timestamp - prev_pg_stat_history_rec.snapshot_timestamp ));
  
  --RAISE NOTICE 'total_seconds = % ', total_seconds ;    
  
  --RAISE NOTICE 'calls = % ', pg_stat_history_rec.calls ;      
  
  IF total_seconds > 0 
  THEN
    result = pg_stat_history_rec.calls / total_seconds ;
  ELSE
   result = 0 ; 
  END IF;
   
 RETURN result ;
END
$$ LANGUAGE plpgsql;


SELECT 
  id , 
  snapshot_timestamp ,
  calls , 	
  total_time , 
  ( select pg_qps( id )) AS QPS ,
  blk_read_time ,
  blk_write_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND
  ( select pg_qps( id )) IS NOT NULL 
ORDER BY 5 DESC 
LIMIT 10
|-------------------------------------------------------- -------------------------------------------- | TOP10 Snapshots bestallt no QueryPerSeconds Zuelen -------------------------------------------- -------------------------------------------------- -------------------------------------------------- | #| Snapshot| snapshotID| rifft| Gesamtzeit | QPS| I/O Zäit| I/O Zäit % +-----+----------------------- ----+----------------------------------+---- -+------------------------+---------------- | 1| 04.04.2019/20/04 4161:5758631| 00| 06| 30.513:390513.926:1573.396( 00 ms.)| 00| 01.470:1470.110:376( 2 ms.)| .04.04.2019 | 17| 00 4149:3529197 Uhr| 00| 11| 48.830:708830.618:980.332( 00 ms.)| 12| 47.834:767834.052:108.324( 3 ms.)| 04.04.2019 | 16| 00 4143:3525360 Uhr| 00| 10| 13.492:613492.351:979.267( 00 ms.)| 08| 41.396:521396.555:84.988(4 ms.)| 04.04.2019 | 21| an 03/4163/2781536 00:03| 06.470| 186470.979| 785.745:00:00( 00.249 ms.)| 249.865| 134:5:04.04.2019(19 ms.)| .03 | 4159| vun 2890362 00:03| 16.784| 196784.755| 776.979:00:00( 01.441 ms.)| 1441.386| 732:6:04.04.2019( 14 ms.)| .00 | 4137| vun 2397326 00:04 Uhr| 43.033| 283033.854| 665.924:00:00( 00.024 ms.)| 24.505| 009:7:04.04.2019(15 ms.)| .00 | 4139| vun 2394416 00:04 Uhr| 51.435| 291435.010| 665.116:00:00( 12.025 ms.)| 12025.895| 4.126:8:04.04.2019( 13 ms.)| 00 | 4135| vun 2373043 00:04 Uhr| 26.791| 266791.988| 659.179:00:00( 00.064 ms.)| 64.261| 024:9:05.04.2019( 01 ms.)| .03 | 4167| vun 4387191 00:06| 51.380| 411380.293| 609.332:00:05( 18.847 ms.)| 318847.407| 77.507:10:04.04.2019( 18 ms.)| 01 | 4157| an 1145596/00/01 19.217:79217.372| 313.004| 00| 00:01.319:1319.676( 1.666 ms.)| XNUMX| XNUMX:XNUMX:XNUMX( XNUMX ms.)| XNUMX

Stonn Ausféierung Geschicht mat QueryPerSeconds an I / O Zäit

Ufro

SELECT 
  id , 
  snapshot_timestamp ,
  calls , 	
  total_time , 
  ( select pg_qps( id )) AS QPS ,
  blk_read_time ,
  blk_write_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
ORDER BY 2
|-----------------------------------------------------------------------------------------------
| HOURLY EXECUTION HISTORY  WITH QueryPerSeconds and I/O Time
-----------------------------------------------------------------------------------------------------------------------------------------------
| QUERY PER SECOND HISTORY
|    #|          snapshot| snapshotID|      calls|                      total dbtime|        QPS|                          I/O time| I/O time %
+-----+------------------+-----------+-----------+----------------------------------+-----------+----------------------------------+-----------
|    1|  04.04.2019 11:00|       4131|       3747|  00:00:00.835(       835.374 ms.)|      1.041|  00:00:00.000(          .000 ms.)|       .000
|    2|  04.04.2019 12:00|       4133|    1002722|  00:01:52.419(    112419.376 ms.)|    278.534|  00:00:00.149(       149.105 ms.)|       .133
|    3|  04.04.2019 13:00|       4135|    2373043|  00:04:26.791(    266791.988 ms.)|    659.179|  00:00:00.064(        64.261 ms.)|       .024
|    4|  04.04.2019 14:00|       4137|    2397326|  00:04:43.033(    283033.854 ms.)|    665.924|  00:00:00.024(        24.505 ms.)|       .009
|    5|  04.04.2019 15:00|       4139|    2394416|  00:04:51.435(    291435.010 ms.)|    665.116|  00:00:12.025(     12025.895 ms.)|      4.126
|    6|  04.04.2019 16:00|       4143|    3525360|  00:10:13.492(    613492.351 ms.)|    979.267|  00:08:41.396(    521396.555 ms.)|     84.988
|    7|  04.04.2019 17:00|       4149|    3529197|  00:11:48.830(    708830.618 ms.)|    980.332|  00:12:47.834(    767834.052 ms.)|    108.324
|    8|  04.04.2019 18:01|       4157|    1145596|  00:01:19.217(     79217.372 ms.)|    313.004|  00:00:01.319(      1319.676 ms.)|      1.666
|    9|  04.04.2019 19:03|       4159|    2890362|  00:03:16.784(    196784.755 ms.)|    776.979|  00:00:01.441(      1441.386 ms.)|       .732
|   10|  04.04.2019 20:04|       4161|    5758631|  00:06:30.513(    390513.926 ms.)|   1573.396|  00:00:01.470(      1470.110 ms.)|       .376
|   11|  04.04.2019 21:03|       4163|    2781536|  00:03:06.470(    186470.979 ms.)|    785.745|  00:00:00.249(       249.865 ms.)|       .134
|   12|  04.04.2019 23:03|       4165|    1443155|  00:01:34.467(     94467.539 ms.)|    200.438|  00:00:00.015(        15.287 ms.)|       .016
|   13|  05.04.2019 01:03|       4167|    4387191|  00:06:51.380(    411380.293 ms.)|    609.332|  00:05:18.847(    318847.407 ms.)|     77.507
|   14|  05.04.2019 02:03|       4171|     189852|  00:00:10.989(     10989.899 ms.)|     52.737|  00:00:00.539(       539.110 ms.)|      4.906
|   15|  05.04.2019 03:01|       4173|       3627|  00:00:00.103(       103.000 ms.)|      1.042|  00:00:00.004(         4.131 ms.)|      4.010
|   16|  05.04.2019 04:00|       4175|       3627|  00:00:00.085(        85.235 ms.)|      1.025|  00:00:00.003(         3.811 ms.)|      4.471
|   17|  05.04.2019 05:00|       4177|       3747|  00:00:00.849(       849.454 ms.)|      1.041|  00:00:00.006(         6.124 ms.)|       .721
|   18|  05.04.2019 06:00|       4179|       3747|  00:00:00.849(       849.561 ms.)|      1.041|  00:00:00.000(          .051 ms.)|       .006
|   19|  05.04.2019 07:00|       4181|       3747|  00:00:00.839(       839.416 ms.)|      1.041|  00:00:00.000(          .062 ms.)|       .007
|   20|  05.04.2019 08:00|       4183|       3747|  00:00:00.846(       846.382 ms.)|      1.041|  00:00:00.000(          .007 ms.)|       .001
|   21|  05.04.2019 09:00|       4185|       3747|  00:00:00.855(       855.426 ms.)|      1.041|  00:00:00.000(          .065 ms.)|       .008
|   22|  05.04.2019 10:00|       4187|       3797|  00:01:40.150(    100150.165 ms.)|      1.055|  00:00:21.845(     21845.217 ms.)|     21.812

Text vun all SQL-auswielen

Ufro

SELECT 
  queryid , 
  query 
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY queryid , query

D 'Resultat

Wéi Dir kënnt gesinn, mat zimlech einfache Mëttelen, kënnt Dir vill nëtzlech Informatioun iwwer d'Aarbechtslaascht an den Zoustand vun der Datebank kréien.

Notiz:Wa mir d'Queryid an Ufroen ophuelen, kréie mir d'Geschicht fir eng separat Ufro (fir Plaz ze spueren, Berichter fir eng separat Ufro ginn ausgelooss).

Also, statistesch Donnéeën iwwer Ufro Leeschtung sinn verfügbar a gesammelt.
Déi éischt Stuf "Sammlung vun statisteschen Donnéeën" ass ofgeschloss.

Dir kënnt op déi zweet Stuf weidergoen - "Performance Metriken opstellen".
Iwwerwachung PostgreSQL Ufro Leeschtung. Deel 1 - Berichterstattung

Awer dat ass eng ganz aner Geschicht.

Fir weidergitt ...

Source: will.com

Setzt e Commentaire