Prestandaövervakning av PostgreSQL-frågor. Del 1 - rapportering

Ingenjör - översatt från latin - inspirerad.
En ingenjör kan göra vad som helst. (c) R. Diesel.
Epigrafier.
Prestandaövervakning av PostgreSQL-frågor. Del 1 - rapportering
Eller en berättelse om varför en databasadministratör behöver komma ihåg sitt programmeringsförflutna.

Förord

Alla namn har ändrats. Tillfälligheterna är slumpmässiga. Materialet representerar endast författarens personliga åsikt.

Friskrivning från garantier: Den planerade artikelserien kommer inte att innehålla en detaljerad och korrekt beskrivning av de tabeller och manus som används. Materialen kan inte användas omedelbart "I BEFINTLIGT SKICK".
För det första, på grund av den stora mängden material,
för det andra på grund av den nära relationen till en verklig kunds produktionsbas.
Därför kommer artiklarna endast att innehålla idéer och beskrivningar i den mest allmänna formen.
Kanske kommer systemet i framtiden att växa till nivån att postas på GitHub, eller kanske inte. Tiden kommer att visa.

Berättelsens början - "Kommer du ihåg hur allt började".
Vad som hände som ett resultat, i de mest allmänna termerna - "Syntes som en av metoderna för att förbättra PostgreSQL-prestanda»

Varför behöver jag allt detta?

Tja, för det första, för att inte glömma, att minnas de härliga dagarna i pension.
För det andra att systematisera det som skrevs. För ibland börjar jag bli förvirrad och glömma vissa delar.

Tja, och det viktigaste är att det kan komma väl till pass för någon och hjälpa dem att undvika att uppfinna hjulet på nytt och inte samla en rake. Med andra ord, förbättra din karma (inte Khabrovs). För det mest värdefulla i denna värld är idéer. Huvudsaken är att hitta en idé. Men att förvandla en idé till verklighet är en rent teknisk fråga.

Så låt oss börja så smått...

Formulering av problemet.

Tillgängligt:

PostgreSQL(10.5)-databas, blandad belastningstyp (OLTP+DSS), medellätt belastning, belägen i AWS-molnet.
Det finns ingen databasövervakning, infrastrukturövervakning tillhandahålls i form av vanliga AWS-verktyg i en minimal konfiguration.

Det krävs:

Övervaka prestanda och status för databasen, hitta och ha initial information för att optimera tunga databasfrågor.

Kort introduktion eller analys av lösningsalternativ

Låt oss till att börja med försöka analysera alternativen för att lösa problemet utifrån en jämförande analys av fördelar och nackdelar för ingenjören och låta de som har rätt till det enligt bemanningsschemat ta itu med fördelarna och förluster av ledning.

Alternativ 1 - "Arbeta på begäran"

Vi lämnar allt som det är. Om kunden inte är nöjd med något i databasens eller applikationens funktionalitet, prestanda kommer han att meddela DBA-ingenjörerna via e-post eller genom att skapa en incident i biljettfacket.
Ingenjören, efter att ha fått meddelandet, kommer att förstå problemet, erbjuda en lösning eller lägga problemet på baksidan, i hopp om att allt kommer att lösa sig, och hur som helst kommer allt snart att glömmas.
Pepparkakor och munkar, blåmärken och stötarPepparkakor och munkar:
1. Det finns ingen anledning att göra något extra.
2. Det finns alltid möjlighet att komma med ursäkter och skruva på.
3. Mycket tid som du kan spendera efter eget gottfinnande.
Blåmärken och stötar:
1. Förr eller senare kommer kunden att tänka på essensen av existens och universell rättvisa i denna värld och återigen ställa sig frågan - varför betalar jag dem mina pengar? Konsekvensen är alltid densamma – frågan är bara när kunden kommer att bli uttråkad och vinka hejdå. Och mataren kommer att vara tom. Det är sorgligt.
2. Ingenjörsutveckling - noll.
3. Svårigheter att planera arbete och lastning

Alternativ 2 - "Dansa med tamburiner, ånga och ta på dig skor"

Paragraf 1-Varför behöver vi ett övervakningssystem, vi tar emot allt med förfrågningar. Vi kör en massa alla möjliga frågor till dataordboken och dynamiska vyer, sätter på alla möjliga räknare, lägger allt i tabeller och analyserar med jämna mellanrum listor och tabeller. Som ett resultat har vi vackra eller inte så vackra grafer, tabeller, rapporter. Huvudsaken är att ha mer, mer.
Paragraf 2-Vi genererar aktivitet och lanserar analysen av allt detta.
Paragraf 3-Vi förbereder ett visst dokument, vi kallar det här dokumentet helt enkelt - "hur ska vi sätta upp en databas."
Paragraf 4-Kunden, som ser all denna prakt av grafer och siffror, är i ett barnsligt, naivt förtroende - nu kommer allt att fungera för oss, snart. Och han skiljer sig lätt och smärtfritt från sina ekonomiska resurser. Ledningen är också övertygad om att våra ingenjörer fungerar utmärkt. Laddar max.
Paragraf 5- Upprepa steg 1 regelbundet.
Pepparkakor och munkar, blåmärken och stötarPepparkakor och munkar:
1. Chefers och ingenjörers liv är enkelt, förutsägbart och fyllt av aktivitet. Allt surrar, alla är upptagna.
2. Kundens liv är inte heller dåligt - han är alltid säker på att han bara behöver ha lite tålamod och allt kommer att ordna sig. Det blir inte bättre, ja, världen är orättvis, i nästa liv kommer du att ha tur.
Blåmärken och stötar:
1. Förr eller senare kommer det att finnas en snabbare leverantör av en liknande tjänst som kommer att göra samma sak, men lite billigare. Och om resultatet är detsamma, varför betala mer. Vilket återigen kommer att leda till att mataren försvinner.
2. Det är tråkigt. Hur tråkig någon meningslös aktivitet är.
3. Som i den tidigare versionen finns det ingen utveckling. Men för en ingenjör är nackdelen att du, till skillnad från det första alternativet, hela tiden måste generera en IBD. Och detta tar tid. Som du kan spendera till förmån för din älskade. Eftersom du inte kan ta hand om dig själv, bryr ingen sig om dig.

Alternativ 3 - Du behöver inte uppfinna en cykel, du behöver bara köpa den och cykla på den.

Det är inte för inte som ingenjörer från andra företag äter pizza med öl (åh, S:t Petersburgs glansdagar på 90-talet). Låt oss använda övervakningssystem som är gjorda, felsökta och fungerar, och generellt sett gynnas (nåja, åtminstone för deras skapare).
Pepparkakor och munkar, blåmärken och stötarPepparkakor och munkar:
1. Det finns ingen anledning att slösa tid på att komma på något som redan har uppfunnits. Ta den och använd den.
2. Övervakningssystem är inte skrivna av dårar och de är naturligtvis användbara.
3. Fungerande övervakningssystem tillhandahåller vanligtvis användbar filtrerad information.
Blåmärken och stötar:
1. Ingenjören i det här fallet är inte en ingenjör, utan bara en användare av någon annans produkt. Eller en användare.
2. Kunden måste vara övertygad om behovet av att köpa något som han generellt sett inte vill förstå, och inte borde, och i allmänhet har budgeten för året godkänts och kommer inte att ändras. Sedan måste du allokera en separat resurs och konfigurera den för ett specifikt system. De där. först måste du betala, betala och betala igen. Och kunden är snål. Detta är normen i det här livet.

Vad ska man göra - Chernyshevsky? Din fråga är mycket relevant. (Med)

I det här specifika fallet och den nuvarande situationen kan du göra det lite annorlunda - låt oss göra vårt eget övervakningssystem.
Prestandaövervakning av PostgreSQL-frågor. Del 1 - rapportering
Tja, inte ett system, naturligtvis, i ordets fulla bemärkelse, som är för högljutt och förmätet, men åtminstone på något sätt göra din uppgift lättare och samla in mer information för att lösa prestationsincidenter. För att inte hamna i en situation - "gå dit, jag vet inte var, hitta något, jag vet inte vad."

Vilka är fördelarna och nackdelarna med detta alternativ:

Fördelar:
1. Det här är intressant. Tja, det är åtminstone mer intressant än den konstanta "krympa datafil, ändra tabellutrymme, etc."
2. Detta är nya färdigheter och ny utveckling. Som förr eller senare kommer att ge dig välförtjänta pepparkakor och munkar.
Nackdelar:
1. Du måste arbeta. Jobba hårt.
2. Du måste regelbundet förklara innebörden och utsikterna för alla aktiviteter.
3. Något kommer att behöva offras, eftersom den enda resursen som finns tillgänglig för en ingenjör - tiden - är begränsad av universum.
4. Det värsta och mest obehagliga - Resultatet kan bli skitsnack som "Inte en mus, inte en groda, utan ett okänt djur."

De som inte tar risker dricker inte champagne.
Så – det roliga börjar.

Allmän idé - schematiskt

Prestandaövervakning av PostgreSQL-frågor. Del 1 - rapportering
(Illustration tagen från artikeln «Syntes som en av metoderna för att förbättra PostgreSQL-prestanda»)

förklaring:

  • StandardpostgreSQL-tillägget "pg_stat_statements" är installerat i måldatabasen.
  • I övervakningsdatabasen skapar vi en uppsättning servicetabeller för att lagra pg_stat_statements-historiken i det inledande skedet och för att ställa in mätvärden och övervakning i framtiden
  • På övervakningsvärden skapar vi en uppsättning bash-skript, inklusive de för att generera incidenter i biljettsystemet.

Servicebord

Först, en schematisk förenklad ERD, vad som hände till slut:
Prestandaövervakning av PostgreSQL-frågor. Del 1 - rapportering
Kort beskrivning av tabellerslutpunkt — värd, anslutningspunkt till instansen
databas - databasparametrar
pg_stat_history - en historisk tabell för lagring av tillfälliga ögonblicksbilder av vyn pg_stat_statements i måldatabasen
metrisk_ordlista - ordbok över prestationsmått
metric_config — Konfiguration av individuella mätvärden
metriska — ett specifikt mått för begäran som övervakas
metric_alert_history - historik över prestandavarningar
log_query — en servicetabell för lagring av analyserade poster från en PostgreSQL-loggfil nedladdad från AWS
baslinje — Parametrar för de tidsperioder som används som bas
checkpoint — Konfiguration av mått för kontroll av databasens status
checkpoint_alert_history — varningshistorik för mätvärden för databashälsokontroll
pg_stat_db_queries — Servicetabell över aktiva förfrågningar
Aktivitets logg — aktivitetsloggtjänsttabell
trap_oid — Servicetabell för trapkonfiguration

Steg 1 - samla in statistisk information om prestanda och ta emot rapporter

En tabell används för att lagra statistisk information pg_stat_history
pg_stat_history tabellstruktur

                                          Tabell "public.pg_stat_history" Kolumn | Skriv | Modifierare-----------------------+-------------------------------- - -+------------------------------------------------ id | heltal | inte null default nextval('pg_stat_history_id_seq'::regclass) snapshot_timestamp | tidsstämpel utan tidszon | databas_id | heltal | dbid | oid | användarid | oid | queryid | bigint | fråga | text | samtal | bigint | total_tid | dubbel precision | min_tid | dubbel precision | max_tid | dubbel precision | medeltid | dubbel precision | stddev_time | dubbel precision | rader | bigint | shared_blks_hit | bigint | shared_blks_read | bigint | shared_blks_dirtied | bigint | shared_blks_written | bigint | local_blks_hit | bigint | local_blks_read | bigint | local_blks_dirtied | bigint | local_blks_written | bigint | temp_blks_read | bigint | temp_blks_written | bigint | blk_read_time | dubbel precision | blk_write_time | dubbel precision | baseline_id | heltal | Indexer: "pg_stat_history_pkey" PRIMÄRNYCKEL, btree (id) "database_idx" btree (database_id) "queryid_idx" btree (queryid) "snapshot_timestamp_idx" btree (snapshot_timestamp) Begränsningar för främmande nyckel: "database FORESEIGN KEYk" (databas FORES_id_KEYk) ) PÅ DELETE CASCADE

Som du kan se är tabellen bara den kumulativa vydatan pg_stat_statements i måldatabasen.

Det är väldigt enkelt att använda denna tabell

pg_stat_history kommer att representera ackumulerad statistik för sökexekvering för varje timme. I början av varje timme, efter att ha fyllt i tabellen, statistik pg_stat_statements återställ med pg_stat_statements_reset().
Notera: Statistik samlas in för frågor med exekveringslängd på mer än 1 sekund.
Fyller i tabellen pg_stat_history

--pg_stat_history.sql
CREATE OR REPLACE FUNCTION pg_stat_history( ) RETURNS boolean AS $$
DECLARE
  endpoint_rec record ;
  database_rec record ;
  pg_stat_snapshot record ;
  current_snapshot_timestamp timestamp without time zone;
BEGIN
  current_snapshot_timestamp = date_trunc('minute',now());  
  
  FOR endpoint_rec IN SELECT * FROM endpoint 
  LOOP
    FOR database_rec IN SELECT * FROM database WHERE endpoint_id = endpoint_rec.id 
	  LOOP
	    
		RAISE NOTICE 'NEW SHAPSHOT IS CREATING';
		
		--Connect to the target DB	  
	    EXECUTE 'SELECT dblink_connect(''LINK1'',''host='||endpoint_rec.host||' dbname='||database_rec.name||' user=USER password=PASSWORD '')';
 
        RAISE NOTICE 'host % and dbname % ',endpoint_rec.host,database_rec.name;
		RAISE NOTICE 'Creating snapshot of pg_stat_statements for database %',database_rec.name;
		
		SELECT 
	      *
		INTO 
		  pg_stat_snapshot
	    FROM dblink('LINK1',
	      'SELECT 
	       dbid , SUM(calls),SUM(total_time),SUM(rows) ,SUM(shared_blks_hit) ,SUM(shared_blks_read) ,SUM(shared_blks_dirtied) ,SUM(shared_blks_written) , 
           SUM(local_blks_hit) , SUM(local_blks_read) , SUM(local_blks_dirtied) , SUM(local_blks_written) , SUM(temp_blks_read) , SUM(temp_blks_written) , SUM(blk_read_time) , SUM(blk_write_time)
	       FROM pg_stat_statements WHERE dbid=(SELECT oid from pg_database where datname=current_database() ) 
		   GROUP BY dbid
  	      '
	               )
	      AS t
	       ( dbid oid , calls bigint , 
  	         total_time double precision , 
	         rows bigint , shared_blks_hit bigint , shared_blks_read bigint ,shared_blks_dirtied bigint ,shared_blks_written	 bigint ,
             local_blks_hit	 bigint ,local_blks_read bigint , local_blks_dirtied bigint ,local_blks_written bigint ,
             temp_blks_read	 bigint ,temp_blks_written bigint ,
             blk_read_time double precision , blk_write_time double precision	  
	       );
		 
		INSERT INTO pg_stat_history
          ( 
		    snapshot_timestamp  ,database_id  ,
			dbid , calls  ,total_time ,
            rows ,shared_blks_hit  ,shared_blks_read  ,shared_blks_dirtied  ,shared_blks_written ,local_blks_hit , 	 	
            local_blks_read,local_blks_dirtied,local_blks_written,temp_blks_read,temp_blks_written, 	
            blk_read_time, blk_write_time 
		  )		  
	    VALUES
	      (
	       current_snapshot_timestamp ,
		   database_rec.id ,
	       pg_stat_snapshot.dbid ,pg_stat_snapshot.calls,
	       pg_stat_snapshot.total_time,
	       pg_stat_snapshot.rows ,pg_stat_snapshot.shared_blks_hit ,pg_stat_snapshot.shared_blks_read ,pg_stat_snapshot.shared_blks_dirtied ,pg_stat_snapshot.shared_blks_written , 
           pg_stat_snapshot.local_blks_hit , pg_stat_snapshot.local_blks_read , pg_stat_snapshot.local_blks_dirtied , pg_stat_snapshot.local_blks_written , 
	       pg_stat_snapshot.temp_blks_read , pg_stat_snapshot.temp_blks_written , pg_stat_snapshot.blk_read_time , pg_stat_snapshot.blk_write_time 	   
	      );		   
		  
        RAISE NOTICE 'Creating snapshot of pg_stat_statements for queries with min_time more than 1000ms';
	
        FOR pg_stat_snapshot IN
          --All queries with max_time greater than 1000 ms
	      SELECT 
	        *
	      FROM dblink('LINK1',
	        'SELECT 
	         dbid , userid ,queryid,query,calls,total_time,min_time ,max_time,mean_time, stddev_time ,rows ,shared_blks_hit ,
			 shared_blks_read ,shared_blks_dirtied ,shared_blks_written , 
             local_blks_hit , local_blks_read , local_blks_dirtied , 
			 local_blks_written , temp_blks_read , temp_blks_written , blk_read_time , 
			 blk_write_time
	         FROM pg_stat_statements 
			 WHERE dbid=(SELECT oid from pg_database where datname=current_database() AND min_time >= 1000 ) 
  	        '

	                  )
	        AS t
	         ( dbid oid , userid oid , queryid bigint ,query text , calls bigint , 
  	           total_time double precision ,min_time double precision	 ,max_time double precision	 , mean_time double precision	 ,  stddev_time double precision	 , 
	           rows bigint , shared_blks_hit bigint , shared_blks_read bigint ,shared_blks_dirtied bigint ,shared_blks_written	 bigint ,
               local_blks_hit	 bigint ,local_blks_read bigint , local_blks_dirtied bigint ,local_blks_written bigint ,
               temp_blks_read	 bigint ,temp_blks_written bigint ,
               blk_read_time double precision , blk_write_time double precision	  
	         )
	    LOOP
		  INSERT INTO pg_stat_history
          ( 
		    snapshot_timestamp  ,database_id  ,
			dbid ,userid  , queryid  , query  , calls  ,total_time ,min_time ,max_time ,mean_time ,stddev_time ,
            rows ,shared_blks_hit  ,shared_blks_read  ,shared_blks_dirtied  ,shared_blks_written ,local_blks_hit , 	 	
            local_blks_read,local_blks_dirtied,local_blks_written,temp_blks_read,temp_blks_written, 	
            blk_read_time, blk_write_time 
		  )		  
	      VALUES
	      (
	       current_snapshot_timestamp ,
		   database_rec.id ,
	       pg_stat_snapshot.dbid ,pg_stat_snapshot.userid ,pg_stat_snapshot.queryid,pg_stat_snapshot.query,pg_stat_snapshot.calls,
	       pg_stat_snapshot.total_time,pg_stat_snapshot.min_time ,pg_stat_snapshot.max_time,pg_stat_snapshot.mean_time, pg_stat_snapshot.stddev_time ,
	       pg_stat_snapshot.rows ,pg_stat_snapshot.shared_blks_hit ,pg_stat_snapshot.shared_blks_read ,pg_stat_snapshot.shared_blks_dirtied ,pg_stat_snapshot.shared_blks_written , 
           pg_stat_snapshot.local_blks_hit , pg_stat_snapshot.local_blks_read , pg_stat_snapshot.local_blks_dirtied , pg_stat_snapshot.local_blks_written , 
	       pg_stat_snapshot.temp_blks_read , pg_stat_snapshot.temp_blks_written , pg_stat_snapshot.blk_read_time , pg_stat_snapshot.blk_write_time 	   
	      );
		  
        END LOOP;

        PERFORM dblink_disconnect('LINK1');  
				
	  END LOOP ;--FOR database_rec IN SELECT * FROM database WHERE endpoint_id = endpoint_rec.id 
    
  END LOOP;

RETURN TRUE;  
END
$$ LANGUAGE plpgsql;

Som ett resultat, efter en viss tid i tabellen pg_stat_history vi kommer att ha en uppsättning ögonblicksbilder av tabellens innehåll pg_stat_statements måldatabas.

Rapporterar faktiskt

Med enkla frågor kan du få ganska användbara och intressanta rapporter.

Aggregerad data för en given tidsperiod

utredning

SELECT 
  database_id , 
  SUM(calls) AS calls ,SUM(total_time)  AS total_time ,
  SUM(rows) AS rows , SUM(shared_blks_hit)  AS shared_blks_hit,
  SUM(shared_blks_read) AS shared_blks_read ,
  SUM(shared_blks_dirtied) AS shared_blks_dirtied,
  SUM(shared_blks_written) AS shared_blks_written , 
  SUM(local_blks_hit) AS local_blks_hit , 
  SUM(local_blks_read) AS local_blks_read , 
  SUM(local_blks_dirtied) AS local_blks_dirtied , 
  SUM(local_blks_written)  AS local_blks_written,
  SUM(temp_blks_read) AS temp_blks_read, 
  SUM(temp_blks_written) temp_blks_written , 
  SUM(blk_read_time) AS blk_read_time , 
  SUM(blk_write_time) AS blk_write_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NULL AND
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY database_id ;

DB tid

to_char(intervall '1 millisekund' * pg_total_stat_history_rec.total_time, 'HH24:MI:SS.MS')

I/O-tid

to_char(intervall '1 millisekund' * ( pg_total_stat_history_rec.blk_read_time + pg_total_stat_history_rec.blk_write_time ), 'HH24:MI:SS.MS')

TOP10 SQL av total_time

utredning

SELECT 
  queryid , 
  SUM(calls) AS calls ,
  SUM(total_time)  AS total_time  	
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT 
GROUP BY queryid 
ORDER BY 3 DESC 
LIMIT 10
-------------------------------------------------- ------------------------------------------ | TOP10 SQL EFTER TOTAL UTFÖRINGSTID | #| queryid| samtal| samtal total_tid (ms) | dbtime % +--------+------------+-----------+-----------+ ------ --------------------------+---------------- | 1| 821760255| 2| .00001|00:03:23.141( 203141.681 ms.)| 5.42 | 2| 4152624390| 2| .00001|00:03:13.929( 193929.215 ms.)| 5.17 | 3| 1484454471| 4| .00001|00:02:09.129( 129129.057 ms.)| 3.44 | 4| 655729273| 1| .00000|00:02:01.869( 121869.981 ms.)| 3.25 | 5| 2460318461| 1| .00000|00:01:33.113( 93113.835 ms.)| 2.48 | 6| 2194493487| 4| .00001|00:00:17.377( 17377.868 ms.)| .46 | 7| 1053044345| 1| .00000|00:00:06.156( 6156.352 ms.)| .16 | 8| 3644780286| 1| .00000|00:00:01.063( 1063.830 ms.)| .03

TOP10 SQL med total I/O-tid

utredning

SELECT 
  queryid , 
  SUM(calls) AS calls ,
  SUM(blk_read_time + blk_write_time)  AS io_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY  queryid 
ORDER BY 3 DESC 
LIMIT 10
-------------------------------------------------- -------------------------------------------- | TOP10 SQL PER TOTAL I/O-TID | #| queryid| samtal| samtal I/O-tid (ms)|db I/O-tid % +----+------------+-----------+------ ----------+--------------------------------+----- ------ -- | 1| 4152624390| 2| .00001|00:08:31.616( 511616.592 ms.)| 31.06 | 2| 821760255| 2| .00001|00:08:27.099( 507099.036 ms.)| 30.78 | 3| 655729273| 1| .00000|00:05:02.209( 302209.137 ms.)| 18.35 | 4| 2460318461| 1| .00000|00:04:05.981( 245981.117 ms.)| 14.93 | 5| 1484454471| 4| .00001|00:00:39.144( 39144.221 ms.)| 2.38 | 6| 2194493487| 4| .00001|00:00:18.182( 18182.816 ms.)| 1.10 | 7| 1053044345| 1| .00000|00:00:16.611( 16611.722 ms.)| 1.01 | 8| 3644780286| 1| .00000|00:00:00.436( 436.205 ms.)| .03

TOP10 SQL efter max tid för exekvering

utredning

SELECT 
  id AS snapshotid , 
  queryid , 
  snapshot_timestamp ,  
  max_time 
FROM 
  pg_stat_history 
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
ORDER BY 4 DESC 
LIMIT 10

-------------------------------------------------- ----------------------------------------------- | TOP10 SQL MED MAX UTFÖRINGSTID | #| ögonblicksbild| snapshotID| queryid| max_time (ms) +----+------------------+-----------+-------- --+------------------------------------------------------ | 1| 05.04.2019/01/03 4169:655729273| 00| 02| 01.869:121869.981:2( 04.04.2019 ms.) | 17| 00/4153/821760255 00:01| 41.570| 101570.841| 3:04.04.2019:16( 00 ms.) | 4146| 821760255/00/01 41.570:101570.841| 4| 04.04.2019| 16:00:4144( 4152624390 ms.) | 00| 01/36.964/96964.607 5:04.04.2019| 17| 00| 4151:4152624390:00(01 ms.) | 36.964| 96964.607/6/05.04.2019 10:00| 4188| 1484454471| 00:01:33.452(93452.150 ms.) | 7| 04.04.2019/17/00 4150:2460318461| 00| 01| 33.113:93113.835:8( 04.04.2019 ms.) | 15| 00/4140/1484454471 00:00| 11.892| 11892.302| 9:04.04.2019:16(00 ms.) | 4145| 1484454471/00/00 11.892:11892.302| 10| 04.04.2019| 17:00:4152( 1484454471 ms.) | 00| 00/11.892/11892.302 XNUMX:XNUMX| XNUMX| XNUMX| XNUMX:XNUMX:XNUMX( XNUMX ms.) | XNUMX| XNUMX/XNUMX/XNUMX XNUMX:XNUMX| XNUMX| XNUMX| XNUMX:XNUMX:XNUMX( XNUMX ms.)

TOP10 SQL av DELAD buffert läs/skriv

utredning

SELECT 
  id AS snapshotid , 
  queryid ,
  snapshot_timestamp , 
  shared_blks_read , 
  shared_blks_written 
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND
  ( shared_blks_read > 0 OR shared_blks_written > 0 )
ORDER BY 4 DESC  , 5 DESC 
LIMIT 10
-------------------------------------------------- ------------------------------------------ | TOP10 SQL EFTER DELAD BUFFERT LÄS/SKRIV | #| ögonblicksbild| snapshotID| queryid| delade block läs| delade block skriv +----+-------------------+-----------+-------- --+---------------------------+---------------------------- | 1| 04.04.2019/17/00 4153:821760255| 797308| 0| 2| 04.04.2019 | 16| 00/4146/821760255 797308:0| 3| 05.04.2019| 01| 03 | 4169| 655729273/797158/0 4:04.04.2019| 16| 00| 4144| 4152624390 | 756514| 0/5/04.04.2019 17:00| 4151| 4152624390| 756514| 0 | 6| 04.04.2019/17/00 4150:2460318461| 734117| 0| 7| 04.04.2019 | 17| 00/4155/3644780286 52973:0| 8| 05.04.2019| 01| 03 | 4168| 1053044345/52818/0 9:04.04.2019| 15| 00| 4141| 2194493487 | 52813| 0/10/04.04.2019 16:00| 4147| 2194493487| 52813| 0 | XNUMX| XNUMX/XNUMX/XNUMX XNUMX:XNUMX| XNUMX| XNUMX| XNUMX| XNUMX | XNUMX| XNUMX/XNUMX/XNUMX XNUMX:XNUMX| XNUMX| XNUMX| XNUMX| XNUMX -------------------------------------------------- ------------------------------------------

Histogram över förfrågningars fördelning efter maximal exekveringstid

förfrågningar

SELECT  
  MIN(max_time) AS hist_min  , 
  MAX(max_time) AS hist_max , 
  (( MAX(max_time) - MIN(min_time) ) / hist_columns ) as hist_width
FROM 
  pg_stat_history 
WHERE 
  queryid IS NOT NULL AND
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT ;

SELECT 
  SUM(calls) AS calls
FROM 
  pg_stat_history 
WHERE 
  queryid IS NOT NULL AND
  database_id =DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND 
  ( max_time >= hist_current_min AND  max_time < hist_current_max ) ;
|-------------------------------------------------------- - ---------------------------------------------------- | MAX_TIME HISTOGRAM | TOTALT SAMTAL: 33851920 | MIN TID: 00:00:01.063 | MAX TID: 00:02:01.869 ------------------------------------------ ----------------------------------------------- | min varaktighet| max varaktighet| ringer +----------------------------------+------- ----------------------+---------- | 00:00:01.063( 1063.830 ms.) | 00:00:13.144( 13144.445 ms.) | 9 | 00:00:13.144( 13144.445 ms.) | 00:00:25.225( 25225.060 ms.) | 0 | 00:00:25.225( 25225.060 ms.) | 00:00:37.305( 37305.675 ms.) | 0 | 00:00:37.305( 37305.675 ms.) | 00:00:49.386( 49386.290 ms.) | 0 | 00:00:49.386( 49386.290 ms.) | 00:01:01.466( 61466.906 ms.) | 0 | 00:01:01.466( 61466.906 ms.) | 00:01:13.547( 73547.521 ms.) | 0 | 00:01:13.547( 73547.521 ms.) | 00:01:25.628( 85628.136 ms.) | 0 | 00:01:25.628( 85628.136 ms.) | 00:01:37.708( 97708.751 ms.) | 4 | 00:01:37.708( 97708.751 ms.) | 00:01:49.789( 109789.366 ms.) | 2 | 00:01:49.789( 109789.366 ms.) | 00:02:01.869( 121869.981 ms.) | 0

TOP10 ögonblicksbilder efter fråga per sekund

förfrågningar

--pg_qps.sql
--Calculate Query Per Second 
CREATE OR REPLACE FUNCTION pg_qps( pg_stat_history_id integer ) RETURNS double precision AS $$
DECLARE
 pg_stat_history_rec record ;
 prev_pg_stat_history_id integer ;
 prev_pg_stat_history_rec record;
 total_seconds double precision ;
 result double precision;
BEGIN 
  result = 0 ;
  
  SELECT *
  INTO pg_stat_history_rec
  FROM 
    pg_stat_history
  WHERE id = pg_stat_history_id ;

  IF pg_stat_history_rec.snapshot_timestamp IS NULL 
  THEN
    RAISE EXCEPTION 'ERROR - Not found pg_stat_history for id = %',pg_stat_history_id;
  END IF ;  
  
 --RAISE NOTICE 'pg_stat_history_id = % , snapshot_timestamp = %', pg_stat_history_id , 
 pg_stat_history_rec.snapshot_timestamp ;
  
  SELECT 
    MAX(id)   
  INTO
    prev_pg_stat_history_id
  FROM
    pg_stat_history
  WHERE 
    database_id = pg_stat_history_rec.database_id AND
	queryid IS NULL AND
	id < pg_stat_history_rec.id ;

  IF prev_pg_stat_history_id IS NULL 
  THEN
    RAISE NOTICE 'Not found previous pg_stat_history shapshot for id = %',pg_stat_history_id;
	RETURN NULL ;
  END IF;
  
  SELECT *
  INTO prev_pg_stat_history_rec
  FROM 
    pg_stat_history
  WHERE id = prev_pg_stat_history_id ;
  
  --RAISE NOTICE 'prev_pg_stat_history_id = % , prev_snapshot_timestamp = %', prev_pg_stat_history_id , prev_pg_stat_history_rec.snapshot_timestamp ;    

  total_seconds = extract(epoch from ( pg_stat_history_rec.snapshot_timestamp - prev_pg_stat_history_rec.snapshot_timestamp ));
  
  --RAISE NOTICE 'total_seconds = % ', total_seconds ;    
  
  --RAISE NOTICE 'calls = % ', pg_stat_history_rec.calls ;      
  
  IF total_seconds > 0 
  THEN
    result = pg_stat_history_rec.calls / total_seconds ;
  ELSE
   result = 0 ; 
  END IF;
   
 RETURN result ;
END
$$ LANGUAGE plpgsql;


SELECT 
  id , 
  snapshot_timestamp ,
  calls , 	
  total_time , 
  ( select pg_qps( id )) AS QPS ,
  blk_read_time ,
  blk_write_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND
  ( select pg_qps( id )) IS NOT NULL 
ORDER BY 5 DESC 
LIMIT 10
|-------------------------------------------------------- - ---------------------------------------------------- | TOP10 ögonblicksbilder sorterade efter QueryPerSeconds-nummer -------------------------------------------- -------------------------------------------------- ---------------------------------------------------------- | #| ögonblicksbild| snapshotID| samtal| total dbtid| QPS| I/O-tid| I/O-tid % +-----+------------------------+----------+------- ----+-----------------------------------------+---------- -+------------------------+---------------- | 1| 04.04.2019/20/04 4161:5758631| 00| 06| 30.513:390513.926:1573.396( 00 ms.)| 00| 01.470:1470.110:376( 2 ms.)| .04.04.2019 | 17| 00/4149/3529197 00:11| 48.830| 708830.618| 980.332:00:12( 47.834 ms.)| 767834.052| 108.324:3:04.04.2019( 16 ms.)| 00 | 4143| 3525360/00/10 13.492:613492.351| 979.267| 00| 08:41.396:521396.555( 84.988 ms.)| 4| 04.04.2019:21:03(4163 ms.)| 2781536 | 00| 03/06.470/186470.979 785.745:00| 00| 00.249| 249.865:134:5( 04.04.2019 ms.)| 19| 03:4159:2890362( 00 ms.)| .03 | 16.784| 196784.755 776.979:00| 00| 01.441| 1441.386:732:6( 04.04.2019 ms.)| 14| 00:4137:2397326( 00 ms.)| .04 | 43.033| 283033.854/665.924/00 00:00.024| 24.505| 009| 7:04.04.2019:15( 00 ms.)| 4139| 2394416:00:04(51.435 ms.)| .291435.010 | 665.116| 00/00/12.025 12025.895:4.126| 8| 04.04.2019| 13:00:4135( 2373043 ms.)| 00| 04:26.791:266791.988( 659.179 ms.)| 00 | 00| 00.064 64.261:024| 9| 05.04.2019| 01:03:4167( 4387191 ms.)| 00| 06:51.380:411380.293( 609.332 ms.)| .00 | 05| 18.847/318847.407/77.507 10:04.04.2019| 18| 01| 4157:1145596:00( 01 ms.)| 19.217| 79217.372:313.004:00( 00 ms.)| 01.319 | 1319.676| 1.666/XNUMX/XNUMX XNUMX:XNUMX| XNUMX| XNUMX| XNUMX:XNUMX:XNUMX( XNUMX ms.)| XNUMX| XNUMX:XNUMX:XNUMX( XNUMX ms.)| XNUMX

Exekveringshistorik varje timme med QueryPerSeconds och I/O-tid

utredning

SELECT 
  id , 
  snapshot_timestamp ,
  calls , 	
  total_time , 
  ( select pg_qps( id )) AS QPS ,
  blk_read_time ,
  blk_write_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
ORDER BY 2
|-----------------------------------------------------------------------------------------------
| HOURLY EXECUTION HISTORY  WITH QueryPerSeconds and I/O Time
-----------------------------------------------------------------------------------------------------------------------------------------------
| QUERY PER SECOND HISTORY
|    #|          snapshot| snapshotID|      calls|                      total dbtime|        QPS|                          I/O time| I/O time %
+-----+------------------+-----------+-----------+----------------------------------+-----------+----------------------------------+-----------
|    1|  04.04.2019 11:00|       4131|       3747|  00:00:00.835(       835.374 ms.)|      1.041|  00:00:00.000(          .000 ms.)|       .000
|    2|  04.04.2019 12:00|       4133|    1002722|  00:01:52.419(    112419.376 ms.)|    278.534|  00:00:00.149(       149.105 ms.)|       .133
|    3|  04.04.2019 13:00|       4135|    2373043|  00:04:26.791(    266791.988 ms.)|    659.179|  00:00:00.064(        64.261 ms.)|       .024
|    4|  04.04.2019 14:00|       4137|    2397326|  00:04:43.033(    283033.854 ms.)|    665.924|  00:00:00.024(        24.505 ms.)|       .009
|    5|  04.04.2019 15:00|       4139|    2394416|  00:04:51.435(    291435.010 ms.)|    665.116|  00:00:12.025(     12025.895 ms.)|      4.126
|    6|  04.04.2019 16:00|       4143|    3525360|  00:10:13.492(    613492.351 ms.)|    979.267|  00:08:41.396(    521396.555 ms.)|     84.988
|    7|  04.04.2019 17:00|       4149|    3529197|  00:11:48.830(    708830.618 ms.)|    980.332|  00:12:47.834(    767834.052 ms.)|    108.324
|    8|  04.04.2019 18:01|       4157|    1145596|  00:01:19.217(     79217.372 ms.)|    313.004|  00:00:01.319(      1319.676 ms.)|      1.666
|    9|  04.04.2019 19:03|       4159|    2890362|  00:03:16.784(    196784.755 ms.)|    776.979|  00:00:01.441(      1441.386 ms.)|       .732
|   10|  04.04.2019 20:04|       4161|    5758631|  00:06:30.513(    390513.926 ms.)|   1573.396|  00:00:01.470(      1470.110 ms.)|       .376
|   11|  04.04.2019 21:03|       4163|    2781536|  00:03:06.470(    186470.979 ms.)|    785.745|  00:00:00.249(       249.865 ms.)|       .134
|   12|  04.04.2019 23:03|       4165|    1443155|  00:01:34.467(     94467.539 ms.)|    200.438|  00:00:00.015(        15.287 ms.)|       .016
|   13|  05.04.2019 01:03|       4167|    4387191|  00:06:51.380(    411380.293 ms.)|    609.332|  00:05:18.847(    318847.407 ms.)|     77.507
|   14|  05.04.2019 02:03|       4171|     189852|  00:00:10.989(     10989.899 ms.)|     52.737|  00:00:00.539(       539.110 ms.)|      4.906
|   15|  05.04.2019 03:01|       4173|       3627|  00:00:00.103(       103.000 ms.)|      1.042|  00:00:00.004(         4.131 ms.)|      4.010
|   16|  05.04.2019 04:00|       4175|       3627|  00:00:00.085(        85.235 ms.)|      1.025|  00:00:00.003(         3.811 ms.)|      4.471
|   17|  05.04.2019 05:00|       4177|       3747|  00:00:00.849(       849.454 ms.)|      1.041|  00:00:00.006(         6.124 ms.)|       .721
|   18|  05.04.2019 06:00|       4179|       3747|  00:00:00.849(       849.561 ms.)|      1.041|  00:00:00.000(          .051 ms.)|       .006
|   19|  05.04.2019 07:00|       4181|       3747|  00:00:00.839(       839.416 ms.)|      1.041|  00:00:00.000(          .062 ms.)|       .007
|   20|  05.04.2019 08:00|       4183|       3747|  00:00:00.846(       846.382 ms.)|      1.041|  00:00:00.000(          .007 ms.)|       .001
|   21|  05.04.2019 09:00|       4185|       3747|  00:00:00.855(       855.426 ms.)|      1.041|  00:00:00.000(          .065 ms.)|       .008
|   22|  05.04.2019 10:00|       4187|       3797|  00:01:40.150(    100150.165 ms.)|      1.055|  00:00:21.845(     21845.217 ms.)|     21.812

Text för alla SQL-val

utredning

SELECT 
  queryid , 
  query 
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY queryid , query

Totalt

Som du kan se, med ganska enkla medel, kan du få mycket användbar information om databasens arbetsbelastning och tillstånd.

Notera:Om vi ​​registrerar queryid i queries får vi historiken för en separat query (för att spara utrymme utelämnas rapporter för en separat query).

Så, statistisk data om frågeprestanda är tillgänglig och samlad in.
Det första steget "insamling av statistiska uppgifter" är avslutat.

Du kan gå vidare till det andra steget - "inrätta prestationsstatistik".
Prestandaövervakning av PostgreSQL-frågor. Del 1 - rapportering

Men det är en helt annan historia.

Fortsättning ...

Källa: will.com

Lägg en kommentar