Надгледање перформанси ПостгреСКЛ упита. Део 1 - извештавање

Инжењер - у преводу са латинског - надахнут.
Инжењер може све. (ц) Р. Диесел.
Епиграфи.
Надгледање перформанси ПостгреСКЛ упита. Део 1 - извештавање
Или прича о томе зашто администратор базе података треба да се сети своје програмске прошлости.

Предговор

Сва имена су промењена. Случајности су случајне. Материјал представља искључиво лично мишљење аутора.

Одрицање од гаранција: Планирана серија чланака неће садржати детаљан и тачан опис коришћених табела и скрипти. Материјали се не могу одмах користити „КАКО ЈЕСУ“.
Прво, због велике количине материјала,
друго, због блиског односа са производном базом стварног купца.
Стога ће чланци садржати само идеје и описе у најопштијем облику.
Можда ће у будућности систем порасти до нивоа објављивања на ГитХуб-у, а можда и не. Време ће показати.

Почетак приче - "Да ли се сећате како је све почело'.
Оно што се десило као резултат, најопштије речено - “Синтеза као један од метода за побољшање перформанси ПостгреСКЛ-а»

Зашто ми све ово треба?

Па, прво, да се не заборави, сећање на славне дане у пензији.
Друго, да систематизује написано. Јер понекад почнем да се збуним и заборављам одређене делове.

Па, и најважније је да некоме може добро доћи и помоћи да избегне да поново измисли точак и да не скупља грабуље. Другим речима, побољшајте своју карму (не Кхабровљеву). Јер највредније на овом свету су идеје. Главна ствар је пронаћи идеју. Али претварање идеје у стварност је чисто техничко питање.

Па да почнемо мало по мало...

Формулисање проблема.

Доступан:

ПостгреСКЛ(10.5) база података, мешовити тип оптерећења (ОЛТП+ДСС), средње мало оптерећење, налази се у АВС облаку.
Не постоји надзор базе података; надзор инфраструктуре је обезбеђен у облику стандардних АВС алата у минималној конфигурацији.

Потребно је:

Пратите перформансе и статус базе података, пронађите и имате почетне информације за оптимизацију тешких упита базе података.

Кратак увод или анализа опција решења

За почетак, хајде да покушамо да анализирамо опције за решавање проблема са становишта упоредне анализе предности и мана за инжењера, и нека се они који имају право на то према кадровском распореду баве предностима и губици менаџмента.

Опција 1 - „Рад на захтев“

Остављамо све како јесте. Уколико корисник није задовољан нечим у перформансама, перформансама базе података или апликације, обавестиће ДБА инжењере е-поштом или креирањем инцидента у траци за улазнице.
Инжењер ће, по пријему обавештења, разумети проблем, понудити решење или проблем ставити у позадину, надајући се да ће се све решити само од себе, а у сваком случају, све ће ускоро бити заборављено.
Медењаци и крофне, модрице и квргеМедењак и крофне:
1. Нема потребе да радите ништа додатно.
2. Увек постоји прилика да се оправдате и зезнете.
3. Много времена које можете потрошити по сопственом нахођењу.
Модрице и кврге:
1. Пре или касније, купац ће размислити о суштини постојања и универзалне правде на овом свету и још једном себи поставити питање – зашто им ја плаћам свој новац? Последица је увек иста – само је питање када ће муштерија да досади и махне му на поздрав. А хранилица ће бити празна. То је тужно.
2. Развој инжењера - нула.
3. Потешкоће у планирању рада и утовара

Опција 2- „Плес уз тамбураше, парење и обување“

Члан 1-Зашто нам треба систем за праћење, све ћемо добити са захтевима. Покрећемо гомилу свих врста упита према речнику података и динамичким приказима, укључујемо све врсте бројача, стављамо све у табеле и периодично анализирамо листе и табеле. Као резултат, имамо лепе или не тако лепе графиконе, табеле, извештаје. Главна ствар је имати више, више.
Члан 2-Ми генеришемо активност и покрећемо анализу свега тога.
Члан 3– Припремамо одређени документ, овај документ једноставно зовемо – „како да поставимо базу података“.
Члан 4-Купац је, видећи сву ову раскош графикона и бројева, у детињастом, наивном поверењу - сад ће нам све, ускоро, прорадити. И, лако и безболно се растаје са својим финансијским средствима. Управа је такође уверена да наши инжењери раде одлично. Максимално оптерећење.
Члан 5- Редовно понављајте корак 1.
Медењаци и крофне, модрице и квргеМедењак и крофне:
1. Живот менаџера и инжењера је једноставан, предвидљив и испуњен активностима. Све зуји, сви су заузети.
2. Живот купца такође није лош - он је увек сигуран да само треба мало да се стрпи и све ће успети. Не иде на боље, па, свет је неправедан, у следећем животу имаћете среће.
Модрице и кврге:
1. Пре или касније, појавиће се бржи провајдер сличне услуге који ће урадити исту ствар, али мало јефтиније. А ако је резултат исти, зашто плаћати више. Што ће опет довести до нестанка хранилице.
2. Досадно је. Како је досадна свака бесмислена активност.
3. Као иу претходној верзији, нема развоја. Али за инжењера, мана је то што, за разлику од прве опције, морате стално да генеришете ИБД. А за ово је потребно време. Које можете потрошити у корист вољене особе. Пошто не можете да се бринете о себи, никога није брига за вас.

Опција 3 - Не морате да измишљате бицикл, само га морате купити и возити.

Није узалуд што инжењери других компанија једу пицу са пивом (ох, дани славе Санкт Петербурга 90-их). Хајде да користимо системе за праћење који су направљени, отклоњени и раде, и уопштено говорећи, од користи (добро, барем за њихове креаторе).
Медењаци и крофне, модрице и квргеМедењак и крофне:
1. Нема потребе да губите време смишљајући нешто што је већ измишљено. Узми и користи.
2. Системе за праћење не пишу будале и они су, наравно, корисни.
3. Радни системи за праћење обично пружају корисне филтриране информације.
Модрице и кврге:
1. Инжењер у овом случају није инжењер, већ само корисник туђег производа или корисник.
2. Купац мора бити убеђен у потребу куповине нечега што, уопштено говорећи, не жели да разуме, и не би требало, а генерално, буџет за годину је одобрен и неће се мењати. Затим морате да доделите посебан ресурс и да га конфигуришете за одређени систем. Оне. прво треба да платите, платите и поново платите. И муштерија је шкрта. Ово је норма овог живота.

Шта да се ради - Чернишевски? Ваше питање је веома релевантно. (са)

У овом конкретном случају и тренутној ситуацији, можете то учинити мало другачије - хајде да направимо сопствени систем за праћење.
Надгледање перформанси ПостгреСКЛ упита. Део 1 - извештавање
Па, није систем, наравно, у пуном смислу те речи, то је превише гласно и дрско, али барем некако олакшајте свој задатак и прикупите више информација за решавање инцидената у раду. Да се ​​не бисте нашли у ситуацији - "иди тамо, не знам где, нађи нешто, не знам шта."

Које су предности и мане ове опције:

Предности:
1. Ово је занимљиво. Па, барем је занимљивије од константног „смањивање датотеке података, измена простора табеле, итд.“
2. То су нове вештине и нови развој. Који ће вам, пре или касније, дати заслужене медењаке и крофне.
Против:
1. Мораћете да радите. Радите напорно.
2. Мораћете редовно да објашњавате значење и изгледе свих активности.
3. Нешто ће морати да се жртвује, јер једини ресурс који инжењер има - време - ограничен је Универзумом.
4. Најгора и најнепријатнија ствар - резултат може бити срање попут "Не миш, не жаба, већ непозната животиња."

Они који не ризикују не пију шампањац.
Дакле - забава почиње.

Општа идеја - шематски

Надгледање перформанси ПостгреСКЛ упита. Део 1 - извештавање
(Илустрација преузета из чланка «Синтеза као један од метода за побољшање перформанси ПостгреСКЛ-а")

Објашњење:

  • Стандардна ПостгреСКЛ екстензија „пг_стат_статементс“ је инсталирана у циљној бази података.
  • У бази података за праћење креирамо скуп табела услуга за чување историје пг_стат_статементс у почетној фази и за подешавање метрика и праћење у будућности
  • На хосту за праћење креирамо скуп басх скрипти, укључујући оне за генерисање инцидената у систему тикета.

Сервисни столови

Прво, схематски поједностављени ЕРД, шта се на крају догодило:
Надгледање перформанси ПостгреСКЛ упита. Део 1 - извештавање
Кратак опис табелакрајња тачка — домаћин, тачка везе са инстанцом
база података - параметри базе података
пг_стат_хистори - историјска табела за чување привремених снимака пг_стат_статементс приказа циљне базе података
метриц_глоссари - речник метрике перформанси
метриц_цонфиг — конфигурација појединачних метрика
метрички — специфична метрика за захтев који се надгледа
метриц_алерт_хистори - историја упозорења о перформансама
лог_куери — сервисна табела за чување рашчлањених записа из ПостгреСКЛ датотеке евиденције преузете са АВС-а
основни — параметри временских периода који се користе као основа
цхецкпоинт — конфигурација метрике за проверу статуса базе података
цхецкпоинт_алерт_хистори — историја упозорења метрике провере здравља базе података
пг_стат_дб_куериес — сервисна табела активних захтева
активности — сервисна табела дневника активности
трап_оид — сервисна табела конфигурације замке

Фаза 1 – прикупљање статистичких информација о учинку и примање извештаја

Табела се користи за чување статистичких информација пг_стат_хистори
структура табеле пг_стат_хистори

                                          Табела "публиц.пг_стат_хистори" Колона | Тип | Модификатори---------------------+---------------------- - -+----------------------------------------- ид | цео број | нот нулл дефаулт нектвал('пг_стат_хистори_ид_сек'::регцласс) снапсхот_тиместамп | временска ознака без временске зоне | датабасе_ид | цео број | дбид | оид | усерид | оид | куериид | бигинт | упит | текст | позиви | бигинт | укупно_време | двострука прецизност | мин_тиме | двострука прецизност | мак_тиме | двострука прецизност | меан_тиме | двострука прецизност | стддев_тиме | двострука прецизност | редови | бигинт | схаред_блкс_хит | бигинт | схаред_блкс_реад | бигинт | схаред_блкс_диртиед | бигинт | схаред_блкс_вриттен | бигинт | лоцал_блкс_хит | бигинт | лоцал_блкс_реад | бигинт | лоцал_блкс_диртиед | бигинт | лоцал_блкс_вриттен | бигинт | темп_блкс_реад | бигинт | темп_блкс_вриттен | бигинт | блк_реад_тиме | двострука прецизност | блк_врите_тиме | двострука прецизност | баселине_ид | цео број | Индекси: "пг_стат_хистори_пкеи" ПРИМАРНИ КЉУЧ, бтрее (ид) "датабасе_идк" бтрее (датабасе_ид) "куериид_идк" бтрее (куериид) "снапсхот_тиместамп_идк" бтрее (снапсхот_тиместамп) КЕИДАФТАЦОНСТРАИНТС "ТАФОРЕИГНтацонстраине": "Фореигн-кеи" басе_ид) РЕФЕРЕНЦЕС база података(ид ) ОН ДЕЛЕТЕ ЦАСЦАДЕ

Као што видите, табела је само кумулативни приказ података пг_стат_статементс у циљној бази података.

Коришћење ове табеле је веома једноставно

пг_стат_хистори представљаће акумулирану статистику извршења упита за сваки сат. На почетку сваког сата, након попуњавања табеле, статистика пг_стат_статементс ресетујте са пг_стат_статементс_ресет().
Напомена: Статистике се прикупљају за упите са трајањем извршења дужим од 1 секунде.
Попуњавање табеле пг_стат_хистори

--pg_stat_history.sql
CREATE OR REPLACE FUNCTION pg_stat_history( ) RETURNS boolean AS $$
DECLARE
  endpoint_rec record ;
  database_rec record ;
  pg_stat_snapshot record ;
  current_snapshot_timestamp timestamp without time zone;
BEGIN
  current_snapshot_timestamp = date_trunc('minute',now());  
  
  FOR endpoint_rec IN SELECT * FROM endpoint 
  LOOP
    FOR database_rec IN SELECT * FROM database WHERE endpoint_id = endpoint_rec.id 
	  LOOP
	    
		RAISE NOTICE 'NEW SHAPSHOT IS CREATING';
		
		--Connect to the target DB	  
	    EXECUTE 'SELECT dblink_connect(''LINK1'',''host='||endpoint_rec.host||' dbname='||database_rec.name||' user=USER password=PASSWORD '')';
 
        RAISE NOTICE 'host % and dbname % ',endpoint_rec.host,database_rec.name;
		RAISE NOTICE 'Creating snapshot of pg_stat_statements for database %',database_rec.name;
		
		SELECT 
	      *
		INTO 
		  pg_stat_snapshot
	    FROM dblink('LINK1',
	      'SELECT 
	       dbid , SUM(calls),SUM(total_time),SUM(rows) ,SUM(shared_blks_hit) ,SUM(shared_blks_read) ,SUM(shared_blks_dirtied) ,SUM(shared_blks_written) , 
           SUM(local_blks_hit) , SUM(local_blks_read) , SUM(local_blks_dirtied) , SUM(local_blks_written) , SUM(temp_blks_read) , SUM(temp_blks_written) , SUM(blk_read_time) , SUM(blk_write_time)
	       FROM pg_stat_statements WHERE dbid=(SELECT oid from pg_database where datname=current_database() ) 
		   GROUP BY dbid
  	      '
	               )
	      AS t
	       ( dbid oid , calls bigint , 
  	         total_time double precision , 
	         rows bigint , shared_blks_hit bigint , shared_blks_read bigint ,shared_blks_dirtied bigint ,shared_blks_written	 bigint ,
             local_blks_hit	 bigint ,local_blks_read bigint , local_blks_dirtied bigint ,local_blks_written bigint ,
             temp_blks_read	 bigint ,temp_blks_written bigint ,
             blk_read_time double precision , blk_write_time double precision	  
	       );
		 
		INSERT INTO pg_stat_history
          ( 
		    snapshot_timestamp  ,database_id  ,
			dbid , calls  ,total_time ,
            rows ,shared_blks_hit  ,shared_blks_read  ,shared_blks_dirtied  ,shared_blks_written ,local_blks_hit , 	 	
            local_blks_read,local_blks_dirtied,local_blks_written,temp_blks_read,temp_blks_written, 	
            blk_read_time, blk_write_time 
		  )		  
	    VALUES
	      (
	       current_snapshot_timestamp ,
		   database_rec.id ,
	       pg_stat_snapshot.dbid ,pg_stat_snapshot.calls,
	       pg_stat_snapshot.total_time,
	       pg_stat_snapshot.rows ,pg_stat_snapshot.shared_blks_hit ,pg_stat_snapshot.shared_blks_read ,pg_stat_snapshot.shared_blks_dirtied ,pg_stat_snapshot.shared_blks_written , 
           pg_stat_snapshot.local_blks_hit , pg_stat_snapshot.local_blks_read , pg_stat_snapshot.local_blks_dirtied , pg_stat_snapshot.local_blks_written , 
	       pg_stat_snapshot.temp_blks_read , pg_stat_snapshot.temp_blks_written , pg_stat_snapshot.blk_read_time , pg_stat_snapshot.blk_write_time 	   
	      );		   
		  
        RAISE NOTICE 'Creating snapshot of pg_stat_statements for queries with min_time more than 1000ms';
	
        FOR pg_stat_snapshot IN
          --All queries with max_time greater than 1000 ms
	      SELECT 
	        *
	      FROM dblink('LINK1',
	        'SELECT 
	         dbid , userid ,queryid,query,calls,total_time,min_time ,max_time,mean_time, stddev_time ,rows ,shared_blks_hit ,
			 shared_blks_read ,shared_blks_dirtied ,shared_blks_written , 
             local_blks_hit , local_blks_read , local_blks_dirtied , 
			 local_blks_written , temp_blks_read , temp_blks_written , blk_read_time , 
			 blk_write_time
	         FROM pg_stat_statements 
			 WHERE dbid=(SELECT oid from pg_database where datname=current_database() AND min_time >= 1000 ) 
  	        '

	                  )
	        AS t
	         ( dbid oid , userid oid , queryid bigint ,query text , calls bigint , 
  	           total_time double precision ,min_time double precision	 ,max_time double precision	 , mean_time double precision	 ,  stddev_time double precision	 , 
	           rows bigint , shared_blks_hit bigint , shared_blks_read bigint ,shared_blks_dirtied bigint ,shared_blks_written	 bigint ,
               local_blks_hit	 bigint ,local_blks_read bigint , local_blks_dirtied bigint ,local_blks_written bigint ,
               temp_blks_read	 bigint ,temp_blks_written bigint ,
               blk_read_time double precision , blk_write_time double precision	  
	         )
	    LOOP
		  INSERT INTO pg_stat_history
          ( 
		    snapshot_timestamp  ,database_id  ,
			dbid ,userid  , queryid  , query  , calls  ,total_time ,min_time ,max_time ,mean_time ,stddev_time ,
            rows ,shared_blks_hit  ,shared_blks_read  ,shared_blks_dirtied  ,shared_blks_written ,local_blks_hit , 	 	
            local_blks_read,local_blks_dirtied,local_blks_written,temp_blks_read,temp_blks_written, 	
            blk_read_time, blk_write_time 
		  )		  
	      VALUES
	      (
	       current_snapshot_timestamp ,
		   database_rec.id ,
	       pg_stat_snapshot.dbid ,pg_stat_snapshot.userid ,pg_stat_snapshot.queryid,pg_stat_snapshot.query,pg_stat_snapshot.calls,
	       pg_stat_snapshot.total_time,pg_stat_snapshot.min_time ,pg_stat_snapshot.max_time,pg_stat_snapshot.mean_time, pg_stat_snapshot.stddev_time ,
	       pg_stat_snapshot.rows ,pg_stat_snapshot.shared_blks_hit ,pg_stat_snapshot.shared_blks_read ,pg_stat_snapshot.shared_blks_dirtied ,pg_stat_snapshot.shared_blks_written , 
           pg_stat_snapshot.local_blks_hit , pg_stat_snapshot.local_blks_read , pg_stat_snapshot.local_blks_dirtied , pg_stat_snapshot.local_blks_written , 
	       pg_stat_snapshot.temp_blks_read , pg_stat_snapshot.temp_blks_written , pg_stat_snapshot.blk_read_time , pg_stat_snapshot.blk_write_time 	   
	      );
		  
        END LOOP;

        PERFORM dblink_disconnect('LINK1');  
				
	  END LOOP ;--FOR database_rec IN SELECT * FROM database WHERE endpoint_id = endpoint_rec.id 
    
  END LOOP;

RETURN TRUE;  
END
$$ LANGUAGE plpgsql;

Као резултат, након неког временског периода у табели пг_стат_хистори имаћемо скуп снимака садржаја табеле пг_стат_статементс циљна база података.

Заправо извештавање

Користећи једноставне упите, можете добити прилично корисне и занимљиве извештаје.

Збирни подаци за дати временски период

Захтев

SELECT 
  database_id , 
  SUM(calls) AS calls ,SUM(total_time)  AS total_time ,
  SUM(rows) AS rows , SUM(shared_blks_hit)  AS shared_blks_hit,
  SUM(shared_blks_read) AS shared_blks_read ,
  SUM(shared_blks_dirtied) AS shared_blks_dirtied,
  SUM(shared_blks_written) AS shared_blks_written , 
  SUM(local_blks_hit) AS local_blks_hit , 
  SUM(local_blks_read) AS local_blks_read , 
  SUM(local_blks_dirtied) AS local_blks_dirtied , 
  SUM(local_blks_written)  AS local_blks_written,
  SUM(temp_blks_read) AS temp_blks_read, 
  SUM(temp_blks_written) temp_blks_written , 
  SUM(blk_read_time) AS blk_read_time , 
  SUM(blk_write_time) AS blk_write_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NULL AND
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY database_id ;

ДБ Тиме

то_цхар(интервал '1 милисекунда' * пг_тотал_стат_хистори_рец.тотал_тиме, 'ХХ24:МИ:СС.МС')

И/О Тиме

то_цхар(интервал '1 милисекунда' * ( пг_тотал_стат_хистори_рец.блк_реад_тиме + пг_тотал_стат_хистори_рец.блк_врите_тиме ), 'ХХ24:МИ:СС.МС')

ТОП10 СКЛ по тотал_тиме

Захтев

SELECT 
  queryid , 
  SUM(calls) AS calls ,
  SUM(total_time)  AS total_time  	
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT 
GROUP BY queryid 
ORDER BY 3 DESC 
LIMIT 10
-------------------------------------------------- ---------------------------------- | ТОП10 СКЛ ПО УКУПНОМ ВРЕМЕНУ ИЗВРШЕЊА | #| куериид| позива| позива %| укупно_време (мс) | дбтиме % +----------+-----------+-----------+-----------+ ------ --------------------------+--------- | 1| 821760255| 2| .00001|00:03:23.141( 203141.681 мс.)| 5.42 | 2| 4152624390| 2| .00001|00:03:13.929( 193929.215 мс.)| 5.17 | 3| 1484454471| 4| .00001|00:02:09.129( 129129.057 мс.)| 3.44 | 4| 655729273| 1| .00000|00:02:01.869( 121869.981 мс.)| 3.25 | 5| 2460318461| 1| .00000|00:01:33.113( 93113.835 мс.)| 2.48 | 6| 2194493487| 4| .00001|00:00:17.377( 17377.868 мс.)| .46 | 7| 1053044345| 1| .00000|00:00:06.156( 6156.352 мс.)| .16 | 8| 3644780286| 1| .00000|00:00:01.063( 1063.830 мс.)| .03

ТОП10 СКЛ по укупном И/О времену

Захтев

SELECT 
  queryid , 
  SUM(calls) AS calls ,
  SUM(blk_read_time + blk_write_time)  AS io_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY  queryid 
ORDER BY 3 DESC 
LIMIT 10
-------------------------------------------------- ------------------------------------- | ТОП10 СКЛ ПО УКУПНОМ И/О ВРЕМЕНУ | #| куериид| позива| позива %| И/О време (мс)|дб И/О време % +----+-----------+-----------+------ -----------+--------------------------------+----- ------ -- | 1| 4152624390| 2| .00001|00:08:31.616( 511616.592 мс.)| 31.06 | 2| 821760255| 2| .00001|00:08:27.099( 507099.036 мс.)| 30.78 | 3| 655729273| 1| .00000|00:05:02.209( 302209.137 мс.)| 18.35 | 4| 2460318461| 1| .00000|00:04:05.981( 245981.117 мс.)| 14.93 | 5| 1484454471| 4| .00001|00:00:39.144( 39144.221 мс.)| 2.38 | 6| 2194493487| 4| .00001|00:00:18.182( 18182.816 мс.)| 1.10 | 7| 1053044345| 1| .00000|00:00:16.611( 16611.722 мс.)| 1.01 | 8| 3644780286| 1| .00000|00:00:00.436( 436.205 мс.)| .03

ТОП10 СКЛ по максималном времену извршења

Захтев

SELECT 
  id AS snapshotid , 
  queryid , 
  snapshot_timestamp ,  
  max_time 
FROM 
  pg_stat_history 
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
ORDER BY 4 DESC 
LIMIT 10

-------------------------------------------------- --------------------------------------- | ТОП10 СКЛ ПО МАКСИМАЛНОМ ВРЕМЕНУ ИЗВРШЕЊА | #| снимак| снапсхотИД| куериид| максимално_време (мс) +----+------------------+-----------+--------- --+--------------------------------------- | 1| 05.04.2019 01:03| 4169| 655729273| 00:02:01.869( 121869.981 мс.) | 2| 04.04.2019 17:00| 4153| 821760255| 00:01:41.570( 101570.841 мс.) | 3| 04.04.2019 16:00| 4146| 821760255| 00:01:41.570( 101570.841 мс.) | 4| 04.04.2019 16:00| 4144| 4152624390| 00:01:36.964(96964.607 мс.) | 5| 04.04.2019 17:00| 4151| 4152624390| 00:01:36.964(96964.607 мс.) | 6| 05.04.2019 10:00| 4188| 1484454471| 00:01:33.452( 93452.150 мс.) | 7| 04.04.2019 17:00| 4150| 2460318461| 00:01:33.113(93113.835 мс.) | 8| 04.04.2019 15:00| 4140| 1484454471| 00:00:11.892( 11892.302 мс.) | 9| 04.04.2019 16:00| 4145| 1484454471| 00:00:11.892( 11892.302 мс.) | 10| 04.04.2019 17:00| 4152| 1484454471| 00:00:11.892( 11892.302 мс.)

ТОП10 СКЛ по ДЕЉЕНОМ баферу читање/писање

Захтев

SELECT 
  id AS snapshotid , 
  queryid ,
  snapshot_timestamp , 
  shared_blks_read , 
  shared_blks_written 
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND
  ( shared_blks_read > 0 OR shared_blks_written > 0 )
ORDER BY 4 DESC  , 5 DESC 
LIMIT 10
-------------------------------------------------- ----------------------------------------- | ТОП10 СКЛ ПО ДЕЉЕНОМ БУФЕРУ ЧИТАЊЕ/ПИШЕЊЕ | #| снимак| снапсхотИД| куериид| заједнички блокови реад| заједнички блокови пишу +----+-------------------+------+---------- -+---------------------+--------------------- | 1| 04.04.2019 17:00| 4153| 821760255| 797308| 0 | 2| 04.04.2019 16:00| 4146| 821760255| 797308| 0 | 3| 05.04.2019 01:03| 4169| 655729273| 797158| 0 | 4| 04.04.2019 16:00| 4144| 4152624390| 756514| 0 | 5| 04.04.2019 17:00| 4151| 4152624390| 756514| 0 | 6| 04.04.2019 17:00| 4150| 2460318461| 734117| 0 | 7| 04.04.2019 17:00| 4155| 3644780286| 52973| 0 | 8| 05.04.2019 01:03| 4168| 1053044345| 52818| 0 | 9| 04.04.2019 15:00| 4141| 2194493487| 52813| 0 | 10| 04.04.2019 16:00| 4147| 2194493487| 52813| 0 -------------------------------------------------- -------------------------------------------

Хистограм дистрибуције упита по максималном времену извршења

zahtevi

SELECT  
  MIN(max_time) AS hist_min  , 
  MAX(max_time) AS hist_max , 
  (( MAX(max_time) - MIN(min_time) ) / hist_columns ) as hist_width
FROM 
  pg_stat_history 
WHERE 
  queryid IS NOT NULL AND
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT ;

SELECT 
  SUM(calls) AS calls
FROM 
  pg_stat_history 
WHERE 
  queryid IS NOT NULL AND
  database_id =DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND 
  ( max_time >= hist_current_min AND  max_time < hist_current_max ) ;
|------------------------------------------------ - ----------------------------------------------------- | МАКС_ТИМЕ ХИСТОГРАМ | УКУПНО ПОЗИВА: 33851920 | МИН ТИМЕ: 00:00:01.063 | МАКСИМАЛНО ВРЕМЕ: 00:02:01.869 -------------------------------------------------- --------------------------------------- | мин трајање| максимално трајање| позиви +-----------------------------------+------------ ---------------------+--------- | 00:00:01.063( 1063.830 мс.) | 00:00:13.144( 13144.445 мс.) | 9 | 00:00:13.144( 13144.445 мс.) | 00:00:25.225( 25225.060 мс.) | 0 | 00:00:25.225( 25225.060 мс.) | 00:00:37.305( 37305.675 мс.) | 0 | 00:00:37.305( 37305.675 мс.) | 00:00:49.386( 49386.290 мс.) | 0 | 00:00:49.386( 49386.290 мс.) | 00:01:01.466( 61466.906 мс.) | 0 | 00:01:01.466( 61466.906 мс.) | 00:01:13.547( 73547.521 мс.) | 0 | 00:01:13.547( 73547.521 мс.) | 00:01:25.628( 85628.136 мс.) | 0 | 00:01:25.628( 85628.136 мс.) | 00:01:37.708( 97708.751 мс.) | 4 | 00:01:37.708( 97708.751 мс.) | 00:01:49.789( 109789.366 мс.) | 2 | 00:01:49.789( 109789.366 мс.) | 00:02:01.869( 121869.981 мс.) | 0

ТОП10 снимака по упиту у секунди

zahtevi

--pg_qps.sql
--Calculate Query Per Second 
CREATE OR REPLACE FUNCTION pg_qps( pg_stat_history_id integer ) RETURNS double precision AS $$
DECLARE
 pg_stat_history_rec record ;
 prev_pg_stat_history_id integer ;
 prev_pg_stat_history_rec record;
 total_seconds double precision ;
 result double precision;
BEGIN 
  result = 0 ;
  
  SELECT *
  INTO pg_stat_history_rec
  FROM 
    pg_stat_history
  WHERE id = pg_stat_history_id ;

  IF pg_stat_history_rec.snapshot_timestamp IS NULL 
  THEN
    RAISE EXCEPTION 'ERROR - Not found pg_stat_history for id = %',pg_stat_history_id;
  END IF ;  
  
 --RAISE NOTICE 'pg_stat_history_id = % , snapshot_timestamp = %', pg_stat_history_id , 
 pg_stat_history_rec.snapshot_timestamp ;
  
  SELECT 
    MAX(id)   
  INTO
    prev_pg_stat_history_id
  FROM
    pg_stat_history
  WHERE 
    database_id = pg_stat_history_rec.database_id AND
	queryid IS NULL AND
	id < pg_stat_history_rec.id ;

  IF prev_pg_stat_history_id IS NULL 
  THEN
    RAISE NOTICE 'Not found previous pg_stat_history shapshot for id = %',pg_stat_history_id;
	RETURN NULL ;
  END IF;
  
  SELECT *
  INTO prev_pg_stat_history_rec
  FROM 
    pg_stat_history
  WHERE id = prev_pg_stat_history_id ;
  
  --RAISE NOTICE 'prev_pg_stat_history_id = % , prev_snapshot_timestamp = %', prev_pg_stat_history_id , prev_pg_stat_history_rec.snapshot_timestamp ;    

  total_seconds = extract(epoch from ( pg_stat_history_rec.snapshot_timestamp - prev_pg_stat_history_rec.snapshot_timestamp ));
  
  --RAISE NOTICE 'total_seconds = % ', total_seconds ;    
  
  --RAISE NOTICE 'calls = % ', pg_stat_history_rec.calls ;      
  
  IF total_seconds > 0 
  THEN
    result = pg_stat_history_rec.calls / total_seconds ;
  ELSE
   result = 0 ; 
  END IF;
   
 RETURN result ;
END
$$ LANGUAGE plpgsql;


SELECT 
  id , 
  snapshot_timestamp ,
  calls , 	
  total_time , 
  ( select pg_qps( id )) AS QPS ,
  blk_read_time ,
  blk_write_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND
  ( select pg_qps( id )) IS NOT NULL 
ORDER BY 5 DESC 
LIMIT 10
|------------------------------------------------ - ----------------------------------------------------- | ТОП10 снимака поређаних по КуериПерСецондс бројевима -------------------------------------------- -------------------------------------------------- -------------------------------------------------- | #| снимак| снапсхотИД| позива| тотал дбтиме| КПС| И/О време| И/О време % +-----+-----------------+-----------+------- ----+---------------------------------+---------- -+-----------------------+---------- | 1| 04.04.2019 20:04| 4161| 5758631| 00:06:30.513( 390513.926 мс.)| 1573.396| 00:00:01.470( 1470.110 мс.)| .376 | 2| 04.04.2019 17:00| 4149| 3529197| 00:11:48.830( 708830.618 мс.)| 980.332| 00:12:47.834( 767834.052 мс.)| 108.324 | 3| 04.04.2019 16:00| 4143| 3525360| 00:10:13.492( 613492.351 мс.)| 979.267| 00:08:41.396(521396.555 мс.)| 84.988 | 4| 04.04.2019 21:03| 4163| 2781536| 00:03:06.470( 186470.979 мс.)| 785.745| 00:00:00.249(249.865 мс.)| .134 | 5| 04.04.2019 19:03| 4159| 2890362| 00:03:16.784( 196784.755 мс.)| 776.979| 00:00:01.441( 1441.386 мс.)| .732 | 6| 04.04.2019 14:00| 4137| 2397326| 00:04:43.033( 283033.854 мс.)| 665.924| 00:00:00.024(24.505 мс.)| .009 | 7| 04.04.2019 15:00| 4139| 2394416| 00:04:51.435( 291435.010 мс.)| 665.116| 00:00:12.025( 12025.895 мс.)| 4.126 | 8| 04.04.2019 13:00| 4135| 2373043| 00:04:26.791( 266791.988 мс.)| 659.179| 00:00:00.064( 64.261 мс.)| .024 | 9| 05.04.2019 01:03| 4167| 4387191| 00:06:51.380( 411380.293 мс.)| 609.332| 00:05:18.847( 318847.407 мс.)| 77.507 | 10| 04.04.2019 18:01| 4157| 1145596| 00:01:19.217( 79217.372 мс.)| 313.004| 00:00:01.319( 1319.676 мс.)| 1.666

Историја извршавања по сату са КуериПерСецондс и И/О временом

Захтев

SELECT 
  id , 
  snapshot_timestamp ,
  calls , 	
  total_time , 
  ( select pg_qps( id )) AS QPS ,
  blk_read_time ,
  blk_write_time
FROM 
  pg_stat_history
WHERE 
  queryid IS NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
ORDER BY 2
|-----------------------------------------------------------------------------------------------
| HOURLY EXECUTION HISTORY  WITH QueryPerSeconds and I/O Time
-----------------------------------------------------------------------------------------------------------------------------------------------
| QUERY PER SECOND HISTORY
|    #|          snapshot| snapshotID|      calls|                      total dbtime|        QPS|                          I/O time| I/O time %
+-----+------------------+-----------+-----------+----------------------------------+-----------+----------------------------------+-----------
|    1|  04.04.2019 11:00|       4131|       3747|  00:00:00.835(       835.374 ms.)|      1.041|  00:00:00.000(          .000 ms.)|       .000
|    2|  04.04.2019 12:00|       4133|    1002722|  00:01:52.419(    112419.376 ms.)|    278.534|  00:00:00.149(       149.105 ms.)|       .133
|    3|  04.04.2019 13:00|       4135|    2373043|  00:04:26.791(    266791.988 ms.)|    659.179|  00:00:00.064(        64.261 ms.)|       .024
|    4|  04.04.2019 14:00|       4137|    2397326|  00:04:43.033(    283033.854 ms.)|    665.924|  00:00:00.024(        24.505 ms.)|       .009
|    5|  04.04.2019 15:00|       4139|    2394416|  00:04:51.435(    291435.010 ms.)|    665.116|  00:00:12.025(     12025.895 ms.)|      4.126
|    6|  04.04.2019 16:00|       4143|    3525360|  00:10:13.492(    613492.351 ms.)|    979.267|  00:08:41.396(    521396.555 ms.)|     84.988
|    7|  04.04.2019 17:00|       4149|    3529197|  00:11:48.830(    708830.618 ms.)|    980.332|  00:12:47.834(    767834.052 ms.)|    108.324
|    8|  04.04.2019 18:01|       4157|    1145596|  00:01:19.217(     79217.372 ms.)|    313.004|  00:00:01.319(      1319.676 ms.)|      1.666
|    9|  04.04.2019 19:03|       4159|    2890362|  00:03:16.784(    196784.755 ms.)|    776.979|  00:00:01.441(      1441.386 ms.)|       .732
|   10|  04.04.2019 20:04|       4161|    5758631|  00:06:30.513(    390513.926 ms.)|   1573.396|  00:00:01.470(      1470.110 ms.)|       .376
|   11|  04.04.2019 21:03|       4163|    2781536|  00:03:06.470(    186470.979 ms.)|    785.745|  00:00:00.249(       249.865 ms.)|       .134
|   12|  04.04.2019 23:03|       4165|    1443155|  00:01:34.467(     94467.539 ms.)|    200.438|  00:00:00.015(        15.287 ms.)|       .016
|   13|  05.04.2019 01:03|       4167|    4387191|  00:06:51.380(    411380.293 ms.)|    609.332|  00:05:18.847(    318847.407 ms.)|     77.507
|   14|  05.04.2019 02:03|       4171|     189852|  00:00:10.989(     10989.899 ms.)|     52.737|  00:00:00.539(       539.110 ms.)|      4.906
|   15|  05.04.2019 03:01|       4173|       3627|  00:00:00.103(       103.000 ms.)|      1.042|  00:00:00.004(         4.131 ms.)|      4.010
|   16|  05.04.2019 04:00|       4175|       3627|  00:00:00.085(        85.235 ms.)|      1.025|  00:00:00.003(         3.811 ms.)|      4.471
|   17|  05.04.2019 05:00|       4177|       3747|  00:00:00.849(       849.454 ms.)|      1.041|  00:00:00.006(         6.124 ms.)|       .721
|   18|  05.04.2019 06:00|       4179|       3747|  00:00:00.849(       849.561 ms.)|      1.041|  00:00:00.000(          .051 ms.)|       .006
|   19|  05.04.2019 07:00|       4181|       3747|  00:00:00.839(       839.416 ms.)|      1.041|  00:00:00.000(          .062 ms.)|       .007
|   20|  05.04.2019 08:00|       4183|       3747|  00:00:00.846(       846.382 ms.)|      1.041|  00:00:00.000(          .007 ms.)|       .001
|   21|  05.04.2019 09:00|       4185|       3747|  00:00:00.855(       855.426 ms.)|      1.041|  00:00:00.000(          .065 ms.)|       .008
|   22|  05.04.2019 10:00|       4187|       3797|  00:01:40.150(    100150.165 ms.)|      1.055|  00:00:21.845(     21845.217 ms.)|     21.812

Текст свих СКЛ избора

Захтев

SELECT 
  queryid , 
  query 
FROM 
  pg_stat_history
WHERE 
  queryid IS NOT NULL AND 
  database_id = DATABASE_ID  AND
  snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY queryid , query

Укупан

Као што видите, користећи прилично једноставна средства, можете добити много корисних информација о оптерећењу и стању базе података.

Белешка:Ако запишемо куериид у упитима, добићемо историју за посебан упит (да бисмо уштедели простор, извештаји за посебан упит су изостављени).

Дакле, статистички подаци о учинку упита су доступни и прикупљени.
Прва фаза „прикупљање статистичких података“ је завршена.

Можете прећи на другу фазу - „подешавање метрике учинка“.
Надгледање перформанси ПостгреСКЛ упита. Део 1 - извештавање

Али то је сасвим друга прича.

Наставиће се ...

Извор: ввв.хабр.цом

Додај коментар