En av metoderna för att få låshistorik i PostgreSQL

Fortsättning på artikeln "Ett försök att skapa en ASH-analog för PostgreSQL ".

Artikeln kommer att undersöka och visa, med hjälp av specifika frågor och exempel, vilken användbar information som kan erhållas med historiken för vyn pg_locks.

Varning.
På grund av ämnets nyhet och den oavslutade testperioden kan artikeln innehålla fel. Kritik och kommentarer välkomnas och förväntas varmt.

Indata

Historik för representation av pg_locks

arkiv_låsning

CREATE TABLE archive_locking 
(       timepoint timestamp without time zone ,
	locktype text ,
	relation oid ,
	mode text ,
	tid xid ,
	vtid text ,
	pid integer ,
	blocking_pids integer[] ,
	granted boolean ,
        queryid bigint 
);

I huvudsak liknar bordet bordet archive_pg_stat_activity, beskrivs mer i detalj här - pg_stat_statements + pg_stat_activity + loq_query = pg_ash? och här - Ett försök att skapa en analog av ASH för PostgreSQL.

För att fylla en kolumn queryid funktionen används

update_history_locking_by_queryid

--update_history_locking_by_queryid.sql
CREATE OR REPLACE FUNCTION update_history_locking_by_queryid() RETURNS boolean AS $$
DECLARE
  result boolean ;
  current_minute double precision ; 
  
  start_minute integer ;
  finish_minute integer ;
  
  start_period timestamp without time zone ;
  finish_period timestamp without time zone ;
  
  lock_rec record ; 
  endpoint_rec record ; 
  
  current_hour_diff double precision ;
BEGIN
  RAISE NOTICE '***update_history_locking_by_queryid';
  
  result = TRUE ;
  
  current_minute = extract ( minute from now() );

  SELECT * FROM endpoint WHERE is_need_monitoring
  INTO endpoint_rec ;
  
  current_hour_diff = endpoint_rec.hour_diff ;
  
  IF current_minute < 5 
  THEN
	RAISE NOTICE 'Current time is less than 5 minute.';
	
	start_period = date_trunc('hour',now()) + (current_hour_diff * interval '1 hour');
    finish_period = start_period - interval '5 minute' ;
  ELSE 
    finish_minute =  extract ( minute from now() ) / 5 ;
    start_minute =  finish_minute - 1 ;
  
    start_period = date_trunc('hour',now()) + interval '1 minute'*start_minute*5+(current_hour_diff * interval '1 hour');
    finish_period = date_trunc('hour',now()) + interval '1 minute'*finish_minute*5+(current_hour_diff * interval '1 hour') ;
    
  END IF ;  
  
  RAISE NOTICE 'start_period = %', start_period;
  RAISE NOTICE 'finish_period = %', finish_period;

	FOR lock_rec IN   
	WITH act_queryid AS
	 (
		SELECT 
				pid , 
				timepoint ,
				query_start AS started ,			
				MAX(timepoint) OVER (PARTITION BY pid ,	query_start   ) AS finished ,			
				queryid 
		FROM 
				activity_hist.history_pg_stat_activity 			
		WHERE 			
				timepoint BETWEEN start_period and 
								  finish_period
		GROUP BY 
				pid , 
				timepoint ,  
				query_start ,
				queryid 
	 ),
	 lock_pids AS
		(
			SELECT
				hl.pid , 
				hl.locktype  ,
				hl.mode ,
				hl.timepoint , 
				MIN ( timepoint ) OVER (PARTITION BY pid , locktype  ,mode ) as started 
			FROM 
				activity_hist.history_locking hl
			WHERE 
				hl.timepoint between start_period and 
								     finish_period
			GROUP BY 
				hl.pid , 
				hl.locktype  ,
				hl.mode ,
				hl.timepoint 
		)
	SELECT 
		lp.pid , 
		lp.locktype  ,
		lp.mode ,
		lp.timepoint ,     
		aq.queryid 
	FROM lock_pids 	lp LEFT OUTER JOIN act_queryid aq ON ( lp.pid = aq.pid AND lp.started BETWEEN aq.started AND aq.finished )
	WHERE aq.queryid IS NOT NULL 
	GROUP BY  
		lp.pid , 
		lp.locktype  ,
		lp.mode ,
		lp.timepoint , 
		aq.queryid
	LOOP
		UPDATE activity_hist.history_locking SET queryid = lock_rec.queryid 
		WHERE pid = lock_rec.pid AND locktype = lock_rec.locktype AND mode = lock_rec.mode AND timepoint = lock_rec.timepoint ;	
	END LOOP;    
  
  RETURN result ;
END
$$ LANGUAGE plpgsql;

förklaring: värdet för queryid-kolumnen uppdateras i history_locking-tabellen, och när en ny partition skapas för archive_locking-tabellen kommer värdet att lagras i de historiska värdena.

Produktion

Allmän information om processer i allmänhet.

VÄNTAR PÅ LÅS EFTER LÅSTYPER

utredning

WITH
t AS
(
	SELECT 
		locktype  ,
		mode ,
		count(*) as total 
	FROM 
		activity_hist.archive_locking
	WHERE 
		timepoint between pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND 
		NOT granted
	GROUP BY 
		locktype  ,
		mode  
)
SELECT 
	locktype  ,
	mode ,
	total * interval '1 second' as duration			
FROM t 		
ORDER BY 3 DESC 

Exempel

| VÄNTAR PÅ LÅS EFTER LÅSTYPER +------+-------------------------------------+ ------------------ | låstyp| läge| varaktighet +---------------------+-------------------------------- - --+---------------------------- | transaktions-id| ShareLock| 19:39:26 | tuppel| AccessExclusiveLock| 00:03:35 +--------------------+------------------------------------ - -------+----------

UTTAG AV LÅS EFTER LÅSTYPER

utredning

WITH
t AS
(
	SELECT 
		locktype  ,
		mode ,
		count(*) as total 
	FROM 
		activity_hist.archive_locking
	WHERE 
		timepoint between pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND 
		granted
	GROUP BY 
		locktype  ,
		mode  
)
SELECT 
	locktype  ,
	mode ,
	total * interval '1 second' as duration			
FROM t 		
ORDER BY 3 DESC 

Exempel

| TAGNING AV LÅS EFTER LÅSTYPER +-------------------------+------------------------------ ----+------------------------- | låstyp| läge| varaktighet +---------------------+-------------------------------- - --+---------------------------- | relation| RowExclusiveLock| 51:11:10 | virtualxid| Exklusivt lås| 48:10:43 | transaktions-id| Exklusivt lås| 44:24:53 | relation| AccessShareLock| 20:06:13 | tuppel| AccessExclusiveLock| 17:58:47 | tuppel| Exklusivt lås| 01:40:41 | relation| ShareUpdateExclusiveLock| 00:26:41 | objekt| RowExclusiveLock| 00:00:01 | transaktions-id| ShareLock| 00:00:01 | förlänga| Exklusivt lås| 00:00:01 +--------------------+----------------------------- - -------+----------

Detaljerad information om specifika queryid-förfrågningar

VÄNTAR PÅ LÅS EFTER LÅSTYPER EFTER QUERYID

utredning

WITH
lt AS
(
	SELECT
		pid , 
		locktype  ,
		mode ,
		timepoint , 
		queryid , 
		blocking_pids ,
                MIN ( timepoint ) OVER (PARTITION BY pid , locktype  ,mode ) as started  
	FROM 
		activity_hist.archive_locking
	WHERE 
		timepoint between pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND 
			                  pg_stat_history_end+(current_hour_diff * interval '1 hour') AND 
		NOT granted AND
	       queryid IS NOT NULL 
	GROUP BY 
	        pid , 
		locktype  ,
		mode ,
		timepoint ,
		queryid ,
		blocking_pids 
)
SELECT 
        lt.pid , 
	lt.locktype  ,
	lt.mode ,			
        lt.started ,
	lt.queryid  ,
	lt.blocking_pids ,
	COUNT(*)  * interval '1 second'	 as duration		
FROM lt 	
GROUP BY 
	lt.pid , 
        lt.locktype  ,
	lt.mode ,			
        lt.started ,
        lt.queryid ,
	lt.blocking_pids 
ORDER BY 4

Exempel

| VÄNTAR PÅ LÅS EFTER LÅSTYPER EFTER QUERYID +----------------------------------- +----------------------------+--- ------------------ --+---------------------------+---------------- ---------- | pid| låstyp| läge| började| queryid| blocking_pids| varaktighet +----------+--------------------------------+---------------- ----------+------------------------------------+--------- -- ----------+----------------------------+----------------- -- - | 11288| transaktions-id| ShareLock| 2019-09-17 10:00:00.302936| 389015618226997618| {11092}| 00:03:34 | 11626| transaktions-id| ShareLock| 2019-09-17 10:00:21.380921| 389015618226997618| {12380}| 00:00:29 | 11626| transaktions-id| ShareLock| 2019-09-17 10:00:21.380921| 389015618226997618| {11092}| 00:03:25 | 11626| transaktions-id| ShareLock| 2019-09-17 10:00:21.380921| 389015618226997618| {12213}| 00:01:55 | 11626| transaktions-id| ShareLock| 2019-09-17 10:00:21.380921| 389015618226997618| {12751}| 00:00:01 | 11629| transaktions-id| ShareLock| 2019-09-17 10:00:24.331935| 389015618226997618| {11092}| 00:03:22 | 11629| transaktions-id| ShareLock| 2019-09-17 10:00:24.331935| 389015618226997618| {12007}| 00:00:01 | 12007| transaktions-id| ShareLock| 2019-09-17 10:05:03.327933| 389015618226997618| {11629}| 00:00:13 | 12007| transaktions-id| ShareLock| 2019-09-17 10:05:03.327933| 389015618226997618| {11092}| 00:01:10 | 12007| transaktions-id| ShareLock| 2019-09-17 10:05:03.327933| 389015618226997618| {11288}| 00:00:05 | 12213| transaktions-id| ShareLock| 2019-09-17 10:06:07.328019| 389015618226997618| {12007}| 00:00:10

TA LÅS EFTER LÅSTYPER EFTER QUERYID

utredning

WITH
lt AS
(
	SELECT
		pid , 
		locktype  ,
		mode ,
		timepoint , 
		queryid , 
		blocking_pids ,
                MIN ( timepoint ) OVER (PARTITION BY pid , locktype  ,mode ) as started  
	FROM 
		activity_hist.archive_locking
	WHERE 
		timepoint between pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND 
			                  pg_stat_history_end+(current_hour_diff * interval '1 hour') AND 
		granted AND
		queryid IS NOT NULL 
	GROUP BY 
	        pid , 
		locktype  ,
		mode ,
		timepoint ,
		queryid ,
		blocking_pids 
)
SELECT 
        lt.pid , 
	lt.locktype  ,
	lt.mode ,			
        lt.started ,
	lt.queryid  ,
	lt.blocking_pids ,
	COUNT(*)  * interval '1 second'	 as duration			
FROM lt 	
GROUP BY 
	lt.pid , 
	lt.locktype  ,
	lt.mode ,			
        lt.started ,
	lt.queryid ,
	lt.blocking_pids 
ORDER BY 4

Exempel

| ATT TA LÅS MED LÅSTYPER MED QUERYID +-----------------------------------+ ----------------------------+--------------------+ --------------------+---------------------------- | pid| låstyp| läge| började| queryid| blocking_pids| varaktighet +----------+--------------------------------+---------------- ----------+------------------------------------+--------- -- ----------+----------------------------+----------------- -- - | 11288| relation| RowExclusiveLock| 2019-09-17 10:00:00.302936| 389015618226997618| {11092}| 00:03:34 | 11092| transaktions-id| Exklusivt lås| 2019-09-17 10:00:00.302936| 389015618226997618| {}| 00:03:34 | 11288| relation| RowExclusiveLock| 2019-09-17 10:00:00.302936| 389015618226997618| {}| 00:00:10 | 11092| relation| RowExclusiveLock| 2019-09-17 10:00:00.302936| 389015618226997618| {}| 00:03:34 | 11092| virtualxid| Exklusivt lås| 2019-09-17 10:00:00.302936| 389015618226997618| {}| 00:03:34 | 11288| virtualxid| Exklusivt lås| 2019-09-17 10:00:00.302936| 389015618226997618| {11092}| 00:03:34 | 11288| transaktions-id| Exklusivt lås| 2019-09-17 10:00:00.302936| 389015618226997618| {11092}| 00:03:34 | 11288| tuppel| AccessExclusiveLock| 2019-09-17 10:00:00.302936| 389015618226997618| {11092}| 00:03:34

Använda låshistorik för att analysera prestandaincidenter.

  1. En begäran med queryid=389015618226997618 exekverad av en process med pid=11288 väntade på blockering från och med 2019-09-17 10:00:00 i 3 minuter.
  2. Låset hölls av en process med pid=11092
  3. En process där pid=11092 exekverade en begäran med queryid=389015618226997618 från och med 2019-09-17 10:00:00 höll låset i 3 minuter.

Totalt

Nu hoppas jag att den mest intressanta och användbara delen kommer att börja - att samla in statistik och analysera fall om historien om väntan och blockeringar.

I framtiden, vill jag tro, kommer vi att få en uppsättning med några anteckningar (liknande Oracles metalink).

Generellt sett är det av denna anledning som metodiken som används görs tillgänglig för alla så snabbt som möjligt.

Jag kommer att försöka lägga upp projektet på github inom en snar framtid.

Källa: will.com

Lägg en kommentar