Спроба створити аналог ASH для PostgreSQL

Постановка завдання

Для оптимізації запитів PostgreSQL дуже потрібна можливість аналізувати історію активності, зокрема – очікування, блокування, статистика таблиць.

Наявні можливості

Інструмент аналізу історичного навантаження або «AWR для Postgres»: дуже цікаве рішення, проте, немає історії pg_stat_activity та pg_locks.

Розширення pgsentinel :
«Вся накопичена інформація зберігається тільки в оперативній пам'яті, а обсяг пам'яті, що споживається, регулюється кількістю останніх записів, що зберігаються.

Додається поле queryid - цей queryid з розширення pg_stat_statements (потрібна попередня установка).«

Це звичайно б дуже допомогло, але сама неприємність саме перший пункт “Вся накопичена інформація зберігається лише в оперативній пам'яті ”, тобто. маємо імпакт на цільову базу. До того ж немає історії блокувань і статистики таблиць. Тобто. рішення взагалі кажучи неповне: “Готового пакета для встановлення поки що немає. Пропонується завантажити вихідні записи та зібрати бібліотеку самостійно. Попередньо потрібно встановити "devel"-пакет для свого сервера та в змінну PATH прописати шлях до pg_config.".

Загалом - метушні багато, а у разі серйозних продакшн баз, можливо, і не буде можливості щось робити з сервером. Потрібно знову, вигадувати щось своє.

Попередження.

З огляду на досить великий обсяг і у зв'язку з незавершенням періоду тестування, стаття носить переважно ознайомлювальний характер, скоріш як набір тез і проміжних результатів.
Більш докладний матеріал буде підготовлений пізніше, частинами

Ескізні вимоги до рішення

Необхідно розробити інструмент, який дозволяє зберігати:

Історію уявлення pg_stat_activity
Історію блокувань сесій, використовуючи уявлення pg_locks

Вимога до вирішення-Мінімізувати вплив на цільову базу даних.

Загальна ідея–агент збору даних запускається над цільової базі, а базі даних моніторингу як сервіс systemd. Так, можливі деякі втрати даних, але це не критично, для звітності, зате немає імпакту на цільову базу пам'яті та місця на диску. А у разі використання пулу з'єднань, імпакт за користувальницькими процесами мінімальний.

Етапи реалізації

1.Сервісні таблиці

Для зберігання таблиць використовується окрема схема, щоб ускладнювати аналіз основних використаних таблиць.

DROP SCHEMA IF EXISTS activity_hist ;
CREATE SCHEMA activity_hist AUTHORIZATION monitor ;

Важливо: схема створюється над цільової базі даних, а базі даних моніторингу.

Історія уявлення pg_stat_activity

Для зберігання поточних знімків подання pg_stat_activity використовується таблиця

activity_hist.history_pg_stat_activity :

--ACTIVITY_HIST.HISTORY_PG_STAT_ACTIVITY
DROP TABLE IF EXISTS activity_hist.history_pg_stat_activity;
CREATE TABLE activity_hist.history_pg_stat_activity
(
  timepoint timestamp without time zone ,
  datid             oid  , 
  datname           name ,
  pid               integer,
  usesysid          oid    ,
  usename           name   ,
  application_name  text   ,
  client_addr       inet   ,
  client_hostname   text   ,
  client_port       integer,
  backend_start     timestamp with time zone ,
  xact_start        timestamp with time zone ,
  query_start       timestamp with time zone ,
  state_change      timestamp with time zone ,
  wait_event_type   text ,                     
  wait_event        text ,                   
  state             text ,                  
  backend_xid       xid  ,                 
  backend_xmin      xid  ,                
  query             text ,               
  backend_type      text ,  
  queryid           bigint
);

Для прискорення вставки – жодних індексів та обмежень.

Для зберігання безпосередньо історії використовується секційована таблиця:

activity_hist.archive_pg_stat_activity :

DROP TABLE IF EXISTS activity_hist.archive_pg_stat_activity;
CREATE TABLE activity_hist.archive_pg_stat_activity
(
  timepoint timestamp without time zone ,
  datid             oid  , 
  datname           name ,
  pid               integer,
  usesysid          oid    ,
  usename           name   ,
  application_name  text   ,
  client_addr       inet   ,
  client_hostname   text   ,
  client_port       integer,
  backend_start     timestamp with time zone ,
  xact_start        timestamp with time zone ,
  query_start       timestamp with time zone ,
  state_change      timestamp with time zone ,
  wait_event_type   text ,                     
  wait_event        text ,                   
  state             text ,                  
  backend_xid       xid  ,                 
  backend_xmin      xid  ,                
  query             text ,               
  backend_type      text ,
  queryid           bigint
)
PARTITION BY RANGE (timepoint);

Оскільки в цьому випадку немає вимог щодо швидкості вставки, створено деякі індекси для прискорення створення звітів.

Історія блокувань сесій

Для збереження поточних знімків блокувань сесій використовується таблиця:

activity_hist.history_locking :

--ACTIVITY_HIST.HISTORY_LOCKING
DROP TABLE IF EXISTS activity_hist.history_locking;
CREATE TABLE activity_hist.history_locking
(
	timepoint timestamp without time zone ,
	locktype text ,
	relation oid ,
	mode text ,
	tid xid ,
	vtid text ,
	pid integer ,
	blocking_pids integer[] ,
	granted boolean
);

Також, для прискорення вставки – жодних індексів та обмежень.

Для зберігання безпосередньо історії використовується секційована таблиця:

activity_hist.archive_locking:

DROP TABLE IF EXISTS activity_hist.archive_locking;
CREATE TABLE activity_hist.archive_locking
(
	timepoint timestamp without time zone ,
	locktype text ,
	relation oid ,
	mode text ,
	tid xid ,
	vtid text ,
	pid integer ,
	blocking_pids integer[] ,
	granted boolean	
)
PARTITION BY RANGE (timepoint);

Оскільки в цьому випадку немає вимог щодо швидкості вставки, створено деякі індекси для прискорення створення звітів.

2.Заповнення поточної історії

Для безпосереднього збору знімків подання використовується bash скрипт, що запускає функцію plpgsql.

get_current_activity.sh

#!/bin/bash
#########################################################
#get_current_activity.sh

ERROR_FILE='/home/demon/get_current_activity'$(date +%Y%m%d-)'T'$(date +%H)$(date +%M)$(date +%S)
host=$1
s_name=$2
s_pass=$3

psql  -A -t -q -v ON_ERROR_STOP=1 -c "SELECT activity_hist.get_current_activity( '$host' , '$s_name' , '$s_pass' )" >/dev/null 2>$ERROR_FILE

line_count=`cat $ERROR_FILE | wc -l`
if [[ $line_count != '0' ]];
then
    rm -f /home/demon/*.err >/dev/null 2>/dev/null
	cp $ERROR_FILE $ERROR_FILE'.err' >/dev/null 2>/dev/null  
fi
rm $ERROR_FILE >/dev/null 2>/dev/null
exit 0

plpgsql функція dblink звертається до уявлень у цільової базі даних і вставляє рядки в сервісні таблиці в базі даних моніторингу.

get_current_activity.sql

CREATE OR REPLACE FUNCTION activity_hist.get_current_activity( current_host text , current_s_name text , current_s_pass text ) RETURNS BOOLEAN AS $$
DECLARE 
  database_rec record;
  dblink_str text ;
BEGIN   

	EXECUTE 'SELECT dblink_connect(''LINK1'',''host='||current_host||' port=5432 dbname=postgres'||
	                                         ' user='||current_s_name||' password='||current_s_pass|| ' '')';



--------------------------------------------------------------------
--GET pg_stat_activity stats
	INSERT INTO activity_hist.history_pg_stat_activity
	(
		SELECT * FROM dblink('LINK1',
			'SELECT 
			now() , 
			datid             , 
			datname           ,
			pid               ,
			usesysid              ,
			usename              ,
			application_name     ,
			client_addr          ,
			client_hostname      ,
			client_port       ,
			backend_start         ,
			xact_start            ,
			query_start           ,
			state_change          ,
			wait_event_type    ,                     
			wait_event         ,                   
			state              ,                  
			backend_xid         ,                 
			backend_xmin        ,                
			query              ,               
			backend_type   			
		FROM pg_stat_activity
		') 
		AS t (
		    timepoint 		  timestamp without time zone ,			
			datid             oid  , 
			datname           name ,
			pid               integer,
			usesysid          oid    ,
			usename           name   ,
			application_name  text   ,
			client_addr       inet   ,
			client_hostname   text   ,
			client_port       integer,
			backend_start     timestamp with time zone ,
			xact_start        timestamp with time zone ,
			query_start       timestamp with time zone ,
			state_change      timestamp with time zone ,
			wait_event_type   text ,                     
			wait_event        text ,                   
			state             text ,                  
			backend_xid       xid  ,                 
			backend_xmin      xid  ,                
			query             text ,               
			backend_type      text 			
		)
	);

---------------------------------------	
--ACTIVITY_HIST.HISTORY_LOCKING	
	INSERT INTO activity_hist.history_locking
	(
		SELECT * FROM dblink('LINK1',
			'SELECT 
			now() , 
			lock.locktype,
			lock.relation,
			lock.mode,
			lock.transactionid as tid,
			lock.virtualtransaction as vtid,
			lock.pid,
			pg_blocking_pids(lock.pid), 
			lock.granted
			FROM 	pg_catalog.pg_locks lock LEFT JOIN pg_catalog.pg_database db ON db.oid = lock.database
			WHERE NOT lock.pid = pg_backend_pid()	
		') 
		AS t (
			timepoint timestamp without time zone ,
			locktype text ,
			relation oid , 
			mode text ,
			tid xid ,
			vtid text ,
			pid integer ,
			blocking_pids integer[] ,
			granted boolean
		)
	);
	PERFORM dblink_disconnect('LINK1');
	
	RETURN TRUE ;
END
$$ LANGUAGE plpgsql;

Для збору знімків подання використовується systemd service, і два скрипти:

pg_current_activity.service

# /etc/systemd/system/pg_current_activity.service
[Unit]
Description=Collect history of pg_stat_activity , pg_locks 
Wants=pg_current_activity.timer

[Service]
Type=forking
StartLimitIntervalSec=0
ExecStart=/home/postgres/pgutils/demon/get_current_activity.sh 10.124.70.40 postgres postgres

[Install]
WantedBy=multi-user.target

pg_current_activity.timer

# /etc/systemd/system/pg_current_activity.timer
[Unit]
Description=Run pg_current_activity.sh every 1 second
Requires=pg_current_activity.service

[Timer]
Unit=pg_current_activity.service
OnCalendar=*:*:0/1
AccuracySec=1

[Install]
WantedBy=timers.target

Призначаємо права скриптам:
# chmod 755 pg_current_activity.timer
# chmod 755 pg_current_activity.service

Запускаємо сервіс:
# systemctl daemon-перезавантаження
# systemctl start pg_current_activity.service

Таким чином, історія уявлень збирається у вигляді щомиті знімків. Звичайно, якщо все залишити як є, таблиці дуже швидко збільшаться в розмірах і продуктивна робота стане неможлива.

Потрібно організувати архівування даних.

3. Архівування історії

Для архівації використовуються секційовані таблиці archive*.

Нові секції створюються щогодини, у своїй старі дані з таблиць history* видаляються, в такий спосіб, розмір таблиць history* сильно змінюється і швидкість вставки не деградується згодом.

Створення нових секцій виконується plpgsql функцією activity_hist.archive_current_activity. Алгоритм роботи дуже простий (з прикладу секції для таблиці archive_pg_stat_activity).

Створюємо та заповнюємо нову секцію

EXECUTE format(
'CREATE TABLE ' || partition_name || 
' PARTITION OF activity_hist.archive_pg_stat_activity FOR VALUES FROM ( %L ) TO ( %L ) ' , 
to_char(date_trunc('year', partition_min_range ),'YYYY')||'-'||
to_char(date_trunc('month', partition_min_range ),'MM')||'-'||
to_char(date_trunc('day', partition_min_range ),'DD')||' '||
to_char(date_trunc('hour', partition_min_range ),'HH24')||':00', 
to_char(date_trunc('year', partition_max_range ),'YYYY')||'-'||
to_char(date_trunc('month', partition_max_range ),'MM')||'-'||
to_char(date_trunc('day', partition_max_range ),'DD')||' '||
to_char(date_trunc('hour', partition_max_range ),'HH24')||':00'
);

INSERT INTO activity_hist.archive_pg_stat_activity
(
	SELECT 	* 
	FROM 	activity_hist.history_pg_stat_activity
	WHERE 	timepoint BETWEEN partition_min_range AND partition_max_range 		
);

Створюємо індекси

EXECUTE format	(
'CREATE INDEX '||index_name||
' ON '||partition_name||' ( wait_event_type , backend_type , timepoint )' 
);

EXECUTE format	('CREATE INDEX '||index_name||
' ON '||partition_name||' ( wait_event_type , backend_type , timepoint , queryid )' 
);

Видаляємо старі дані з таблиці history_pg_stat_activity

DELETE 
FROM 	activity_hist.history_pg_stat_activity
WHERE 	timepoint < partition_max_range;

Зрозуміло періодично, старі секції, через непотрібність видаляються.

Базові звіти

Власне для чого це все робиться. Для отримання звітів дуже віддалено, наближено нагадують AWR Oracle.

Важливо додати, щоб отримати звіти необхідно побудувати зв'язок між уявленнями pg_stat_activity і pg_stat_statements. Таблиці зв'язуються шляхом додавання таблиці 'history_pg_stat_activity', 'archive_pg_stat_activity' стовпця 'queryid'. Спосіб додавання значення стовпця виходить за рамки цієї статті і описаний тут. pg_stat_statements + pg_stat_activity + loq_query = pg_ash? .

TOTAL CPU TIME FOR QUERIES

Запит:

WITH hist AS
(
SELECT 
	aa.query ,aa.queryid ,			
	count(*) * interval '1 second' AS duration 
FROM 	activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND  pg_stat_history_end+(current_hour_diff * interval '1 hour')  AND backend_type = 'client backend' AND datname != 'postgres' AND	( aa.wait_event_type IS NULL  ) ANDaa.state = 'active'
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid		
UNION 
SELECT 
	ha.query ,ha.queryid,
	count(*) * interval '1 second' AS duration 
FROM 	activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour')  AND 	backend_type = 'client backend' AND datname != 'postgres' AND ( ha.wait_event_type IS NULL  )AND ha.state = 'active'
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid		
)
SELECT 	query , queryid , SUM( duration ) as duration 
FROM hist
GROUP BY  query , queryid 
ORDER BY 3 DESC

Приклад:

-------------------------------------------------------------------
| TOTAL CPU TIME FOR QUERIES : 07:47:36
+----+----------------------------------------+--------------------
|   #|                                 queryid|            duration
+----+----------------------------------------+--------------------
|   1|                      389015618226997618|            04:28:58
|   2|                                        |            01:07:29
|   3|                     1237430309438971376|            00:59:38
|   4|                     4710212362688288619|            00:50:48
|   5|                       28942442626229688|            00:15:50
|   6|                     9150846928388977274|            00:04:46
|   7|                    -6572922443698419129|            00:00:06
|   8|                                        |            00:00:01
+----+----------------------------------------+--------------------

TOTAL WAITINGS TIME FOR QUERIES

Запит:

WITH hist AS
(
SELECT 
	aa.query ,aa.queryid ,			
	count(*) * interval '1 second' AS duration 
FROM 	activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour')  AND 
	backend_type = 'client backend' AND datname != 'postgres' AND
	( aa.wait_event_type IS NOT NULL  ) 
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid		
UNION 
SELECT 
	ha.query ,ha.queryid,
	count(*) * interval '1 second' AS duration 
FROM 	activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour')  AND 
	backend_type = 'client backend' AND datname != 'postgres' AND				
	( ha.wait_event_type IS NOT NULL  )
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid		
)
SELECT 	query , queryid , SUM( duration ) as duration 
FROM hist
GROUP BY  query , queryid 
ORDER BY 3 DESC 

Приклад:

-------------------------------------------------------------------
| TOTAL WAITINGS TIME FOR QUERIES : 21:55:04
+----+----------------------------------------+--------------------
|   #|                                 queryid|            duration
+----+----------------------------------------+--------------------
|   1|                      389015618226997618|            16:19:05
|   2|                                        |            03:47:04
|   3|                     8085340880788646241|            00:40:20
|   4|                     4710212362688288619|            00:13:35
|   5|                     9150846928388977274|            00:12:25
|   6|                       28942442626229688|            00:11:32
|   7|                     1237430309438971376|            00:09:45
|   8|                     2649515222348904837|            00:09:37
|   9|                                        |            00:03:45
|  10|                     3167065002719415275|            00:02:20
|  11|                     5731212217001535134|            00:02:13
|  12|                     8304755792398128062|            00:01:31
|  13|                     2649515222348904837|            00:00:59
|  14|                     2649515222348904837|            00:00:22
|  15|                                        |            00:00:12
|  16|                     3422818749220588372|            00:00:08
|  17|                    -5730801771815999400|            00:00:03
|  18|                    -1473395109729441239|            00:00:02
|  19|                     2404820632950544954|            00:00:02
|  20|                    -6572922443698419129|            00:00:02
|  21|                     2369289265278398647|            00:00:01
|  22|                      180077086776069052|            00:00:01
+----+----------------------------------------+--------------------

WAITINGS FOR QUERIES

Запити:

WITH hist AS
(
SELECT 
	aa.wait_event_type , aa.wait_event 
FROM 	activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND 
	backend_type = 'client backend' AND datname != 'postgres' AND
	aa.wait_event IS NOT NULL 
GROUP BY aa.wait_event_type , aa.wait_event
UNION 
SELECT 
	ha.wait_event_type , ha.wait_event 
FROM 	activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND 
	backend_type = 'client backend' AND datname != 'postgres' AND
	ha.wait_event IS NOT NULL 
GROUP BY ha.wait_event_type , ha.wait_event		
)
SELECT 	wait_event_type , wait_event 
FROM hist
GROUP BY wait_event_type , wait_event
ORDER BY 1 ASC,2 ASC

----------------------------------------------------------------------

WITH hist AS
(
SELECT 
	aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid ,			
	count(*) * interval '1 second' AS duration 
FROM 	activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND 
	backend_type = 'client backend' AND datname != 'postgres' AND
	( aa.wait_event_type = waitings_stat_rec.wait_event_type AND aa.wait_event = waitings_stat_rec.wait_event )
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid		
UNION 
SELECT 
	ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid,
	count(*) * interval '1 second' AS duration 
FROM 	activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND 
	backend_type = 'client backend' AND datname != 'postgres' AND				
	( ha.wait_event_type = waitings_stat_rec.wait_event_type AND ha.wait_event = waitings_stat_rec.wait_event )
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid		
)
SELECT 	query , queryid , SUM( duration ) as duration 
FROM hist
GROUP BY  query , queryid 
ORDER BY 3 DESC

Приклад:

------------------------------------------------
| WAITINGS FOR QUERIES
+-----------------------------------------------
|                      wait_event_type = Client|
|                       wait_event = ClientRead|
|                        Total time  = 00:46:56|
------------------------------------------------
|    #|             queryid|            duration
+-----+--------------------+--------------------
|    1| 8085340880788646241|            00:40:20
|    2|                    |            00:03:45
|    3| 5731212217001535134|            00:01:53
|    4|                    |            00:00:12
|    5| 9150846928388977274|            00:00:09
|    6| 3422818749220588372|            00:00:08
|    7| 1237430309438971376|            00:00:06
|    8|   28942442626229688|            00:00:05
|    9| 4710212362688288619|            00:00:05
|   10|-5730801771815999400|            00:00:03
|   11| 8304755792398128062|            00:00:02
|   12|-6572922443698419129|            00:00:02
|   13|-1473395109729441239|            00:00:02
|   14| 2404820632950544954|            00:00:02
|   15|  180077086776069052|            00:00:01
|   16| 2369289265278398647|            00:00:01

+-----------------------------------------------
|                          wait_event_type = IO|
|                      wait_event = BufFileRead|
|                        Total time  = 00:00:38|
------------------------------------------------
|    #|             queryid|            duration
+-----+--------------------+--------------------
|    1|   28942442626229688|            00:00:38

+-----------------------------------------------

LOCKED PROCESSES HISTORY

Запит:

SELECT 
MIN(date_trunc('second',timepoint)) AS started , 
	count(*) * interval '1 second' as duration ,
	pid , blocking_pids , relation , mode , locktype 	 
FROM 
	activity_hist.archive_locking al 
WHERE 
	timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
	NOT granted AND 
	locktype = 'relation' 
GROUP BY pid , blocking_pids , relation , mode , locktype			
UNION
SELECT 
	MIN(date_trunc('second',timepoint)) AS started , 
	count(*) * interval '1 second' as duration ,
	pid , blocking_pids , relation , mode , locktype
FROM 
	activity_hist.history_locking 
WHERE 
	timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
	NOT granted AND 
	locktype = 'relation' 
GROUP BY pid , blocking_pids , relation , mode , locktype			
ORDER BY 1

Приклад:

-------------------------------------------------- -------------------------------------------------- --------------------------------- | LOCKED PROCESSES HISTORY +-----+----------+--------------------+-------- --+--------------------+--------------------+----- ---------------+-------------------- | #| pid| started| тривалість | blocking_pids| relation| mode| locktype +-----+----------+--------------------+---------- +--------------------+--------------------+------- -------------+-------------------- | 1| 26224 | 2019-09-02 19:32:16 | 00:01:45| {26211} | 16541 | AccessShareLock| relation | 2| 26390 | 2019-09-02 19:34:03 | 00:00:53 | {26211} | 16541 | AccessShareLock| relation | 3| 26391 | 2019-09-02 19:34:03 | 00:00:53 | {26211} | 16541 | AccessShareLock| relation | 4| 26531 | 2019-09-02 19:35:27 | 00:00:12| {26211} | 16541 | AccessShareLock| relation | 5| 27284 | 2019-09-02 19:44:02 | 00:00:19 | {27276} | 16541 | AccessShareLock| relation | 6| 27283 | 2019-09-02 19:44:02 | 00:00:19 | {27276} | 16541 | AccessShareLock| relation | 7| 27286 | 2019-09-02 19:44:02 | 00:00:19 | {27276} | 16541 | AccessShareLock| relation | 8| 27423 | 2019-09-02 19:45:24 | 00:00:12| {27394} | 16541 | AccessShareLock| relation | 9| 27648 | 2019-09-02 19:48:06 | 00:00:20 | {27647} | 16541 | AccessShareLock| relation | 10 | 27650 | 2019-09-02 19:48:06 | 00:00:20 | {27647} | 16541 | AccessShareLock| relation | 11 | 27735 | 2019-09-02 19:49:08 | 00:00:06 | {27650} | 16541 | AccessExclusiveLock| relation | 12 | 28380 | 2019-09-02 19:56:03 | 00:01:56| {28379} | 16541 | AccessShareLock| relation | 13 | 28379 | 2019-09-02 19:56:03 | 00:00:01 | 28377 | 16541 | AccessExclusiveLock| relation | | | | | 28376 | | 

BLOCKING PROCESSES HISTORY

Запити:

SELECT 
blocking_pids 
FROM 
	activity_hist.archive_locking al 
WHERE 
	timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
	NOT granted AND 
	locktype = 'relation' 
GROUP BY blocking_pids 		
UNION
SELECT 
	blocking_pids 
FROM 
	activity_hist.history_locking 
WHERE 
	timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
	NOT granted AND 
	locktype = 'relation' 
GROUP BY blocking_pids 		
ORDER BY 1

---------------------------------------------------------------

SELECT 
	pid , usename , application_name , datname ,
	MIN(date_trunc('second',timepoint)) as started , 
	count(*) * interval '1 second' as duration ,		 
	state , 
	query
				FROM  	activity_hist.archive_pg_stat_activity
				WHERE 	pid= current_pid AND 
						timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') 						 
				GROUP BY pid , usename , application_name , 
						datname , 
						state_change, 
						state , 
						query 
				UNION
				SELECT 
					pid , usename , application_name , datname ,
					MIN(date_trunc('second',timepoint)) as started , 
					count(*) * interval '1 second' as duration ,		 
					state , 
					query
				FROM  	activity_hist.history_pg_stat_activity_for_reports
				WHERE 	pid= current_pid AND 
						timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') 						 
				GROUP BY pid , usename , application_name , 
						datname , 
						state_change, 
						state , 
						query 
				ORDER BY 5 , 1

Приклад:

-------------------------------------------------- -------------------------------------------------- -------------------------------------------------- ----------------------- BLOCKING PROCESSES HISTORY +----+----------+------- ---+--------------------+----------+-------------- ------+--------------------+---------------------- --------+---------------------------------------- | #| pid| usename| application_name| datname| started| тривалість | state | query +----+----------+----------+--------------------+ ----------+--------------------+------------------ --+------------------------------+---------------- ------------------------ | 1| 26211 | tuser| psql | tdb1 | 2019-09-02 19:31:54 | 00:00:04 | idle| | 2| 26211 | tuser| psql | tdb1 | 2019-09-02 19:31:58 | 00:00:06 | idle in transaction| begin; | 3| 26211 | tuser| psql | tdb1 | 2019-09-02 19:32:16 | 00:01:45| idle in transaction| lock table wafer_data; | 4| 26211 | tuser| psql | tdb1 | 2019-09-02 19:35:54 | 00:01:23| idle| commit; | 5| 26211 | tuser| psql | tdb1 | 2019-09-02 19:38:46 | 00:00:02 | idle in transaction| begin; | 6| 26211 | tuser| psql | tdb1 | 2019-09-02 19:38:54 | 00:00:08 | idle in transaction| lock table wafer_data; | 7| 26211 | tuser| psql | tdb1 | 2019-09-02 19:39:08 | 00:42:42| idle| commit; | 8| 26211 | tuser| psql | tdb1 | 2019-09-03 07:12:07 | 00:00:52 | active| select test_del();

Розвиток.

Показані базові запити та одержувані звіти вже сильно полегшують життя при аналізі інцидентів продуктивності.
На основі базових запитів, можна отримати звіт, який наближено нагадує AWR Oracle.
Приклад зведеного звіту

+------------------------------------------------- ----------------------------------- | CONSOLIDATED REPORT FOR ACTIVITY AND WAITINGS . 

Далі буде. На черзі формування історії блокувань (pg_stat_locks), докладніший опис процесу заповнення таблиць.

Джерело: habr.com

Додати коментар або відгук