Vervolg van het artikel “
Het artikel zal onderzoeken en laten zien, met behulp van specifieke vragen en voorbeelden, welke nuttige informatie kan worden verkregen met behulp van de geschiedenis van de pg_locks-weergave.
Waarschuwing.
Vanwege de nieuwheid van het onderwerp en de onvoltooide testperiode kan het artikel fouten bevatten. Kritiek en commentaar zijn zeer welkom en worden verwacht.
Invoergegevens
Geschiedenis van pg_locks-weergave
archive_locking
CREATE TABLE archive_locking
( timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean ,
queryid bigint
);
In wezen is de tafel vergelijkbaar met de tafel archive_pg_stat_activiteit, hier in meer detail beschreven -
Om een kolom te vullen zoekopdrachtid functie wordt gebruikt
update_history_locking_by_queryid
--update_history_locking_by_queryid.sql
CREATE OR REPLACE FUNCTION update_history_locking_by_queryid() RETURNS boolean AS $$
DECLARE
result boolean ;
current_minute double precision ;
start_minute integer ;
finish_minute integer ;
start_period timestamp without time zone ;
finish_period timestamp without time zone ;
lock_rec record ;
endpoint_rec record ;
current_hour_diff double precision ;
BEGIN
RAISE NOTICE '***update_history_locking_by_queryid';
result = TRUE ;
current_minute = extract ( minute from now() );
SELECT * FROM endpoint WHERE is_need_monitoring
INTO endpoint_rec ;
current_hour_diff = endpoint_rec.hour_diff ;
IF current_minute < 5
THEN
RAISE NOTICE 'Current time is less than 5 minute.';
start_period = date_trunc('hour',now()) + (current_hour_diff * interval '1 hour');
finish_period = start_period - interval '5 minute' ;
ELSE
finish_minute = extract ( minute from now() ) / 5 ;
start_minute = finish_minute - 1 ;
start_period = date_trunc('hour',now()) + interval '1 minute'*start_minute*5+(current_hour_diff * interval '1 hour');
finish_period = date_trunc('hour',now()) + interval '1 minute'*finish_minute*5+(current_hour_diff * interval '1 hour') ;
END IF ;
RAISE NOTICE 'start_period = %', start_period;
RAISE NOTICE 'finish_period = %', finish_period;
FOR lock_rec IN
WITH act_queryid AS
(
SELECT
pid ,
timepoint ,
query_start AS started ,
MAX(timepoint) OVER (PARTITION BY pid , query_start ) AS finished ,
queryid
FROM
activity_hist.history_pg_stat_activity
WHERE
timepoint BETWEEN start_period and
finish_period
GROUP BY
pid ,
timepoint ,
query_start ,
queryid
),
lock_pids AS
(
SELECT
hl.pid ,
hl.locktype ,
hl.mode ,
hl.timepoint ,
MIN ( timepoint ) OVER (PARTITION BY pid , locktype ,mode ) as started
FROM
activity_hist.history_locking hl
WHERE
hl.timepoint between start_period and
finish_period
GROUP BY
hl.pid ,
hl.locktype ,
hl.mode ,
hl.timepoint
)
SELECT
lp.pid ,
lp.locktype ,
lp.mode ,
lp.timepoint ,
aq.queryid
FROM lock_pids lp LEFT OUTER JOIN act_queryid aq ON ( lp.pid = aq.pid AND lp.started BETWEEN aq.started AND aq.finished )
WHERE aq.queryid IS NOT NULL
GROUP BY
lp.pid ,
lp.locktype ,
lp.mode ,
lp.timepoint ,
aq.queryid
LOOP
UPDATE activity_hist.history_locking SET queryid = lock_rec.queryid
WHERE pid = lock_rec.pid AND locktype = lock_rec.locktype AND mode = lock_rec.mode AND timepoint = lock_rec.timepoint ;
END LOOP;
RETURN result ;
END
$$ LANGUAGE plpgsql;
toelichting: de waarde van de queryid-kolom wordt bijgewerkt in de history_locking-tabel, en wanneer er vervolgens een nieuwe partitie wordt gemaakt voor de archive_locking-tabel, wordt de waarde opgeslagen in de historische waarden.
Uitvoer
Algemene informatie over processen in het algemeen.
WACHTEN OP SLOTEN DOOR SLOTTYPES
onderzoek
WITH
t AS
(
SELECT
locktype ,
mode ,
count(*) as total
FROM
activity_hist.archive_locking
WHERE
timepoint between pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted
GROUP BY
locktype ,
mode
)
SELECT
locktype ,
mode ,
total * interval '1 second' as duration
FROM t
ORDER BY 3 DESC
Voorbeeld
| WACHTEN OP SLOTEN PER SLOTTYPES +-----------+---------------------- --------+ ------------------ | slottype| modus| duur +-------------------+------------------------ - --+------------------- | transactie-id| ShareLock| 19:39:26 | tupel| AccessExclusiveLock| 00:03:35 +------------------+--------------------- - -------+----------
HET NEMEN VAN SLOTEN DOOR SLOTTYPES
onderzoek
WITH
t AS
(
SELECT
locktype ,
mode ,
count(*) as total
FROM
activity_hist.archive_locking
WHERE
timepoint between pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
granted
GROUP BY
locktype ,
mode
)
SELECT
locktype ,
mode ,
total * interval '1 second' as duration
FROM t
ORDER BY 3 DESC
Voorbeeld
| HET NEMEN VAN SLOTEN PER SLOTTYPES +--------------------+---------------------- --------+------------------ | slottype| modus| duur +-------------------+------------------------ - --+------------------- | relatie| RowExclusiveLock| 51:11:10 | virtuelexid| ExclusiefSlot| 48:10:43 | transactie-id| ExclusiefSlot| 44:24:53 | relatie| ToegangDelenLock| 20:06:13 | tupel| AccessExclusiveLock| 17:58:47 | tupel| ExclusiefSlot| 01:40:41 | relatie| DeelUpdateExclusiefVergrendelen| 00:26:41 | voorwerp| RowExclusiveLock| 00:00:01 | transactie-id| ShareLock| 00:00:01 | verlengen| ExclusiefSlot| 00:00:01 +------------------+--------------------- - -------+----------
Gedetailleerde informatie over specifieke queryid-verzoeken
WACHTEN OP SLOTEN DOOR SLOTTYPES OP QUERYID
onderzoek
WITH
lt AS
(
SELECT
pid ,
locktype ,
mode ,
timepoint ,
queryid ,
blocking_pids ,
MIN ( timepoint ) OVER (PARTITION BY pid , locktype ,mode ) as started
FROM
activity_hist.archive_locking
WHERE
timepoint between pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND
pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
queryid IS NOT NULL
GROUP BY
pid ,
locktype ,
mode ,
timepoint ,
queryid ,
blocking_pids
)
SELECT
lt.pid ,
lt.locktype ,
lt.mode ,
lt.started ,
lt.queryid ,
lt.blocking_pids ,
COUNT(*) * interval '1 second' as duration
FROM lt
GROUP BY
lt.pid ,
lt.locktype ,
lt.mode ,
lt.started ,
lt.queryid ,
lt.blocking_pids
ORDER BY 4
Voorbeeld
| WACHTEN OP SLOTEN DOOR SLOTTYPES OP QUERYID +----------+----------+----- --------------- +--------------------------+--- ---------------- -+------------------+----------- --------- | pid| slottype| modus| begonnen| queryid| blocking_pids| duur +----------+------------------------+----------- ---------+--------------------------+--------- -- ---------+-------------------+--------------- -- - | 11288| transactie-id| ShareLock| 2019-09-17 10:00:00.302936| 389015618226997618| {11092}| 00:03:34 | 11626| transactie-id| ShareLock| 2019-09-17 10:00:21.380921| 389015618226997618| {12380}| 00:00:29 | 11626| transactie-id| ShareLock| 2019-09-17 10:00:21.380921| 389015618226997618| {11092}| 00:03:25 | 11626| transactie-id| ShareLock| 2019-09-17 10:00:21.380921| 389015618226997618| {12213}| 00:01:55 | 11626| transactie-id| ShareLock| 2019-09-17 10:00:21.380921| 389015618226997618| {12751}| 00:00:01 | 11629| transactie-id| ShareLock| 2019-09-17 10:00:24.331935| 389015618226997618| {11092}| 00:03:22 | 11629| transactie-id| ShareLock| 2019-09-17 10:00:24.331935| 389015618226997618| {12007}| 00:00:01 | 12007| transactie-id| ShareLock| 2019-09-17 10:05:03.327933| 389015618226997618| {11629}| 00:00:13 | 12007| transactie-id| ShareLock| 2019-09-17 10:05:03.327933| 389015618226997618| {11092}| 00:01:10 | 12007| transactie-id| ShareLock| 2019-09-17 10:05:03.327933| 389015618226997618| {11288}| 00:00:05 | 12213| transactie-id| ShareLock| 2019-09-17 10:06:07.328019| 389015618226997618| {12007}| 00:00:10
SLOTEN NEMEN OP SLOTTYPES OP QUERYID
onderzoek
WITH
lt AS
(
SELECT
pid ,
locktype ,
mode ,
timepoint ,
queryid ,
blocking_pids ,
MIN ( timepoint ) OVER (PARTITION BY pid , locktype ,mode ) as started
FROM
activity_hist.archive_locking
WHERE
timepoint between pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND
pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
granted AND
queryid IS NOT NULL
GROUP BY
pid ,
locktype ,
mode ,
timepoint ,
queryid ,
blocking_pids
)
SELECT
lt.pid ,
lt.locktype ,
lt.mode ,
lt.started ,
lt.queryid ,
lt.blocking_pids ,
COUNT(*) * interval '1 second' as duration
FROM lt
GROUP BY
lt.pid ,
lt.locktype ,
lt.mode ,
lt.started ,
lt.queryid ,
lt.blocking_pids
ORDER BY 4
Voorbeeld
| SLOTEN NEMEN OP SLOTTYPES OP QUERYID +----------+----------+------ --------------+ ---------------------------+---- ---------------+ -------------------+----------- -------- | pid| slottype| modus| begonnen| queryid| blocking_pids| duur +----------+------------------------+----------- ---------+--------------------------+--------- -- ---------+-------------------+--------------- -- - | 11288| relatie| RowExclusiveLock| 2019-09-17 10:00:00.302936| 389015618226997618| {11092}| 00:03:34 | 11092| transactie-id| ExclusiefSlot| 2019-09-17 10:00:00.302936| 389015618226997618| {}| 00:03:34 | 11288| relatie| RowExclusiveLock| 2019-09-17 10:00:00.302936| 389015618226997618| {}| 00:00:10 | 11092| relatie| RowExclusiveLock| 2019-09-17 10:00:00.302936| 389015618226997618| {}| 00:03:34 | 11092| virtuelexid| ExclusiefSlot| 2019-09-17 10:00:00.302936| 389015618226997618| {}| 00:03:34 | 11288| virtuelexid| ExclusiefSlot| 2019-09-17 10:00:00.302936| 389015618226997618| {11092}| 00:03:34 | 11288| transactie-id| ExclusiefSlot| 2019-09-17 10:00:00.302936| 389015618226997618| {11092}| 00:03:34 | 11288| tupel| AccessExclusiveLock| 2019-09-17 10:00:00.302936| 389015618226997618| {11092}| 00:03:34
Gebruik de vergrendelingsgeschiedenis om prestatie-incidenten te analyseren.
- Een verzoek met queryid=389015618226997618, uitgevoerd door een proces met pid=11288, wachtte op blokkering vanaf 2019-09-17 10:00:00 gedurende 3 minuten.
- Het slot werd vastgehouden door een proces met pid=11092
- Een proces met pid=11092 dat een verzoek uitvoert met queryid=389015618226997618 vanaf 2019-09-17 10:00:00 hield het slot gedurende 3 minuten vast.
Totaal
Nu hoop ik dat het meest interessante en nuttige deel zal beginnen: het verzamelen van statistieken en het analyseren van gevallen over de geschiedenis van wachten en blokkeren.
Ik wil geloven dat we in de toekomst een aantal aantekeningen zullen krijgen (vergelijkbaar met de metalink van Oracle).
Over het algemeen is het om deze reden dat de gebruikte methodiek zo snel mogelijk voor iedereen beschikbaar wordt gesteld.
Ik zal proberen het project in de nabije toekomst op github te plaatsen.
Bron: www.habr.com