PostgreSQL için bir ASH analogu oluşturma girişimi
Sorunun formüle edilmesi
PostgreSQL sorgularını optimize etmek için etkinlik geçmişini, özellikle beklemeleri, kilitleri ve tablo istatistiklerini analiz etme yeteneği çok gereklidir.
pgsentinel uzantısı :
«Birikmiş tüm bilgiler yalnızca RAM'de saklanır ve tüketilen bellek miktarı, en son saklanan kayıtların sayısına göre düzenlenir.
Sorgu kimliği alanı eklendi - pg_stat_statements uzantısındaki sorgu kimliğiyle aynı (ön kurulum gereklidir).«
Bunun elbette çok faydası olur ama en sıkıntılı olanı ilk noktadır.”Birikmiş tüm bilgiler yalnızca RAM'de saklanır ”, yani Hedef kitle üzerinde bir etkisi var. Ayrıca kilit geçmişi ve tablo istatistikleri yoktur. Onlar. çözüm genel anlamda eksik: "Henüz kurulum için hazır bir paket bulunmamaktadır. Kaynakları indirmeniz ve kütüphaneyi kendiniz oluşturmanız önerilir. Öncelikle sunucunuz için “devel” paketini kurmanız ve PATH değişkeninde yolu pg_config olarak ayarlamanız gerekiyor. anlayışının sonucu olarak, buzdolabında iki üç günden fazla durmayan küçük şişeler elinizin altında bulunur.
Genel olarak çok fazla yaygara var ve ciddi üretim veritabanları söz konusu olduğunda sunucuyla herhangi bir şey yapmak mümkün olmayabilir. Tekrar kendimize ait bir şeyler bulmalıyız.
Uyarı.
Oldukça büyük hacim ve eksik test süresi nedeniyle makale, bir dizi tez ve ara sonuçlardan ziyade esas olarak bilgilendirme amaçlıdır.
Daha ayrıntılı materyal daha sonra parçalar halinde hazırlanacaktır.
Çözüm için taslak gereksinimler
Aşağıdakileri saklamanıza izin veren bir araç geliştirmek gereklidir:
pg_stat_activity görüntüleme geçmişi pg_locks görünümünü kullanarak oturum kilitleme geçmişi
Çözüm gereksinimi–hedef veritabanı üzerindeki etkiyi en aza indirin.
Genel fikir– veri toplama aracısı hedef veritabanında değil, izleme veritabanında bir systemd hizmeti olarak başlatılır. Evet, bir miktar veri kaybı mümkündür ancak bu raporlama açısından kritik değildir ancak hedef veritabanı üzerinde bellek ve disk alanı açısından herhangi bir etkisi yoktur. Bağlantı havuzu kullanılması durumunda kullanıcı süreçleri üzerindeki etki minimum düzeydedir.
Uygulama aşamaları
1.Servis tabloları
Kullanılan ana tabloların analizini karmaşıklaştırmamak amacıyla tabloları depolamak için ayrı bir şema kullanılır.
DROP SCHEMA IF EXISTS activity_hist ;
CREATE SCHEMA activity_hist AUTHORIZATION monitor ;
Önemli: Şema hedef veritabanında değil, izleme veritabanında oluşturulur.
pg_stat_activity görüntüleme geçmişi
pg_stat_activity görünümünün mevcut anlık görüntülerini saklamak için bir tablo kullanılır
Activity_hist.history_pg_stat_activity:
--ACTIVITY_HIST.HISTORY_PG_STAT_ACTIVITY
DROP TABLE IF EXISTS activity_hist.history_pg_stat_activity;
CREATE TABLE activity_hist.history_pg_stat_activity
(
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text ,
queryid bigint
);
Eklemeyi hızlandırmak için - indeks veya kısıtlama yok.
Geçmişin kendisini saklamak için bölümlenmiş bir tablo kullanılır:
Activity_hist.archive_pg_stat_activity:
DROP TABLE IF EXISTS activity_hist.archive_pg_stat_activity;
CREATE TABLE activity_hist.archive_pg_stat_activity
(
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text ,
queryid bigint
)
PARTITION BY RANGE (timepoint);
Bu durumda ekleme hızına gerek olmadığından raporların oluşturulmasını hızlandırmak için bazı dizinler oluşturulmuştur.
Oturum engelleme geçmişi
Oturum kilitlerinin geçerli anlık görüntülerini depolamak için bir tablo kullanılır:
Activity_hist.history_locking:
--ACTIVITY_HIST.HISTORY_LOCKING
DROP TABLE IF EXISTS activity_hist.history_locking;
CREATE TABLE activity_hist.history_locking
(
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
);
Ayrıca ekleme işlemini hızlandırmak için herhangi bir dizin veya kısıtlama yoktur.
Geçmişin kendisini saklamak için bölümlenmiş bir tablo kullanılır:
Activity_hist.archive_locking:
DROP TABLE IF EXISTS activity_hist.archive_locking;
CREATE TABLE activity_hist.archive_locking
(
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
)
PARTITION BY RANGE (timepoint);
Bu durumda ekleme hızına gerek olmadığından raporların oluşturulmasını hızlandırmak için bazı dizinler oluşturulmuştur.
2.Mevcut geçmişi doldurma
Görünüm anlık görüntülerini doğrudan toplamak için plpgsql işlevini çalıştıran bir bash betiği kullanılır.
plpgsql dblink işlevi, hedef veritabanındaki görünümlere erişir ve izleme veritabanındaki hizmet tablolarına satırlar ekler.
get_current_activity.sql
CREATE OR REPLACE FUNCTION activity_hist.get_current_activity( current_host text , current_s_name text , current_s_pass text ) RETURNS BOOLEAN AS $$
DECLARE
database_rec record;
dblink_str text ;
BEGIN
EXECUTE 'SELECT dblink_connect(''LINK1'',''host='||current_host||' port=5432 dbname=postgres'||
' user='||current_s_name||' password='||current_s_pass|| ' '')';
--------------------------------------------------------------------
--GET pg_stat_activity stats
INSERT INTO activity_hist.history_pg_stat_activity
(
SELECT * FROM dblink('LINK1',
'SELECT
now() ,
datid ,
datname ,
pid ,
usesysid ,
usename ,
application_name ,
client_addr ,
client_hostname ,
client_port ,
backend_start ,
xact_start ,
query_start ,
state_change ,
wait_event_type ,
wait_event ,
state ,
backend_xid ,
backend_xmin ,
query ,
backend_type
FROM pg_stat_activity
')
AS t (
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text
)
);
---------------------------------------
--ACTIVITY_HIST.HISTORY_LOCKING
INSERT INTO activity_hist.history_locking
(
SELECT * FROM dblink('LINK1',
'SELECT
now() ,
lock.locktype,
lock.relation,
lock.mode,
lock.transactionid as tid,
lock.virtualtransaction as vtid,
lock.pid,
pg_blocking_pids(lock.pid),
lock.granted
FROM pg_catalog.pg_locks lock LEFT JOIN pg_catalog.pg_database db ON db.oid = lock.database
WHERE NOT lock.pid = pg_backend_pid()
')
AS t (
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
)
);
PERFORM dblink_disconnect('LINK1');
RETURN TRUE ;
END
$$ LANGUAGE plpgsql;
Görünüm anlık görüntülerini toplamak için systemd hizmeti ve iki komut dosyası kullanılır:
pg_current_activity.service
# /etc/systemd/system/pg_current_activity.service
[Unit]
Description=Collect history of pg_stat_activity , pg_locks
Wants=pg_current_activity.timer
[Service]
Type=forking
StartLimitIntervalSec=0
ExecStart=/home/postgres/pgutils/demon/get_current_activity.sh 10.124.70.40 postgres postgres
[Install]
WantedBy=multi-user.target
pg_current_activity.timer
# /etc/systemd/system/pg_current_activity.timer
[Unit]
Description=Run pg_current_activity.sh every 1 second
Requires=pg_current_activity.service
[Timer]
Unit=pg_current_activity.service
OnCalendar=*:*:0/1
AccuracySec=1
[Install]
WantedBy=timers.target
Hizmeti başlatalım:
# systemctl daemon yeniden yükle
# systemctl pg_current_activity.service'i başlat
Böylece görüşlerin geçmişi saniye saniye anlık görüntüler şeklinde toplanır. Elbette her şey olduğu gibi bırakılırsa masaların boyutları çok hızlı artacak ve az ya da çok verimli çalışma imkansız hale gelecektir.
Veri arşivlemesini düzenlemek gerekir.
3. Arşivleme geçmişi
Arşivleme için bölümlenmiş tablolar arşivi* kullanılır.
Her saat başı yeni bölümler oluşturulurken, geçmiş* tablolarından eski veriler kaldırılır, böylece geçmiş* tablolarının boyutu fazla değişmez ve ekleme hızı zamanla azalmaz.
Yeni bölümlerin oluşturulması, plpgsql işlevi active_hist.archive_current_activity tarafından gerçekleştirilir. İşin algoritması çok basittir (archive_pg_stat_activity tablosu için bölüm örneğini kullanarak).
Yeni bir bölüm oluşturun ve doldurun
EXECUTE format(
'CREATE TABLE ' || partition_name ||
' PARTITION OF activity_hist.archive_pg_stat_activity FOR VALUES FROM ( %L ) TO ( %L ) ' ,
to_char(date_trunc('year', partition_min_range ),'YYYY')||'-'||
to_char(date_trunc('month', partition_min_range ),'MM')||'-'||
to_char(date_trunc('day', partition_min_range ),'DD')||' '||
to_char(date_trunc('hour', partition_min_range ),'HH24')||':00',
to_char(date_trunc('year', partition_max_range ),'YYYY')||'-'||
to_char(date_trunc('month', partition_max_range ),'MM')||'-'||
to_char(date_trunc('day', partition_max_range ),'DD')||' '||
to_char(date_trunc('hour', partition_max_range ),'HH24')||':00'
);
INSERT INTO activity_hist.archive_pg_stat_activity
(
SELECT *
FROM activity_hist.history_pg_stat_activity
WHERE timepoint BETWEEN partition_min_range AND partition_max_range
);
Dizin oluşturma
EXECUTE format (
'CREATE INDEX '||index_name||
' ON '||partition_name||' ( wait_event_type , backend_type , timepoint )'
);
EXECUTE format ('CREATE INDEX '||index_name||
' ON '||partition_name||' ( wait_event_type , backend_type , timepoint , queryid )'
);
History_pg_stat_activity tablosundan eski verileri kaldırma
DELETE
FROM activity_hist.history_pg_stat_activity
WHERE timepoint < partition_max_range;
Elbette zaman zaman eski bölümler gereksiz olduğu için silinmektedir.
Temel raporlar
Aslında tüm bunlar neden yapılıyor? Oracle'ın AWR'sini çok belirsiz anımsatan raporlar elde etmek.
Rapor alabilmek için pg_stat_activity ve pg_stat_statements görünümleri arasında bir bağlantı kurmanız gerektiğini eklemek önemlidir. Tablolar, 'history_pg_stat_activity', 'archive_pg_stat_activity' tablolarına bir 'queryid' sütunu eklenerek bağlanır. Sütun değeri ekleme yöntemi bu makalenin kapsamı dışındadır ve burada açıklanmaktadır – pg_stat_statements + pg_stat_activity + loq_query = pg_ash? .
SORULAR İÇİN TOPLAM CPU SÜRESİ
Rica etmek :
WITH hist AS
(
SELECT
aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND backend_type = 'client backend' AND datname != 'postgres' AND ( aa.wait_event_type IS NULL ) ANDaa.state = 'active'
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND backend_type = 'client backend' AND datname != 'postgres' AND ( ha.wait_event_type IS NULL )AND ha.state = 'active'
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
WITH hist AS
(
SELECT
aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( aa.wait_event_type IS NOT NULL )
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( ha.wait_event_type IS NOT NULL )
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
WITH hist AS
(
SELECT
aa.wait_event_type , aa.wait_event
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
aa.wait_event IS NOT NULL
GROUP BY aa.wait_event_type , aa.wait_event
UNION
SELECT
ha.wait_event_type , ha.wait_event
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
ha.wait_event IS NOT NULL
GROUP BY ha.wait_event_type , ha.wait_event
)
SELECT wait_event_type , wait_event
FROM hist
GROUP BY wait_event_type , wait_event
ORDER BY 1 ASC,2 ASC
----------------------------------------------------------------------
WITH hist AS
(
SELECT
aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( aa.wait_event_type = waitings_stat_rec.wait_event_type AND aa.wait_event = waitings_stat_rec.wait_event )
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( ha.wait_event_type = waitings_stat_rec.wait_event_type AND ha.wait_event = waitings_stat_rec.wait_event )
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
SELECT
MIN(date_trunc('second',timepoint)) AS started ,
count(*) * interval '1 second' as duration ,
pid , blocking_pids , relation , mode , locktype
FROM
activity_hist.archive_locking al
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY pid , blocking_pids , relation , mode , locktype
UNION
SELECT
MIN(date_trunc('second',timepoint)) AS started ,
count(*) * interval '1 second' as duration ,
pid , blocking_pids , relation , mode , locktype
FROM
activity_hist.history_locking
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY pid , blocking_pids , relation , mode , locktype
ORDER BY 1
SELECT
blocking_pids
FROM
activity_hist.archive_locking al
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY blocking_pids
UNION
SELECT
blocking_pids
FROM
activity_hist.history_locking
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY blocking_pids
ORDER BY 1
---------------------------------------------------------------
SELECT
pid , usename , application_name , datname ,
MIN(date_trunc('second',timepoint)) as started ,
count(*) * interval '1 second' as duration ,
state ,
query
FROM activity_hist.archive_pg_stat_activity
WHERE pid= current_pid AND
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour')
GROUP BY pid , usename , application_name ,
datname ,
state_change,
state ,
query
UNION
SELECT
pid , usename , application_name , datname ,
MIN(date_trunc('second',timepoint)) as started ,
count(*) * interval '1 second' as duration ,
state ,
query
FROM activity_hist.history_pg_stat_activity_for_reports
WHERE pid= current_pid AND
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour')
GROUP BY pid , usename , application_name ,
datname ,
state_change,
state ,
query
ORDER BY 5 , 1
Gösterilen temel sorgular ve sonuçta ortaya çıkan raporlar, performans olaylarını analiz ederken hayatı daha da kolaylaştırıyor.
Temel sorgulara dayanarak, Oracle'ın AWR'sine belli belirsiz benzeyen bir rapor alabilirsiniz. Özet rapor örneği
+------------------------------------------------ ----------------------------------- | FAALİYET VE BEKLEMELERE İLİŞKİN KONSOLİDE RAPOR.
Devam edecek. Sırada, tabloları doldurma sürecinin daha ayrıntılı bir açıklaması olan bir kilit geçmişinin (pg_stat_locks) oluşturulması yer alıyor.