ProHoster > Blog > διαχείριση > Μια προσπάθεια δημιουργίας ενός αναλόγου ASH για την PostgreSQL
Μια προσπάθεια δημιουργίας ενός αναλόγου ASH για την PostgreSQL
Δήλωση προβλήματος
Για τη βελτιστοποίηση των ερωτημάτων PostgreSQL, απαιτείται πολύ η δυνατότητα ανάλυσης ιστορικού δραστηριότητας, ειδικότερα, αναμονής, κλειδώματος και στατιστικών πινάκων.
επέκταση pgsentinel :
«Όλες οι συσσωρευμένες πληροφορίες αποθηκεύονται μόνο στη μνήμη RAM και η ποσότητα της μνήμης που καταναλώνεται ρυθμίζεται από τον αριθμό των τελευταίων αποθηκευμένων εγγραφών.
Προστίθεται το πεδίο queryid - το ίδιο ερώτημα από την επέκταση pg_stat_statements (απαιτείται προεγκατάσταση).«
Αυτό, φυσικά, θα βοηθούσε πολύ, αλλά το πιο ενοχλητικό είναι το πρώτο σημείο».Όλες οι συσσωρευμένες πληροφορίες αποθηκεύονται μόνο στη μνήμη RAM », δηλ. υπάρχει αντίκτυπος στη βάση στόχο. Επιπλέον, δεν υπάρχει ιστορικό κλειδώματος και στατιστικά πίνακα. Εκείνοι. η λύση είναι γενικά ημιτελής: "Δεν υπάρχει ακόμα έτοιμο πακέτο για εγκατάσταση. Προτείνεται να κατεβάσετε τις πηγές και να συναρμολογήσετε τη βιβλιοθήκη μόνοι σας. Πρώτα πρέπει να εγκαταστήσετε το πακέτο "devel" για τον διακομιστή σας και να ορίσετε τη διαδρομή σε pg_config στη μεταβλητή PATH.".
Γενικά, υπάρχει μεγάλη φασαρία και στην περίπτωση σοβαρών βάσεων δεδομένων παραγωγής, μπορεί να μην είναι δυνατό να γίνει κάτι με τον διακομιστή. Πρέπει να ξαναβρούμε κάτι δικό μας.
Προειδοποίηση.
Λόγω του σχετικά μεγάλου όγκου και λόγω της ελλιπούς περιόδου δοκιμών, το άρθρο έχει κυρίως ενημερωτικό χαρακτήρα, μάλλον ως σύνολο διατριβών και ενδιάμεσων αποτελεσμάτων.
Αναλυτικότερο υλικό θα ετοιμαστεί αργότερα, σε μέρη
Σχέδιο απαιτήσεων για τη λύση
Είναι απαραίτητο να αναπτύξετε ένα εργαλείο που σας επιτρέπει να αποθηκεύετε:
pg_stat_activity ιστορικό προβολής Ιστορικό κλειδώματος συνεδρίας χρησιμοποιώντας την προβολή pg_locks
Απαίτηση λύσης– ελαχιστοποιήστε τον αντίκτυπο στη βάση δεδομένων στόχο.
Γενική ιδέα– ο παράγοντας συλλογής δεδομένων εκκινείται όχι στη βάση δεδομένων προορισμού, αλλά στη βάση δεδομένων παρακολούθησης ως υπηρεσία systemd. Ναι, είναι δυνατή κάποια απώλεια δεδομένων, αλλά αυτό δεν είναι κρίσιμο για την αναφορά, αλλά δεν υπάρχει καμία επίδραση στη βάση δεδομένων προορισμού όσον αφορά τη μνήμη και το χώρο στο δίσκο. Και στην περίπτωση χρήσης μιας ομάδας σύνδεσης, ο αντίκτυπος στις διαδικασίες των χρηστών είναι ελάχιστος.
Στάδια υλοποίησης
1.Πίνακες εξυπηρέτησης
Χρησιμοποιείται ξεχωριστό σχήμα για την αποθήκευση πινάκων, ώστε να μην περιπλέκεται η ανάλυση των κύριων πινάκων που χρησιμοποιούνται.
DROP SCHEMA IF EXISTS activity_hist ;
CREATE SCHEMA activity_hist AUTHORIZATION monitor ;
Σημαντικό: Το σχήμα δεν δημιουργείται στη βάση δεδομένων προορισμού, αλλά στη βάση δεδομένων παρακολούθησης.
pg_stat_activity ιστορικό προβολής
Ένας πίνακας χρησιμοποιείται για την αποθήκευση των τρεχόντων στιγμιότυπων της προβολής pg_stat_activity
activity_hist.history_pg_stat_activity :
--ACTIVITY_HIST.HISTORY_PG_STAT_ACTIVITY
DROP TABLE IF EXISTS activity_hist.history_pg_stat_activity;
CREATE TABLE activity_hist.history_pg_stat_activity
(
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text ,
queryid bigint
);
Για να επιταχύνετε την εισαγωγή - χωρίς ευρετήρια ή περιορισμούς.
Για την αποθήκευση του ίδιου του ιστορικού, χρησιμοποιείται ένας πίνακας με διαμερίσματα:
activity_hist.archive_pg_stat_activity :
DROP TABLE IF EXISTS activity_hist.archive_pg_stat_activity;
CREATE TABLE activity_hist.archive_pg_stat_activity
(
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text ,
queryid bigint
)
PARTITION BY RANGE (timepoint);
Δεδομένου ότι σε αυτήν την περίπτωση δεν υπάρχουν απαιτήσεις για την ταχύτητα εισαγωγής, έχουν δημιουργηθεί ορισμένα ευρετήρια για την επιτάχυνση της δημιουργίας αναφορών.
Ιστορικό αποκλεισμού συνεδρίας
Ένας πίνακας χρησιμοποιείται για την αποθήκευση των τρεχόντων στιγμιότυπων κλειδωμάτων συνεδρίας:
activity_hist.history_locking :
--ACTIVITY_HIST.HISTORY_LOCKING
DROP TABLE IF EXISTS activity_hist.history_locking;
CREATE TABLE activity_hist.history_locking
(
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
);
Επίσης, για να επιταχυνθεί η εισαγωγή, δεν υπάρχουν ευρετήρια ή περιορισμοί.
Για την αποθήκευση του ίδιου του ιστορικού, χρησιμοποιείται ένας πίνακας με διαμερίσματα:
activity_hist.archive_locking:
DROP TABLE IF EXISTS activity_hist.archive_locking;
CREATE TABLE activity_hist.archive_locking
(
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
)
PARTITION BY RANGE (timepoint);
Δεδομένου ότι σε αυτήν την περίπτωση δεν υπάρχουν απαιτήσεις για την ταχύτητα εισαγωγής, έχουν δημιουργηθεί ορισμένα ευρετήρια για την επιτάχυνση της δημιουργίας αναφορών.
2.Συμπλήρωση του τρέχοντος ιστορικού
Για να συλλέξετε απευθείας στιγμιότυπα προβολής, χρησιμοποιείται ένα σενάριο bash που εκτελεί τη συνάρτηση plpgsql.
plpgsql Η συνάρτηση dblink έχει πρόσβαση σε προβολές στη βάση δεδομένων προορισμού και εισάγει σειρές σε πίνακες υπηρεσιών στη βάση δεδομένων παρακολούθησης.
get_current_activity.sql
CREATE OR REPLACE FUNCTION activity_hist.get_current_activity( current_host text , current_s_name text , current_s_pass text ) RETURNS BOOLEAN AS $$
DECLARE
database_rec record;
dblink_str text ;
BEGIN
EXECUTE 'SELECT dblink_connect(''LINK1'',''host='||current_host||' port=5432 dbname=postgres'||
' user='||current_s_name||' password='||current_s_pass|| ' '')';
--------------------------------------------------------------------
--GET pg_stat_activity stats
INSERT INTO activity_hist.history_pg_stat_activity
(
SELECT * FROM dblink('LINK1',
'SELECT
now() ,
datid ,
datname ,
pid ,
usesysid ,
usename ,
application_name ,
client_addr ,
client_hostname ,
client_port ,
backend_start ,
xact_start ,
query_start ,
state_change ,
wait_event_type ,
wait_event ,
state ,
backend_xid ,
backend_xmin ,
query ,
backend_type
FROM pg_stat_activity
')
AS t (
timepoint timestamp without time zone ,
datid oid ,
datname name ,
pid integer,
usesysid oid ,
usename name ,
application_name text ,
client_addr inet ,
client_hostname text ,
client_port integer,
backend_start timestamp with time zone ,
xact_start timestamp with time zone ,
query_start timestamp with time zone ,
state_change timestamp with time zone ,
wait_event_type text ,
wait_event text ,
state text ,
backend_xid xid ,
backend_xmin xid ,
query text ,
backend_type text
)
);
---------------------------------------
--ACTIVITY_HIST.HISTORY_LOCKING
INSERT INTO activity_hist.history_locking
(
SELECT * FROM dblink('LINK1',
'SELECT
now() ,
lock.locktype,
lock.relation,
lock.mode,
lock.transactionid as tid,
lock.virtualtransaction as vtid,
lock.pid,
pg_blocking_pids(lock.pid),
lock.granted
FROM pg_catalog.pg_locks lock LEFT JOIN pg_catalog.pg_database db ON db.oid = lock.database
WHERE NOT lock.pid = pg_backend_pid()
')
AS t (
timepoint timestamp without time zone ,
locktype text ,
relation oid ,
mode text ,
tid xid ,
vtid text ,
pid integer ,
blocking_pids integer[] ,
granted boolean
)
);
PERFORM dblink_disconnect('LINK1');
RETURN TRUE ;
END
$$ LANGUAGE plpgsql;
Για τη συλλογή στιγμιότυπων προβολών, χρησιμοποιείται η υπηρεσία systemd και δύο σενάρια:
pg_current_activity.service
# /etc/systemd/system/pg_current_activity.service
[Unit]
Description=Collect history of pg_stat_activity , pg_locks
Wants=pg_current_activity.timer
[Service]
Type=forking
StartLimitIntervalSec=0
ExecStart=/home/postgres/pgutils/demon/get_current_activity.sh 10.124.70.40 postgres postgres
[Install]
WantedBy=multi-user.target
pg_current_activity.timer
# /etc/systemd/system/pg_current_activity.timer
[Unit]
Description=Run pg_current_activity.sh every 1 second
Requires=pg_current_activity.service
[Timer]
Unit=pg_current_activity.service
OnCalendar=*:*:0/1
AccuracySec=1
[Install]
WantedBy=timers.target
Έτσι, το ιστορικό των προβολών συλλέγεται με τη μορφή στιγμιότυπων δευτερόλεπτο προς δευτερόλεπτο. Φυσικά, αν όλα μείνουν ως έχουν, τα τραπέζια θα αυξηθούν πολύ γρήγορα σε μέγεθος και η περισσότερο ή λιγότερο παραγωγική εργασία θα γίνει αδύνατη.
Είναι απαραίτητο να οργανωθεί η αρχειοθέτηση δεδομένων.
3. Αρχειοθέτηση ιστορικού
Για την αρχειοθέτηση, χρησιμοποιείται το αρχείο διαμερισμένων πινάκων*.
Κάθε ώρα δημιουργούνται νέα διαμερίσματα, ενώ τα παλιά δεδομένα αφαιρούνται από τους πίνακες ιστορικού*, έτσι το μέγεθος των πινάκων ιστορικού* δεν αλλάζει πολύ και η ταχύτητα εισαγωγής δεν υποβαθμίζεται με την πάροδο του χρόνου.
Η δημιουργία νέων ενοτήτων πραγματοποιείται από τη συνάρτηση plpgsql activity_hist.archive_current_activity. Ο αλγόριθμος εργασίας είναι πολύ απλός (χρησιμοποιώντας το παράδειγμα της ενότητας για τον πίνακα archive_pg_stat_activity).
Δημιουργήστε και συμπληρώστε μια νέα ενότητα
EXECUTE format(
'CREATE TABLE ' || partition_name ||
' PARTITION OF activity_hist.archive_pg_stat_activity FOR VALUES FROM ( %L ) TO ( %L ) ' ,
to_char(date_trunc('year', partition_min_range ),'YYYY')||'-'||
to_char(date_trunc('month', partition_min_range ),'MM')||'-'||
to_char(date_trunc('day', partition_min_range ),'DD')||' '||
to_char(date_trunc('hour', partition_min_range ),'HH24')||':00',
to_char(date_trunc('year', partition_max_range ),'YYYY')||'-'||
to_char(date_trunc('month', partition_max_range ),'MM')||'-'||
to_char(date_trunc('day', partition_max_range ),'DD')||' '||
to_char(date_trunc('hour', partition_max_range ),'HH24')||':00'
);
INSERT INTO activity_hist.archive_pg_stat_activity
(
SELECT *
FROM activity_hist.history_pg_stat_activity
WHERE timepoint BETWEEN partition_min_range AND partition_max_range
);
Δημιουργία ευρετηρίων
EXECUTE format (
'CREATE INDEX '||index_name||
' ON '||partition_name||' ( wait_event_type , backend_type , timepoint )'
);
EXECUTE format ('CREATE INDEX '||index_name||
' ON '||partition_name||' ( wait_event_type , backend_type , timepoint , queryid )'
);
Αφαίρεση παλαιών δεδομένων από τον πίνακα history_pg_stat_activity
DELETE
FROM activity_hist.history_pg_stat_activity
WHERE timepoint < partition_max_range;
Φυσικά, κατά καιρούς, παλιές ενότητες διαγράφονται ως περιττές.
Βασικές αναφορές
Αλήθεια, γιατί γίνονται όλα αυτά; Για να λάβετε αναφορές που θυμίζουν πολύ αόριστα το AWR της Oracle.
Είναι σημαντικό να προσθέσετε ότι για να λαμβάνετε αναφορές, πρέπει να δημιουργήσετε μια σύνδεση μεταξύ των προβολών pg_stat_activity και pg_stat_statements. Οι πίνακες συνδέονται προσθέτοντας μια στήλη "queryid" στους πίνακες "history_pg_stat_activity", "archive_pg_stat_activity". Η μέθοδος προσθήκης τιμής στήλης ξεφεύγει από το πεδίο εφαρμογής αυτού του άρθρου και περιγράφεται εδώ − pg_stat_statements + pg_stat_activity + loq_query = pg_ash; .
ΣΥΝΟΛΙΚΟΣ ΧΡΟΝΟΣ CPU ΓΙΑ ΕΡΩΤΗΣΕΙΣ
Αίτηση :
WITH hist AS
(
SELECT
aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND backend_type = 'client backend' AND datname != 'postgres' AND ( aa.wait_event_type IS NULL ) ANDaa.state = 'active'
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND backend_type = 'client backend' AND datname != 'postgres' AND ( ha.wait_event_type IS NULL )AND ha.state = 'active'
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
WITH hist AS
(
SELECT
aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( aa.wait_event_type IS NOT NULL )
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( ha.wait_event_type IS NOT NULL )
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
WITH hist AS
(
SELECT
aa.wait_event_type , aa.wait_event
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
aa.wait_event IS NOT NULL
GROUP BY aa.wait_event_type , aa.wait_event
UNION
SELECT
ha.wait_event_type , ha.wait_event
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
ha.wait_event IS NOT NULL
GROUP BY ha.wait_event_type , ha.wait_event
)
SELECT wait_event_type , wait_event
FROM hist
GROUP BY wait_event_type , wait_event
ORDER BY 1 ASC,2 ASC
----------------------------------------------------------------------
WITH hist AS
(
SELECT
aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid ,
count(*) * interval '1 second' AS duration
FROM activity_hist.archive_pg_stat_activity aa
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( aa.wait_event_type = waitings_stat_rec.wait_event_type AND aa.wait_event = waitings_stat_rec.wait_event )
GROUP BY aa.wait_event_type , aa.wait_event , aa.query ,aa.queryid
UNION
SELECT
ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid,
count(*) * interval '1 second' AS duration
FROM activity_hist.history_pg_stat_activity_for_reports ha
WHERE timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
backend_type = 'client backend' AND datname != 'postgres' AND
( ha.wait_event_type = waitings_stat_rec.wait_event_type AND ha.wait_event = waitings_stat_rec.wait_event )
GROUP BY ha.wait_event_type , ha.wait_event , ha.query ,ha.queryid
)
SELECT query , queryid , SUM( duration ) as duration
FROM hist
GROUP BY query , queryid
ORDER BY 3 DESC
SELECT
MIN(date_trunc('second',timepoint)) AS started ,
count(*) * interval '1 second' as duration ,
pid , blocking_pids , relation , mode , locktype
FROM
activity_hist.archive_locking al
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY pid , blocking_pids , relation , mode , locktype
UNION
SELECT
MIN(date_trunc('second',timepoint)) AS started ,
count(*) * interval '1 second' as duration ,
pid , blocking_pids , relation , mode , locktype
FROM
activity_hist.history_locking
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY pid , blocking_pids , relation , mode , locktype
ORDER BY 1
SELECT
blocking_pids
FROM
activity_hist.archive_locking al
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY blocking_pids
UNION
SELECT
blocking_pids
FROM
activity_hist.history_locking
WHERE
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour') AND
NOT granted AND
locktype = 'relation'
GROUP BY blocking_pids
ORDER BY 1
---------------------------------------------------------------
SELECT
pid , usename , application_name , datname ,
MIN(date_trunc('second',timepoint)) as started ,
count(*) * interval '1 second' as duration ,
state ,
query
FROM activity_hist.archive_pg_stat_activity
WHERE pid= current_pid AND
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour')
GROUP BY pid , usename , application_name ,
datname ,
state_change,
state ,
query
UNION
SELECT
pid , usename , application_name , datname ,
MIN(date_trunc('second',timepoint)) as started ,
count(*) * interval '1 second' as duration ,
state ,
query
FROM activity_hist.history_pg_stat_activity_for_reports
WHERE pid= current_pid AND
timepoint BETWEEN pg_stat_history_begin+(current_hour_diff * interval '1 hour') AND pg_stat_history_end+(current_hour_diff * interval '1 hour')
GROUP BY pid , usename , application_name ,
datname ,
state_change,
state ,
query
ORDER BY 5 , 1
Τα βασικά ερωτήματα που εμφανίζονται και οι αναφορές που προκύπτουν κάνουν ήδη τη ζωή πολύ πιο εύκολη κατά την ανάλυση περιστατικών απόδοσης.
Με βάση βασικά ερωτήματα, μπορείτε να λάβετε μια αναφορά που μοιάζει αόριστα με το AWR της Oracle. Παράδειγμα συνοπτικής αναφοράς
+------------------------------------------------- ------------------------------------ | ΕΝΟΠΟΙΗΜΕΝΗ ΕΚΘΕΣΗ ΓΙΑ ΔΡΑΣΤΗΡΙΟΤΗΤΑ ΚΑΙ ΑΝΑΜΟΝΕΣ.
Συνεχίζεται. Στη συνέχεια ακολουθεί η δημιουργία ενός ιστορικού κλειδώματος (pg_stat_locks), μια πιο λεπτομερής περιγραφή της διαδικασίας πλήρωσης πινάκων.