วิศวกร - แปลจากภาษาละติน - ได้รับแรงบันดาลใจ
วิศวกรสามารถทำอะไรก็ได้ (ค) ร. ดีเซล.
Epigraphs
หรือเรื่องราวเกี่ยวกับสาเหตุที่ผู้ดูแลระบบฐานข้อมูลต้องจดจำการเขียนโปรแกรมในอดีต
คำปรารภ
เปลี่ยนชื่อหมดแล้ว การแข่งขันเป็นแบบสุ่ม เนื้อหาเป็นเพียงความคิดเห็นส่วนตัวของผู้เขียนเท่านั้น
ข้อจำกัดความรับผิดชอบของการรับประกัน: ในชุดบทความที่วางแผนไว้จะไม่มีคำอธิบายโดยละเอียดและถูกต้องของตารางและสคริปต์ที่ใช้ ไม่สามารถใช้วัสดุได้ทันที "ตามสภาพ"
ประการแรกเนื่องจากวัสดุจำนวนมาก
ประการที่สองเพราะความเฉียบคมด้วยฐานการผลิตของลูกค้าตัวจริง
ดังนั้นในบทความจะมีเฉพาะแนวคิดและคำอธิบายในรูปแบบทั่วไปเท่านั้น
บางทีในอนาคตระบบจะเติบโตถึงระดับการโพสต์บน GitHub หรืออาจจะไม่ เวลาจะแสดง
จุดเริ่มต้นของเรื่องราว -
เกิดอะไรขึ้น ในแง่ทั่วไปที่สุด - "
ทำไมฉันถึงต้องการทั้งหมดนี้?
ประการแรกเพื่อไม่ให้ลืมตัวเองจำวันที่รุ่งโรจน์ในวัยเกษียณ
ประการที่สอง เพื่อจัดระบบสิ่งที่เขียน สำหรับตัวเองแล้วบางทีก็เริ่มสับสนจนลืมแยกส่วน
และที่สำคัญที่สุด - ทันใดนั้นมันก็มีประโยชน์สำหรับใครบางคนและช่วยไม่ต้องคิดค้นล้อใหม่และไม่เก็บคราด กล่าวอีกนัยหนึ่ง ปรับปรุงกรรมของคุณ (ไม่ใช่ Khabrovsky) เพราะสิ่งที่มีค่าที่สุดในโลกนี้คือความคิด สิ่งสำคัญคือการหาความคิด และการแปลความคิดให้เป็นจริงนั้นเป็นประเด็นทางเทคนิคล้วนๆ
งั้นเรามาเริ่มกันช้าๆ...
การกำหนดปัญหา
มีอยู่:
PostgreSQL(10.5), โหลดแบบผสม (OLTP+DSS), โหลดปานกลางถึงเบา, โฮสต์ใน AWS Cloud
ไม่มีการตรวจสอบฐานข้อมูล การตรวจสอบโครงสร้างพื้นฐานจะแสดงเป็นเครื่องมือ AWS มาตรฐานในการกำหนดค่าขั้นต่ำ
มันเป็นสิ่งจำเป็น:
ตรวจสอบประสิทธิภาพและสถานะของฐานข้อมูล ค้นหาและมีข้อมูลเบื้องต้นเพื่อเพิ่มประสิทธิภาพการสืบค้นฐานข้อมูลจำนวนมาก
บทนำหรือการวิเคราะห์วิธีแก้ปัญหาโดยสังเขป
ในการเริ่มต้นให้ลองวิเคราะห์ตัวเลือกสำหรับการแก้ปัญหาจากมุมมองของการวิเคราะห์เปรียบเทียบผลประโยชน์และปัญหาสำหรับวิศวกรและปล่อยให้ผู้ที่ควรจะอยู่ในรายชื่อพนักงานจัดการกับผลประโยชน์และการสูญเสีย ของการจัดการ
ตัวเลือก 1 - "ทำงานตามความต้องการ"
เราปล่อยให้ทุกอย่างเหมือนเดิม หากลูกค้าไม่พอใจกับสุขภาพ ประสิทธิภาพของฐานข้อมูลหรือแอปพลิเคชัน ลูกค้าจะแจ้งวิศวกรของ DBA ทางอีเมลหรือโดยการสร้างเหตุการณ์ในกล่องตั๋ว
วิศวกรที่ได้รับการแจ้งเตือนจะเข้าใจปัญหา เสนอวิธีแก้ไข หรือระงับปัญหา โดยหวังว่าทุกอย่างจะคลี่คลายเอง และอย่างไรก็ตาม ทุกอย่างจะถูกลืมในไม่ช้า
ขนมปังขิงและโดนัท รอยฟกช้ำและการกระแทกขนมปังขิงและโดนัท:
1. ไม่มีอะไรพิเศษให้ทำ
2. มีโอกาสที่จะออกไปทำสกปรกได้เสมอ
3. มีเวลามากมายที่คุณสามารถใช้ด้วยตัวเอง
รอยฟกช้ำและการกระแทก:
1. ไม่ช้าก็เร็ว ลูกค้าจะคิดถึงแก่นแท้ของความเป็นอยู่และความยุติธรรมสากลในโลกนี้ และถามตัวเองอีกครั้งว่า - ทำไมฉันถึงจ่ายเงินให้พวกเขา ผลที่ตามมาก็เหมือนเดิม คำถามเดียวคือเมื่อลูกค้าเบื่อและโบกมือลา และตัวป้อนว่างเปล่า มันเป็นเรื่องน่าเศร้า
2. การพัฒนาวิศวกรเป็นศูนย์
3. ความยากลำบากในการจัดตารางงานและการโหลด
ตัวเลือก 2 -“ เต้นรำกับรำมะนาสวมและสวมรองเท้า”
วรรค 1-ทำไมเราต้องมีระบบตรวจสอบ เราจะรับทุกคำขอ เราเปิดตัวการสืบค้นทุกประเภทไปยังพจนานุกรมข้อมูลและมุมมองแบบไดนามิก เปิดใช้งานตัวนับทุกประเภท นำทุกอย่างมาไว้ในตาราง วิเคราะห์รายการและตารางเป็นระยะ ๆ เหมือนเดิม เป็นผลให้เรามีกราฟตารางรายงานที่สวยงามหรือไม่มากนัก สิ่งสำคัญ - นั่นจะมากขึ้นและมากขึ้น
วรรค 2- สร้างกิจกรรม - เรียกใช้การวิเคราะห์ทั้งหมดนี้
วรรค 3- เรากำลังเตรียมเอกสารบางอย่าง เราเรียกเอกสารนี้ง่ายๆ ว่า - "เราจะเตรียมฐานข้อมูลอย่างไร"
วรรค 4- ลูกค้าที่เห็นความยิ่งใหญ่ของกราฟและตัวเลขเหล่านี้ มีความมั่นใจแบบเด็กๆ ที่ไร้เดียงสา ตอนนี้ทุกอย่างจะได้ผลสำหรับเราในไม่ช้า และเป็นส่วนหนึ่งอย่างง่ายดายและไม่ลำบากกับทรัพยากรทางการเงินของพวกเขา ฝ่ายบริหารยังมั่นใจว่าวิศวกรของเราทำงานอย่างหนัก กำลังโหลดสูงสุด
วรรค 5- ทำซ้ำขั้นตอนที่ 1 อย่างสม่ำเสมอ
ขนมปังขิงและโดนัท รอยฟกช้ำและการกระแทกขนมปังขิงและโดนัท:
1. ชีวิตของผู้จัดการและวิศวกรนั้นเรียบง่าย คาดเดาได้ และเต็มไปด้วยกิจกรรม ทุกอย่างวุ่นวาย ทุกคนยุ่ง
2. ชีวิตของลูกค้าก็ไม่เลวเช่นกัน - เขามั่นใจเสมอว่าคุณต้องอดทนสักนิดแล้วทุกอย่างจะออกมาดี ไม่ดีขึ้นก็ดี - โลกนี้ไม่ยุติธรรมในชาติหน้า - โชคดี
รอยฟกช้ำและการกระแทก:
1. ไม่ช้าก็เร็ว จะมีผู้ให้บริการที่คล้ายคลึงกันซึ่งฉลาดกว่าซึ่งจะทำสิ่งเดียวกันแต่ถูกกว่าเล็กน้อย และถ้าผลลัพธ์เหมือนกันจะจ่ายแพงกว่าทำไม ซึ่งจะนำไปสู่การหายไปของตัวป้อนอีกครั้ง
2. มันน่าเบื่อ กิจกรรมเล็กๆ น้อยๆ ที่มีความหมายช่างน่าเบื่อเสียนี่กระไร
3. เช่นเดียวกับในเวอร์ชันก่อนหน้า - ไม่มีการพัฒนา แต่สำหรับวิศวกร ข้อเสียคือ คุณต้องสร้าง IDB อย่างต่อเนื่อง ซึ่งไม่เหมือนกับตัวเลือกแรก และนั่นต้องใช้เวลา ที่สามารถใช้จ่ายเพื่อประโยชน์ของคนที่คุณรัก เพราะคุณดูแลตัวเองไม่ได้ ใครๆ ก็เป็นห่วงคุณ
ตัวเลือก 3-ไม่จำเป็นต้องประดิษฐ์จักรยาน คุณต้องซื้อและขี่มัน
วิศวกรจาก บริษัท อื่น ๆ กินพิซซ่ากับเบียร์อย่างรู้เท่าทัน (โอ้ยุครุ่งเรืองของเซนต์ปีเตอร์สเบิร์กในยุค 90) มาใช้ระบบตรวจสอบที่สร้างขึ้น ดีบั๊ก และใช้งานได้ ซึ่งโดยทั่วไปแล้วระบบเหล่านี้ก่อให้เกิดประโยชน์ (อย่างน้อยก็สำหรับผู้สร้าง)
ขนมปังขิงและโดนัท รอยฟกช้ำและการกระแทกขนมปังขิงและโดนัท:
1. ไม่ต้องเสียเวลาประดิษฐ์สิ่งที่ประดิษฐ์ไว้แล้ว รับและใช้
2. ระบบตรวจสอบไม่ได้เขียนโดยคนโง่ และแน่นอนว่ามันมีประโยชน์
3. ระบบตรวจสอบการทำงานมักจะให้ข้อมูลกรองที่เป็นประโยชน์
รอยฟกช้ำและการกระแทก:
1. วิศวกรในกรณีนี้ไม่ใช่วิศวกรแต่เป็นเพียงผู้ใช้ผลิตภัณฑ์ของผู้อื่น หรือผู้ใช้
2. ลูกค้าต้องเชื่อมั่นถึงความจำเป็นในการซื้อบางอย่างที่โดยทั่วไปเขาไม่ต้องการเข้าใจ และไม่ควร และโดยทั่วไปแล้วงบประมาณสำหรับปีได้รับการอนุมัติแล้วและจะไม่เปลี่ยนแปลง จากนั้นคุณต้องจัดสรรทรัพยากรแยกต่างหาก กำหนดค่าสำหรับระบบเฉพาะ เหล่านั้น. ก่อนอื่น คุณต้องจ่าย จ่ายแล้วจ่ายอีก และลูกค้าก็ขี้เหนียว นี่คือบรรทัดฐานของชีวิตนี้
จะทำอย่างไร Chernyshevsky? คำถามของคุณตรงประเด็นมาก (กับ)
ในกรณีนี้และสถานการณ์ปัจจุบัน คุณสามารถทำสิ่งที่ต่างออกไปเล็กน้อย - มาสร้างระบบตรวจสอบของเราเองกันเถอะ
แน่นอนว่าไม่ใช่ระบบ ในความหมายที่สมบูรณ์ของคำนี้ มันดังเกินไปและเกรงใจ แต่อย่างน้อยก็ทำให้มันง่ายขึ้นสำหรับตัวคุณเองและรวบรวมข้อมูลเพิ่มเติมเพื่อแก้ไขเหตุการณ์ด้านประสิทธิภาพ เพื่อไม่ให้ตัวเองตกอยู่ในสถานการณ์ - "ไปที่นั่น ฉันไม่รู้ว่าที่ไหน ค้นหา ฉันไม่รู้ว่าอะไร"
ข้อดีและข้อเสียของตัวเลือกนี้คืออะไร:
จุดเด่น:
1. มันน่าสนใจ อย่างน้อยก็น่าสนใจกว่าค่าคงที่ "ลดขนาดไฟล์ข้อมูล, แก้ไขพื้นที่ตาราง, ฯลฯ "
2. นี่คือทักษะใหม่และการพัฒนาใหม่ ซึ่งในอนาคตไม่ช้าก็เร็วจะให้ขนมปังขิงและโดนัทที่คู่ควร
จุดด้อย:
1. ต้องทำงาน ทำงานหนัก.
2. คุณจะต้องอธิบายความหมายและมุมมองของกิจกรรมทั้งหมดอย่างสม่ำเสมอ
3. จะต้องเสียสละบางอย่างเพราะทรัพยากรเดียวที่มีให้วิศวกร - เวลา - ถูก จำกัด โดยจักรวาล
4. แย่ที่สุดและไม่เป็นที่พอใจที่สุด - เป็นผลให้ขยะเช่น "ไม่ใช่หนูไม่ใช่กบ แต่เป็นสัตว์ตัวเล็ก ๆ ที่ไม่รู้จัก" อาจปรากฏขึ้น
ใครไม่เสี่ยงบ้างอย่าดื่มแชมเปญ
ความสนุกจึงเริ่มต้นขึ้น
แนวคิดทั่วไป - แผนผัง
(ภาพประกอบนำมาจากบทความ «
คำอธิบาย:
- ฐานข้อมูลเป้าหมายได้รับการติดตั้งด้วยส่วนขยาย PostgreSQL มาตรฐาน “pg_stat_statements”
- ในฐานข้อมูลการมอนิเตอร์ เราสร้างชุดของตารางบริการเพื่อจัดเก็บประวัติ pg_stat_statements ที่ระยะเริ่มต้น และเพื่อกำหนดค่าเมตริกและการมอนิเตอร์ในอนาคต
- บนโฮสต์การตรวจสอบ เราสร้างชุดของสคริปต์ทุบตี รวมถึงสคริปต์สำหรับสร้างเหตุการณ์ในระบบตั๋ว
โต๊ะบริการ
เริ่มต้นด้วย ERD ที่เรียบง่ายตามแผนผัง สิ่งที่เกิดขึ้นในตอนท้าย:
คำอธิบายสั้น ๆ ของตารางปลายทาง - โฮสต์ จุดเชื่อมต่อกับอินสแตนซ์
ฐานข้อมูล - ตัวเลือกฐานข้อมูล
pg_stat_history - ตารางประวัติสำหรับจัดเก็บภาพรวมชั่วคราวของมุมมอง pg_stat_statements ของฐานข้อมูลเป้าหมาย
metric_อภิธานศัพท์ - พจนานุกรมตัวชี้วัดประสิทธิภาพ
metric_config - การกำหนดค่าของแต่ละเมตริก
เมตริก - เมตริกเฉพาะสำหรับคำขอที่ถูกตรวจสอบ
metric_alert_history - ประวัติคำเตือนประสิทธิภาพ
log_query - ตารางบริการสำหรับจัดเก็บบันทึกการแยกวิเคราะห์จากไฟล์บันทึก PostgreSQL ที่ดาวน์โหลดจาก AWS
พื้นฐาน - พารามิเตอร์ของช่วงเวลาที่ใช้เป็นฐาน
ด่าน - การกำหนดค่าเมตริกสำหรับตรวจสอบสถานะของฐานข้อมูล
ด่าน_alert_history - ประวัติการเตือนของตัวชี้วัดการตรวจสอบสถานะฐานข้อมูล
pg_stat_db_queries — ตารางบริการของคำขอที่ใช้งานอยู่
บันทึกกิจกรรม — ตารางบริการบันทึกกิจกรรม
กับดัก - ตารางบริการการกำหนดค่ากับดัก
ขั้นที่ 1 - รวบรวมสถิติประสิทธิภาพและรับรายงาน
ตารางใช้เพื่อเก็บข้อมูลทางสถิติ pg_stat_history
โครงสร้างตาราง pg_stat_history
ตาราง "public.pg_stat_history" คอลัมน์ | พิมพ์ | ตัวแก้ไข ---------------------+-------------------- --+---- -------------------------------- รหัส | จำนวนเต็ม | ไม่ใช่ null เริ่มต้น nextval('pg_stat_history_id_seq'::regclass) snapshot_timestamp | การประทับเวลาโดยไม่มีเขตเวลา | ฐานข้อมูล_id | จำนวนเต็ม | dbid | ออยด์ | รหัสผู้ใช้ | ออยด์ | รหัสแบบสอบถาม | บิ๊กอินท์ | แบบสอบถาม | ข้อความ | โทร | บิ๊กอินท์ | total_time | ความแม่นยำสองเท่า | min_time | ความแม่นยำสองเท่า | max_time | ความแม่นยำสองเท่า | mean_time | ความแม่นยำสองเท่า | stddev_time | ความแม่นยำสองเท่า | แถว | บิ๊กอินท์ | shared_blks_hit | บิ๊กอินท์ | shared_blks_read | บิ๊กอินท์ | shared_blks_dirtied | บิ๊กอินท์ | shared_blks_written | บิ๊กอินท์ | local_blks_hit | บิ๊กอินท์ | local_blks_read | บิ๊กอินท์ | local_blks_dirtied | บิ๊กอินท์ | local_blks_written | บิ๊กอินท์ | temp_blks_read | บิ๊กอินท์ | temp_blks_written | บิ๊กอินท์ | blk_read_time | ความแม่นยำสองเท่า | blk_write_time | ความแม่นยำสองเท่า | baseline_id | จำนวนเต็ม | ดัชนี: "pg_stat_history_pkey" คีย์หลัก btree (id) "database_idx" btree (database_id) "queryid_idx" btree (queryid) "snapshot_timestamp_idx" btree (snapshot_timestamp) ข้อจำกัดคีย์ต่างประเทศ: "database_id_fk" FOREIGN KEY (database_id) REFERENCES ฐานข้อมูล (id ) เมื่อลบลำดับ
อย่างที่คุณเห็น ตารางเป็นเพียงข้อมูลมุมมองสะสม pg_stat_statements ในฐานข้อมูลเป้าหมาย
การใช้ตารางนี้ง่ายมาก
pg_stat_history จะแสดงสถิติสะสมของการดำเนินการค้นหาในแต่ละชั่วโมง ทุกต้นชั่วโมงหลังจากกรอกตารางสถิติ pg_stat_statements รีเซ็ตด้วย pg_stat_statements_reset().
หมายเหตุ: มีการรวบรวมสถิติสำหรับคำขอที่มีระยะเวลามากกว่า 1 วินาที
การเติมตาราง pg_stat_history
--pg_stat_history.sql
CREATE OR REPLACE FUNCTION pg_stat_history( ) RETURNS boolean AS $$
DECLARE
endpoint_rec record ;
database_rec record ;
pg_stat_snapshot record ;
current_snapshot_timestamp timestamp without time zone;
BEGIN
current_snapshot_timestamp = date_trunc('minute',now());
FOR endpoint_rec IN SELECT * FROM endpoint
LOOP
FOR database_rec IN SELECT * FROM database WHERE endpoint_id = endpoint_rec.id
LOOP
RAISE NOTICE 'NEW SHAPSHOT IS CREATING';
--Connect to the target DB
EXECUTE 'SELECT dblink_connect(''LINK1'',''host='||endpoint_rec.host||' dbname='||database_rec.name||' user=USER password=PASSWORD '')';
RAISE NOTICE 'host % and dbname % ',endpoint_rec.host,database_rec.name;
RAISE NOTICE 'Creating snapshot of pg_stat_statements for database %',database_rec.name;
SELECT
*
INTO
pg_stat_snapshot
FROM dblink('LINK1',
'SELECT
dbid , SUM(calls),SUM(total_time),SUM(rows) ,SUM(shared_blks_hit) ,SUM(shared_blks_read) ,SUM(shared_blks_dirtied) ,SUM(shared_blks_written) ,
SUM(local_blks_hit) , SUM(local_blks_read) , SUM(local_blks_dirtied) , SUM(local_blks_written) , SUM(temp_blks_read) , SUM(temp_blks_written) , SUM(blk_read_time) , SUM(blk_write_time)
FROM pg_stat_statements WHERE dbid=(SELECT oid from pg_database where datname=current_database() )
GROUP BY dbid
'
)
AS t
( dbid oid , calls bigint ,
total_time double precision ,
rows bigint , shared_blks_hit bigint , shared_blks_read bigint ,shared_blks_dirtied bigint ,shared_blks_written bigint ,
local_blks_hit bigint ,local_blks_read bigint , local_blks_dirtied bigint ,local_blks_written bigint ,
temp_blks_read bigint ,temp_blks_written bigint ,
blk_read_time double precision , blk_write_time double precision
);
INSERT INTO pg_stat_history
(
snapshot_timestamp ,database_id ,
dbid , calls ,total_time ,
rows ,shared_blks_hit ,shared_blks_read ,shared_blks_dirtied ,shared_blks_written ,local_blks_hit ,
local_blks_read,local_blks_dirtied,local_blks_written,temp_blks_read,temp_blks_written,
blk_read_time, blk_write_time
)
VALUES
(
current_snapshot_timestamp ,
database_rec.id ,
pg_stat_snapshot.dbid ,pg_stat_snapshot.calls,
pg_stat_snapshot.total_time,
pg_stat_snapshot.rows ,pg_stat_snapshot.shared_blks_hit ,pg_stat_snapshot.shared_blks_read ,pg_stat_snapshot.shared_blks_dirtied ,pg_stat_snapshot.shared_blks_written ,
pg_stat_snapshot.local_blks_hit , pg_stat_snapshot.local_blks_read , pg_stat_snapshot.local_blks_dirtied , pg_stat_snapshot.local_blks_written ,
pg_stat_snapshot.temp_blks_read , pg_stat_snapshot.temp_blks_written , pg_stat_snapshot.blk_read_time , pg_stat_snapshot.blk_write_time
);
RAISE NOTICE 'Creating snapshot of pg_stat_statements for queries with min_time more than 1000ms';
FOR pg_stat_snapshot IN
--All queries with max_time greater than 1000 ms
SELECT
*
FROM dblink('LINK1',
'SELECT
dbid , userid ,queryid,query,calls,total_time,min_time ,max_time,mean_time, stddev_time ,rows ,shared_blks_hit ,
shared_blks_read ,shared_blks_dirtied ,shared_blks_written ,
local_blks_hit , local_blks_read , local_blks_dirtied ,
local_blks_written , temp_blks_read , temp_blks_written , blk_read_time ,
blk_write_time
FROM pg_stat_statements
WHERE dbid=(SELECT oid from pg_database where datname=current_database() AND min_time >= 1000 )
'
)
AS t
( dbid oid , userid oid , queryid bigint ,query text , calls bigint ,
total_time double precision ,min_time double precision ,max_time double precision , mean_time double precision , stddev_time double precision ,
rows bigint , shared_blks_hit bigint , shared_blks_read bigint ,shared_blks_dirtied bigint ,shared_blks_written bigint ,
local_blks_hit bigint ,local_blks_read bigint , local_blks_dirtied bigint ,local_blks_written bigint ,
temp_blks_read bigint ,temp_blks_written bigint ,
blk_read_time double precision , blk_write_time double precision
)
LOOP
INSERT INTO pg_stat_history
(
snapshot_timestamp ,database_id ,
dbid ,userid , queryid , query , calls ,total_time ,min_time ,max_time ,mean_time ,stddev_time ,
rows ,shared_blks_hit ,shared_blks_read ,shared_blks_dirtied ,shared_blks_written ,local_blks_hit ,
local_blks_read,local_blks_dirtied,local_blks_written,temp_blks_read,temp_blks_written,
blk_read_time, blk_write_time
)
VALUES
(
current_snapshot_timestamp ,
database_rec.id ,
pg_stat_snapshot.dbid ,pg_stat_snapshot.userid ,pg_stat_snapshot.queryid,pg_stat_snapshot.query,pg_stat_snapshot.calls,
pg_stat_snapshot.total_time,pg_stat_snapshot.min_time ,pg_stat_snapshot.max_time,pg_stat_snapshot.mean_time, pg_stat_snapshot.stddev_time ,
pg_stat_snapshot.rows ,pg_stat_snapshot.shared_blks_hit ,pg_stat_snapshot.shared_blks_read ,pg_stat_snapshot.shared_blks_dirtied ,pg_stat_snapshot.shared_blks_written ,
pg_stat_snapshot.local_blks_hit , pg_stat_snapshot.local_blks_read , pg_stat_snapshot.local_blks_dirtied , pg_stat_snapshot.local_blks_written ,
pg_stat_snapshot.temp_blks_read , pg_stat_snapshot.temp_blks_written , pg_stat_snapshot.blk_read_time , pg_stat_snapshot.blk_write_time
);
END LOOP;
PERFORM dblink_disconnect('LINK1');
END LOOP ;--FOR database_rec IN SELECT * FROM database WHERE endpoint_id = endpoint_rec.id
END LOOP;
RETURN TRUE;
END
$$ LANGUAGE plpgsql;
เป็นผลให้หลังจากช่วงเวลาหนึ่งในตาราง pg_stat_history เราจะมีชุดภาพรวมของเนื้อหาของตาราง pg_stat_statements ฐานข้อมูลเป้าหมาย
รายงานตามจริง
เมื่อใช้ข้อความค้นหาง่ายๆ คุณจะได้รับรายงานที่มีประโยชน์และน่าสนใจ
ข้อมูลรวมในช่วงเวลาที่กำหนด
การสอบสวน
SELECT
database_id ,
SUM(calls) AS calls ,SUM(total_time) AS total_time ,
SUM(rows) AS rows , SUM(shared_blks_hit) AS shared_blks_hit,
SUM(shared_blks_read) AS shared_blks_read ,
SUM(shared_blks_dirtied) AS shared_blks_dirtied,
SUM(shared_blks_written) AS shared_blks_written ,
SUM(local_blks_hit) AS local_blks_hit ,
SUM(local_blks_read) AS local_blks_read ,
SUM(local_blks_dirtied) AS local_blks_dirtied ,
SUM(local_blks_written) AS local_blks_written,
SUM(temp_blks_read) AS temp_blks_read,
SUM(temp_blks_written) temp_blks_written ,
SUM(blk_read_time) AS blk_read_time ,
SUM(blk_write_time) AS blk_write_time
FROM
pg_stat_history
WHERE
queryid IS NULL AND
database_id = DATABASE_ID AND
snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY database_id ;
ดี.บี.ไทม์
to_char(ช่วงเวลา '1 มิลลิวินาที' * pg_total_stat_history_rec.total_time, 'HH24:MI:SS.MS')
เวลา I/O
to_char(ช่วงเวลา '1 มิลลิวินาที' * ( pg_total_stat_history_rec.blk_read_time + pg_total_stat_history_rec.blk_write_time ), 'HH24:MI:SS.MS')
TOP10 SQL โดย total_time
การสอบสวน
SELECT
queryid ,
SUM(calls) AS calls ,
SUM(total_time) AS total_time
FROM
pg_stat_history
WHERE
queryid IS NOT NULL AND
database_id = DATABASE_ID AND
snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY queryid
ORDER BY 3 DESC
LIMIT 10
-------------------------------------------------- ------------------------------------ | TOP10 SQL ตามเวลาดำเนินการทั้งหมด | #| รหัสแบบสอบถาม| โทร| โทร %| total_time (มิลลิวินาที) | dbtime % +----+----------+-----------+-----------+------ --------------------+--------- | 1| 821760255| 2| .00001|00:03:23.141( 203141.681 ms.)| 5.42 | 2| 4152624390| 2| .00001|00:03:13.929( 193929.215 ms.)| 5.17 | 3| 1484454471| 4| .00001|00:02:09.129( 129129.057 ms.)| 3.44 | 4| 655729273| 1| .00000|00:02:01.869( 121869.981 ms.)| 3.25 | 5| 2460318461| 1| .00000|00:01:33.113( 93113.835 ms.)| 2.48 | 6| 2194493487| 4| .00001|00:00:17.377( 17377.868 ms.)| .46 | 7| 1053044345| 1| .00000|00:00:06.156( 6156.352 ms.)| .16 | 8| 3644780286| 1| .00000|00:00:01.063( 1063.830 ms.)| .03
TOP10 SQL ตามเวลา I/O ทั้งหมด
การสอบสวน
SELECT
queryid ,
SUM(calls) AS calls ,
SUM(blk_read_time + blk_write_time) AS io_time
FROM
pg_stat_history
WHERE
queryid IS NOT NULL AND
database_id = DATABASE_ID AND
snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY queryid
ORDER BY 3 DESC
LIMIT 10
-------------------------------------------------- -------------------------------------- | 10 อันดับแรกของ SQL ตามเวลา I/O ทั้งหมด | #| รหัสแบบสอบถาม| โทร| โทร %| เวลา I/O (มิลลิวินาที)|db เวลา I/O % +----+----------+----------+------ -----+--------------------------------+-------------- -- | 1| 4152624390| 2| .00001|00:08:31.616( 511616.592 ms.)| 31.06 มิถุนายน | 2| 821760255| 2| .00001|00:08:27.099( 507099.036 ms.)| 30.78 | 3| 655729273| 1| .00000|00:05:02.209( 302209.137 ms.)| 18.35 | 4| 2460318461| 1| .00000|00:04:05.981( 245981.117 ms.)| 14.93 | 5| 1484454471| 4| .00001|00:00:39.144( 39144.221 ms.)| 2.38 | 6| 2194493487| 4| .00001|00:00:18.182( 18182.816 ms.)| 1.10 | 7| 1053044345| 1| .00000|00:00:16.611( 16611.722 ms.)| 1.01 | 8| 3644780286| 1| .00000|00:00:00.436( 436.205 ms.)| .03
TOP10 SQL ตามเวลาสูงสุดของการดำเนินการ
การสอบสวน
SELECT
id AS snapshotid ,
queryid ,
snapshot_timestamp ,
max_time
FROM
pg_stat_history
WHERE
queryid IS NOT NULL AND
database_id = DATABASE_ID AND
snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
ORDER BY 4 DESC
LIMIT 10
-------------------------------------------------- ------------------------------------ | TOP10 SQL ตามเวลาดำเนินการสูงสุด | #| ภาพรวม| รหัสสแนปชอต| รหัสแบบสอบถาม| max_time (มิลลิวินาที) +----+----------+-----------+--------- --+---------------------------------------- | 1| 05.04.2019/01/03 4169:655729273| 00| 02| 01.869:121869.981:2( 04.04.2019 ms.) | 17| 00/4153/821760255 00:01| 41.570| 101570.841| 3:04.04.2019:16( 00 ms.) | 4146| 821760255/00/01 41.570:101570.841| 4| 04.04.2019| 16:00:4144( 4152624390 ms.) | 00| 01/36.964/96964.607 5:04.04.2019| 17| 00| 4151:4152624390:00( 01 ms.) | 36.964| 96964.607/6/05.04.2019 10:00| 4188| 1484454471| 00:01:33.452( 93452.150 ms.) | 7| 04.04.2019/17/00 4150:2460318461 | 00| 01| 33.113:93113.835:8( 04.04.2019 ms.) | 15| 00/4140/1484454471 00:00| 11.892| 11892.302| 9:04.04.2019:16( 00 น.) | 4145| 1484454471/00/00 11.892:11892.302| 10| 04.04.2019| 17:00:4152( 1484454471 ms.) | 00| 00/11.892/11892.302 XNUMX:XNUMX| XNUMX| XNUMX| XNUMX:XNUMX:XNUMX( XNUMX ms.) | XNUMX| XNUMX/XNUMX/XNUMX XNUMX:XNUMX| XNUMX| XNUMX| XNUMX:XNUMX:XNUMX( XNUMX น.)
TOP10 SQL โดยบัฟเฟอร์ SHARED อ่าน/เขียน
การสอบสวน
SELECT
id AS snapshotid ,
queryid ,
snapshot_timestamp ,
shared_blks_read ,
shared_blks_written
FROM
pg_stat_history
WHERE
queryid IS NOT NULL AND
database_id = DATABASE_ID AND
snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND
( shared_blks_read > 0 OR shared_blks_written > 0 )
ORDER BY 4 DESC , 5 DESC
LIMIT 10
-------------------------------------------------- ------------------------------------ | TOP10 SQL ตามบัฟเฟอร์ที่ใช้ร่วมกัน อ่าน/เขียน | #| ภาพรวม| รหัสสแนปชอต| รหัสแบบสอบถาม| บล็อกที่ใช้ร่วมกันอ่าน| บล็อกที่ใช้ร่วมกันเขียน +----+----------+----------+--------- -+---------------------+-------------------- | 1| 04.04.2019/17/00 4153:821760255| 797308| 0| 2| 04.04.2019 | 16| 00/4146/821760255 797308:0| 3| 05.04.2019| 01| 03 | 4169| 655729273/797158/0 4:04.04.2019| 16| 00| 4144| 4152624390 | 756514| 0/5/04.04.2019 17:00| 4151| 4152624390| 756514| 0 | 6| 04.04.2019/17/00 4150:2460318461| 734117| 0| 7| 04.04.2019 | 17| 00/4155/3644780286 52973:0| 8| 05.04.2019| 01| 03 | 4168| 1053044345/52818/0 9:04.04.2019| 15| 00| 4141| 2194493487 | 52813| 0/10/04.04.2019 16:00| 4147| 2194493487| 52813| 0 | XNUMX| XNUMX/XNUMX/XNUMX XNUMX:XNUMX| XNUMX| XNUMX| XNUMX| XNUMX | XNUMX| XNUMX/XNUMX/XNUMX XNUMX:XNUMX| XNUMX| XNUMX| XNUMX| XNUMX ------------------------------------------------- -------------------------------------------------
ฮิสโตแกรมของการกระจายแบบสอบถามตามเวลาดำเนินการสูงสุด
การร้องขอ
SELECT
MIN(max_time) AS hist_min ,
MAX(max_time) AS hist_max ,
(( MAX(max_time) - MIN(min_time) ) / hist_columns ) as hist_width
FROM
pg_stat_history
WHERE
queryid IS NOT NULL AND
database_id = DATABASE_ID AND
snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT ;
SELECT
SUM(calls) AS calls
FROM
pg_stat_history
WHERE
queryid IS NOT NULL AND
database_id =DATABASE_ID AND
snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND
( max_time >= hist_current_min AND max_time < hist_current_max ) ;
|------------------------------------------------- ---------------------------------------- | MAX_TIME ฮิสโตแกรม | โทรทั้งหมด : 33851920 | เวลาขั้นต่ำ : 00:00:01.063 | เวลาสูงสุด : 00:02:01.869 ------------------------------------------ ---------------------------- | ระยะเวลาขั้นต่ำ| ระยะเวลาสูงสุด| โทร +-------------------------------- +------------ ---------------------+--------- | 00:00:01.063( 1063.830 ms.) | 00:00:13.144( 13144.445 ms.) | 9 | 00:00:13.144( 13144.445 ms.) | 00:00:25.225( 25225.060 ms.) | 0 | 00:00:25.225( 25225.060 ms.) | 00:00:37.305( 37305.675 ms.) | 0 | 00:00:37.305( 37305.675 ms.) | 00:00:49.386( 49386.290 ms.) | 0 | 00:00:49.386( 49386.290 ms.) | 00:01:01.466( 61466.906 ms.) | 0 | 00:01:01.466( 61466.906 ms.) | 00:01:13.547( 73547.521 ms.) | 0 | 00:01:13.547( 73547.521 ms.) | 00:01:25.628( 85628.136 ms.) | 0 | 00:01:25.628( 85628.136 ms.) | 00:01:37.708( 97708.751 ms.) | 4 | 00:01:37.708( 97708.751 ms.) | 00:01:49.789( 109789.366 ms.) | 2 | 00:01:49.789( 109789.366 ms.) | 00:02:01.869( 121869.981 ms.) | 0
ภาพรวม 10 อันดับแรกตามข้อความค้นหาต่อวินาที
การร้องขอ
--pg_qps.sql
--Calculate Query Per Second
CREATE OR REPLACE FUNCTION pg_qps( pg_stat_history_id integer ) RETURNS double precision AS $$
DECLARE
pg_stat_history_rec record ;
prev_pg_stat_history_id integer ;
prev_pg_stat_history_rec record;
total_seconds double precision ;
result double precision;
BEGIN
result = 0 ;
SELECT *
INTO pg_stat_history_rec
FROM
pg_stat_history
WHERE id = pg_stat_history_id ;
IF pg_stat_history_rec.snapshot_timestamp IS NULL
THEN
RAISE EXCEPTION 'ERROR - Not found pg_stat_history for id = %',pg_stat_history_id;
END IF ;
--RAISE NOTICE 'pg_stat_history_id = % , snapshot_timestamp = %', pg_stat_history_id ,
pg_stat_history_rec.snapshot_timestamp ;
SELECT
MAX(id)
INTO
prev_pg_stat_history_id
FROM
pg_stat_history
WHERE
database_id = pg_stat_history_rec.database_id AND
queryid IS NULL AND
id < pg_stat_history_rec.id ;
IF prev_pg_stat_history_id IS NULL
THEN
RAISE NOTICE 'Not found previous pg_stat_history shapshot for id = %',pg_stat_history_id;
RETURN NULL ;
END IF;
SELECT *
INTO prev_pg_stat_history_rec
FROM
pg_stat_history
WHERE id = prev_pg_stat_history_id ;
--RAISE NOTICE 'prev_pg_stat_history_id = % , prev_snapshot_timestamp = %', prev_pg_stat_history_id , prev_pg_stat_history_rec.snapshot_timestamp ;
total_seconds = extract(epoch from ( pg_stat_history_rec.snapshot_timestamp - prev_pg_stat_history_rec.snapshot_timestamp ));
--RAISE NOTICE 'total_seconds = % ', total_seconds ;
--RAISE NOTICE 'calls = % ', pg_stat_history_rec.calls ;
IF total_seconds > 0
THEN
result = pg_stat_history_rec.calls / total_seconds ;
ELSE
result = 0 ;
END IF;
RETURN result ;
END
$$ LANGUAGE plpgsql;
SELECT
id ,
snapshot_timestamp ,
calls ,
total_time ,
( select pg_qps( id )) AS QPS ,
blk_read_time ,
blk_write_time
FROM
pg_stat_history
WHERE
queryid IS NULL AND
database_id = DATABASE_ID AND
snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND
( select pg_qps( id )) IS NOT NULL
ORDER BY 5 DESC
LIMIT 10
|------------------------------------------------- ---------------------------------------- | ภาพรวม 10 อันดับแรกเรียงลำดับตามตัวเลข QueryPerSeconds -------------------------------------------- -------------------------------------------- ------ ------------------------------------------- | #| ภาพรวม| รหัสสแนปชอต| โทร| เวลา db ทั้งหมด| คิวพีเอส | เวลา I/O | เวลา I/O % +-----+----------+-----------+------- -----+---------------------------------+--------- -+---------------------------------+------------ | 1| 04.04.2019/20/04 4161:5758631| 00| 06| 30.513:390513.926:1573.396( 00 ms.)| 00| 01.470:1470.110:376( 2 ms.)| .04.04.2019 | 17| 00/4149/3529197 00:11| 48.830| 708830.618| 980.332:00:12( 47.834 ms.)| 767834.052| 108.324:3:04.04.2019( 16 ms.)| 00 | 4143| 3525360/00/10 13.492:613492.351| 979.267| 00| 08:41.396:521396.555( 84.988 ms.)| 4| 04.04.2019:21:03( 4163 ms.)| 2781536 | 00| 03/06.470/186470.979 785.745:00| 00| 00.249| 249.865:134:5( 04.04.2019 ms.)| 19| 03:4159:2890362( 00 ms.)| .03 | 16.784| 196784.755/776.979/00 00:01.441| 1441.386| 732| 6:04.04.2019:14( 00 ms.)| 4137| 2397326:00:04( 43.033 ms.)| .283033.854 | 665.924| 00/00/00.024 24.505:009| 7| 04.04.2019| 15:00:4139( 2394416 ms.)| 00| 04:51.435:291435.010( 665.116 ms.)| .00 | 00| 12.025/12025.895/4.126 8:04.04.2019| 13| 00| 4135:2373043:00( 04 ms.)| 26.791| 266791.988:659.179:00( 00 ms.)| 00.064 | 64.261| 024/9/05.04.2019 01:03| 4167| 4387191| 00:06:51.380( 411380.293 ms.)| 609.332| 00:05:18.847( 318847.407 ms.)| .77.507 | 10| 04.04.2019/18/01 4157:1145596| 00| 01| 19.217:79217.372:313.004( 00 ms.)| 00| 01.319:1319.676:1.666( XNUMX ms.)| XNUMX | XNUMX| XNUMX/XNUMX/XNUMX XNUMX:XNUMX| XNUMX| XNUMX| XNUMX:XNUMX:XNUMX( XNUMX ms.)| XNUMX| XNUMX:XNUMX:XNUMX( XNUMX ms.)| XNUMX
ประวัติการดำเนินการรายชั่วโมงพร้อม QueryPerSeconds และ I/O Time
การสอบสวน
SELECT
id ,
snapshot_timestamp ,
calls ,
total_time ,
( select pg_qps( id )) AS QPS ,
blk_read_time ,
blk_write_time
FROM
pg_stat_history
WHERE
queryid IS NULL AND
database_id = DATABASE_ID AND
snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
ORDER BY 2
|----------------------------------------------------------------------------------------------- | HOURLY EXECUTION HISTORY WITH QueryPerSeconds and I/O Time ----------------------------------------------------------------------------------------------------------------------------------------------- | QUERY PER SECOND HISTORY | #| snapshot| snapshotID| calls| total dbtime| QPS| I/O time| I/O time % +-----+------------------+-----------+-----------+----------------------------------+-----------+----------------------------------+----------- | 1| 04.04.2019 11:00| 4131| 3747| 00:00:00.835( 835.374 ms.)| 1.041| 00:00:00.000( .000 ms.)| .000 | 2| 04.04.2019 12:00| 4133| 1002722| 00:01:52.419( 112419.376 ms.)| 278.534| 00:00:00.149( 149.105 ms.)| .133 | 3| 04.04.2019 13:00| 4135| 2373043| 00:04:26.791( 266791.988 ms.)| 659.179| 00:00:00.064( 64.261 ms.)| .024 | 4| 04.04.2019 14:00| 4137| 2397326| 00:04:43.033( 283033.854 ms.)| 665.924| 00:00:00.024( 24.505 ms.)| .009 | 5| 04.04.2019 15:00| 4139| 2394416| 00:04:51.435( 291435.010 ms.)| 665.116| 00:00:12.025( 12025.895 ms.)| 4.126 | 6| 04.04.2019 16:00| 4143| 3525360| 00:10:13.492( 613492.351 ms.)| 979.267| 00:08:41.396( 521396.555 ms.)| 84.988 | 7| 04.04.2019 17:00| 4149| 3529197| 00:11:48.830( 708830.618 ms.)| 980.332| 00:12:47.834( 767834.052 ms.)| 108.324 | 8| 04.04.2019 18:01| 4157| 1145596| 00:01:19.217( 79217.372 ms.)| 313.004| 00:00:01.319( 1319.676 ms.)| 1.666 | 9| 04.04.2019 19:03| 4159| 2890362| 00:03:16.784( 196784.755 ms.)| 776.979| 00:00:01.441( 1441.386 ms.)| .732 | 10| 04.04.2019 20:04| 4161| 5758631| 00:06:30.513( 390513.926 ms.)| 1573.396| 00:00:01.470( 1470.110 ms.)| .376 | 11| 04.04.2019 21:03| 4163| 2781536| 00:03:06.470( 186470.979 ms.)| 785.745| 00:00:00.249( 249.865 ms.)| .134 | 12| 04.04.2019 23:03| 4165| 1443155| 00:01:34.467( 94467.539 ms.)| 200.438| 00:00:00.015( 15.287 ms.)| .016 | 13| 05.04.2019 01:03| 4167| 4387191| 00:06:51.380( 411380.293 ms.)| 609.332| 00:05:18.847( 318847.407 ms.)| 77.507 | 14| 05.04.2019 02:03| 4171| 189852| 00:00:10.989( 10989.899 ms.)| 52.737| 00:00:00.539( 539.110 ms.)| 4.906 | 15| 05.04.2019 03:01| 4173| 3627| 00:00:00.103( 103.000 ms.)| 1.042| 00:00:00.004( 4.131 ms.)| 4.010 | 16| 05.04.2019 04:00| 4175| 3627| 00:00:00.085( 85.235 ms.)| 1.025| 00:00:00.003( 3.811 ms.)| 4.471 | 17| 05.04.2019 05:00| 4177| 3747| 00:00:00.849( 849.454 ms.)| 1.041| 00:00:00.006( 6.124 ms.)| .721 | 18| 05.04.2019 06:00| 4179| 3747| 00:00:00.849( 849.561 ms.)| 1.041| 00:00:00.000( .051 ms.)| .006 | 19| 05.04.2019 07:00| 4181| 3747| 00:00:00.839( 839.416 ms.)| 1.041| 00:00:00.000( .062 ms.)| .007 | 20| 05.04.2019 08:00| 4183| 3747| 00:00:00.846( 846.382 ms.)| 1.041| 00:00:00.000( .007 ms.)| .001 | 21| 05.04.2019 09:00| 4185| 3747| 00:00:00.855( 855.426 ms.)| 1.041| 00:00:00.000( .065 ms.)| .008 | 22| 05.04.2019 10:00| 4187| 3797| 00:01:40.150( 100150.165 ms.)| 1.055| 00:00:21.845( 21845.217 ms.)| 21.812
ข้อความของ SQL ทั้งหมดที่เลือก
การสอบสวน
SELECT
queryid ,
query
FROM
pg_stat_history
WHERE
queryid IS NOT NULL AND
database_id = DATABASE_ID AND
snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY queryid , query
ทั้งหมด
อย่างที่คุณเห็น ด้วยวิธีการที่ค่อนข้างง่าย คุณจะได้รับข้อมูลที่เป็นประโยชน์มากมายเกี่ยวกับปริมาณงานและสถานะของฐานข้อมูล
บันทึก:หากคุณแก้ไขรหัสแบบสอบถามในแบบสอบถาม เราจะได้รับประวัติสำหรับคำขอแยกต่างหาก (เพื่อประหยัดพื้นที่ รายงานสำหรับคำขอแยกต่างหากจะถูกละไว้)
ดังนั้นจึงมีข้อมูลทางสถิติเกี่ยวกับประสิทธิภาพการค้นหาและรวบรวมไว้
ขั้นตอนแรก "การรวบรวมข้อมูลสถิติ" เสร็จสมบูรณ์
คุณสามารถไปยังขั้นตอนที่สอง - "การกำหนดค่าเมตริกประสิทธิภาพ"
แต่นั่นเป็นอีกเรื่อง
จะยังคง ...
ที่มา: will.com