इंजीनियर - लैटिन से अनुवादित - प्रेरित।
एक इंजीनियर कुछ भी कर सकता है. (सी) आर. डीजल.
पुरालेख।
या एक कहानी कि एक डेटाबेस प्रशासक को अपने प्रोग्रामिंग अतीत को याद रखने की आवश्यकता क्यों है।
प्रस्तावना
सारे नाम बदल दिए गए हैं. मिलान यादृच्छिक हैं. सामग्री पूरी तरह से लेखक की निजी राय है।
वारंटियों का अस्वीकरण: लेखों की नियोजित श्रृंखला में प्रयुक्त तालिकाओं और लिपियों का कोई विस्तृत और सटीक विवरण नहीं होगा। सामग्रियों का तुरंत "जैसा है" उपयोग नहीं किया जा सकता।
सबसे पहले, सामग्री की बड़ी मात्रा के कारण,
दूसरे, वास्तविक ग्राहक के उत्पादन आधार के साथ तीक्ष्णता के कारण।
इसलिए, लेखों में केवल सबसे सामान्य रूप में विचार और विवरण दिए जाएंगे।
हो सकता है कि भविष्य में सिस्टम GitHub पर पोस्ट करने के स्तर तक बढ़ जाए, या शायद नहीं। समय दिखाएगा।
कहानी की शुरुआत-
परिणामस्वरूप क्या हुआ, सबसे सामान्य शब्दों में - "
मुझे यह सब क्यों चाहिए?
ठीक है, सबसे पहले, सेवानिवृत्ति के गौरवशाली दिनों को याद करते हुए, अपने आप को न भूलें।
दूसरे, जो लिखा गया उसे व्यवस्थित करना। पहले से ही, मैं कभी-कभी भ्रमित होने लगता हूं और अलग-अलग हिस्सों को भूल जाता हूं।
खैर, और सबसे महत्वपूर्ण बात - अचानक यह किसी के काम आ सकता है और पहिये को दोबारा न बनाने और रेक इकट्ठा न करने में मदद कर सकता है। दूसरे शब्दों में, अपने कर्म में सुधार करें (खबरोवस्की नहीं)। क्योंकि इस दुनिया में सबसे मूल्यवान चीज़ विचार हैं। मुख्य बात एक विचार खोजना है। और इस विचार को वास्तविकता में अनुवाद करना पहले से ही एक विशुद्ध तकनीकी मुद्दा है।
तो चलिए धीरे-धीरे शुरू करते हैं...
समस्या का निरूपण.
उपलब्ध:
PostgreSQL(10.5), मिश्रित भार (OLTP+DSS), मध्यम से हल्का भार, AWS क्लाउड में होस्ट किया गया।
कोई डेटाबेस निगरानी नहीं है, बुनियादी ढांचे की निगरानी को न्यूनतम कॉन्फ़िगरेशन में मानक AWS उपकरण के रूप में प्रस्तुत किया जाता है।
आवश्यक है:
डेटाबेस के प्रदर्शन और स्थिति की निगरानी करें, भारी डेटाबेस प्रश्नों को अनुकूलित करने के लिए प्रारंभिक जानकारी ढूंढें और प्राप्त करें।
समाधानों का संक्षिप्त परिचय या विश्लेषण
आरंभ करने के लिए, आइए इंजीनियर के लिए लाभों और परेशानियों के तुलनात्मक विश्लेषण के दृष्टिकोण से समस्या को हल करने के विकल्पों का विश्लेषण करने का प्रयास करें, और जिन्हें कर्मचारी सूची में होना चाहिए उन्हें प्रबंधन के लाभ और हानि से निपटने दें।
विकल्प 1 - "माँग पर काम करना"
हम सब कुछ वैसा ही छोड़ देते हैं जैसा वह है। यदि ग्राहक डेटाबेस या एप्लिकेशन के स्वास्थ्य, प्रदर्शन में किसी चीज़ से संतुष्ट नहीं है, तो वह डीबीए इंजीनियरों को ई-मेल द्वारा या टिकट बॉक्स में एक घटना बनाकर सूचित करेगा।
एक इंजीनियर, एक अधिसूचना प्राप्त करने के बाद, समस्या को समझेगा, समाधान पेश करेगा, या समस्या को टाल देगा, यह आशा करते हुए कि सब कुछ अपने आप हल हो जाएगा, और वैसे भी, सब कुछ जल्द ही भुला दिया जाएगा।
जिंजरब्रेड और डोनट्स, चोट और उभारजिंजरब्रेड और डोनट्स:
1. करने को कुछ अतिरिक्त नहीं
2. हमेशा बाहर निकलने और गंदा होने का अवसर मिलता है।
3. बहुत सा समय जो आप स्वयं पर व्यतीत कर सकते हैं।
चोट और उभार:
1. देर-सबेर, ग्राहक इस दुनिया में अस्तित्व के सार और सार्वभौमिक न्याय के बारे में सोचेगा और एक बार फिर खुद से सवाल पूछेगा - मैं उन्हें अपने पैसे क्यों दे रहा हूं? परिणाम हमेशा एक ही होता है - एकमात्र सवाल यह है कि ग्राहक कब ऊब जाता है और अलविदा कह देता है। और फीडर खाली है. यह दुख की बात है।
2. एक इंजीनियर का विकास शून्य होता है.
3. कार्य शेड्यूल करने और लोड करने में कठिनाइयाँ
विकल्प 2 - "डफ के साथ नृत्य करें, जूते पहनें और पहनें"
परिच्छेद 1-हमें निगरानी प्रणाली की आवश्यकता क्यों है, हम सभी अनुरोध प्राप्त करेंगे। हम डेटा शब्दकोश और गतिशील दृश्यों के लिए सभी प्रकार की क्वेरीज़ का एक समूह लॉन्च करते हैं, सभी प्रकार के काउंटरों को चालू करते हैं, सब कुछ तालिकाओं में लाते हैं, समय-समय पर सूचियों और तालिकाओं का विश्लेषण करते हैं। परिणामस्वरूप, हमारे पास सुंदर या बहुत अच्छे ग्राफ़, तालिकाएँ, रिपोर्टें नहीं हैं। मुख्य बात - वह अधिक, अधिक होगा.
परिच्छेद 2-गतिविधि उत्पन्न करें-इस सबका विश्लेषण चलाएँ।
परिच्छेद 3-हम एक निश्चित दस्तावेज़ तैयार कर रहे हैं, हम इस दस्तावेज़ को सरल शब्दों में कहते हैं - "हम डेटाबेस को कैसे सुसज्जित करते हैं।"
परिच्छेद 4- ग्राहक, ग्राफ़ और आंकड़ों की यह सारी भव्यता देखकर, एक बचकाने भोले विश्वास में है - अब सब कुछ हमारे लिए जल्द ही काम करेगा। और, आसानी से और दर्द रहित तरीके से अपने वित्तीय संसाधनों से अलग हो जाते हैं। प्रबंधन को भी यकीन है कि हमारे इंजीनियर कड़ी मेहनत कर रहे हैं। अधिकतम लोड हो रहा है.
परिच्छेद 5- चरण 1 को नियमित रूप से दोहराएँ।
जिंजरब्रेड और डोनट्स, चोट और उभारजिंजरब्रेड और डोनट्स:
1. प्रबंधकों और इंजीनियरों का जीवन सरल, पूर्वानुमानित और गतिविधि से भरा होता है। सब कुछ गुलजार है, हर कोई व्यस्त है।
2. ग्राहक का जीवन भी बुरा नहीं है - उसे हमेशा यकीन होता है कि आपको थोड़ा धैर्य रखने की जरूरत है और सब कुछ ठीक हो जाएगा। यह बेहतर नहीं हो रहा है, ठीक है, ठीक है - यह दुनिया अनुचित है, अगले जीवन में - आप भाग्यशाली होंगे।
चोट और उभार:
1. देर-सबेर, ऐसी ही सेवा का एक होशियार प्रदाता होगा जो वही काम करेगा, लेकिन थोड़ा सस्ता। और यदि परिणाम समान है, तो अधिक भुगतान क्यों करें। जिससे फिर से फीडर गायब हो जाएगा।
2. यह उबाऊ है. कोई भी छोटी सार्थक गतिविधि कितनी उबाऊ है।
3. पिछले संस्करण की तरह - कोई विकास नहीं। लेकिन एक इंजीनियर के लिए नकारात्मक पक्ष यह है कि, पहले विकल्प के विपरीत, यहां आपको लगातार एक आईडीबी उत्पन्न करने की आवश्यकता होती है। और इसमें समय लगता है. जिसे आप अपने प्रियजन की भलाई के लिए खर्च कर सकते हैं। क्योंकि आप अपना ख्याल नहीं रख सकते, हर कोई आपकी परवाह करता है।
विकल्प 3-साइकिल का आविष्कार करने की आवश्यकता नहीं है, आपको इसे खरीदने और इसकी सवारी करने की आवश्यकता है।
अन्य कंपनियों के इंजीनियर जानबूझकर बीयर के साथ पिज़्ज़ा खाते हैं (ओह, 90 के दशक में सेंट पीटर्सबर्ग का गौरवशाली समय)। आइए उन निगरानी प्रणालियों का उपयोग करें जो बनाई गई हैं, डिबग की गई हैं और काम कर रही हैं, और आम तौर पर कहें तो, वे लाभ लाती हैं (ठीक है, कम से कम उनके रचनाकारों के लिए)।
जिंजरब्रेड और डोनट्स, चोट और उभारजिंजरब्रेड और डोनट्स:
1. जो पहले से ही आविष्कार किया गया है उसका आविष्कार करने में समय बर्बाद करने की आवश्यकता नहीं है। लो और प्रयोग करो.
2. मॉनिटरिंग सिस्टम मूर्खों द्वारा नहीं लिखे गए हैं, और निश्चित रूप से वे उपयोगी हैं।
3. कार्यशील निगरानी प्रणालियाँ आमतौर पर उपयोगी फ़िल्टर की गई जानकारी प्रदान करती हैं।
चोट और उभार:
1. इस मामले में इंजीनियर, इंजीनियर नहीं है, बल्कि सिर्फ किसी और के उत्पाद का उपयोगकर्ता है।
2. ग्राहक को कुछ ऐसी चीज़ खरीदने की आवश्यकता के बारे में आश्वस्त होना चाहिए जिसे वह आम तौर पर समझना नहीं चाहता है, और उसे ऐसा नहीं करना चाहिए, और सामान्य तौर पर वर्ष के लिए बजट स्वीकृत हो चुका है और इसमें बदलाव नहीं होगा। फिर आपको एक अलग संसाधन आवंटित करने, इसे एक विशिष्ट सिस्टम के लिए कॉन्फ़िगर करने की आवश्यकता है। वे। पहले आपको भुगतान करना होगा, भुगतान करना होगा और फिर से भुगतान करना होगा। और ग्राहक कंजूस है. यही इस जीवन का आदर्श है.
क्या करें, चेर्नशेव्स्की? आपका प्रश्न बहुत प्रासंगिक है. (साथ)
इस विशेष मामले और वर्तमान स्थिति में, आप थोड़ा अलग तरीके से कर सकते हैं - आइए अपनी स्वयं की निगरानी प्रणाली बनाएं।
ठीक है, एक प्रणाली नहीं, निश्चित रूप से, शब्द के पूर्ण अर्थ में, यह बहुत ज़ोरदार और अभिमानी है, लेकिन कम से कम किसी तरह इसे अपने लिए आसान बनाएं और प्रदर्शन की घटनाओं को हल करने के लिए अधिक जानकारी एकत्र करें। अपने आप को ऐसी स्थिति में न पाने के लिए - "वहां जाओ, मुझे नहीं पता कि कहां, उसे ढूंढो, मुझे नहीं पता क्या।"
इस विकल्प के फायदे और नुकसान क्या हैं:
पेशेवरों:
1. यह दिलचस्प है. खैर, कम से कम निरंतर "डेटाफ़ाइल को सिकोड़ें, टेबलस्पेस को बदलें, आदि" से अधिक दिलचस्प।
2. ये नए कौशल और नया विकास हैं। जो भविष्य में, देर-सबेर, सुयोग्य जिंजरब्रेड और डोनट्स देगा।
विपक्ष:
1. काम करना होगा. बहुत काम।
2. आपको सभी गतिविधियों के अर्थ और परिप्रेक्ष्य को नियमित रूप से समझाना होगा।
3. कुछ त्याग करना होगा, क्योंकि इंजीनियर के लिए उपलब्ध एकमात्र संसाधन - समय - ब्रह्मांड द्वारा सीमित है।
4. सबसे बुरा और सबसे अप्रिय - परिणामस्वरूप, "चूहा नहीं, मेंढक नहीं, बल्कि एक अज्ञात छोटा जानवर" जैसा कचरा निकल सकता है।
जो कोई जोखिम नहीं उठाता वह शैंपेन नहीं पीता।
तो, मज़ा शुरू होता है।
सामान्य विचार - योजनाबद्ध
(लेख से लिया गया चित्रण «
स्पष्टीकरण:
- लक्ष्य डेटाबेस मानक PostgreSQL एक्सटेंशन "pg_stat_statements" के साथ स्थापित किया गया है।
- मॉनिटरिंग डेटाबेस में, हम प्रारंभिक चरण में pg_stat_statements इतिहास को संग्रहीत करने और भविष्य में मेट्रिक्स और मॉनिटरिंग को कॉन्फ़िगर करने के लिए सेवा तालिकाओं का एक सेट बनाते हैं।
- मॉनिटरिंग होस्ट पर, हम बैश स्क्रिप्ट का एक सेट बनाते हैं, जिसमें टिकट सिस्टम में घटनाएं उत्पन्न करने वाली स्क्रिप्ट भी शामिल हैं।
सेवा तालिकाएँ
आरंभ करने के लिए, एक योजनाबद्ध रूप से सरलीकृत ईआरडी, अंत में क्या हुआ:
तालिकाओं का संक्षिप्त विवरणसमापन बिंदु - होस्ट, उदाहरण के लिए कनेक्शन बिंदु
डेटाबेस - डेटाबेस विकल्प
pg_stat_इतिहास - लक्ष्य डेटाबेस के pg_stat_statements दृश्य के अस्थायी स्नैपशॉट संग्रहीत करने के लिए ऐतिहासिक तालिका
मीट्रिक_शब्दावली - प्रदर्शन मेट्रिक्स का शब्दकोश
metric_config - व्यक्तिगत मेट्रिक्स का विन्यास
मीट्रिक - अनुरोध के लिए एक विशिष्ट मीट्रिक जिसकी निगरानी की जा रही है
मेट्रिक_अलर्ट_इतिहास - प्रदर्शन चेतावनियों का इतिहास
लॉग_क्वेरी - AWS से डाउनलोड की गई PostgreSQL लॉग फ़ाइल से पार्स किए गए रिकॉर्ड संग्रहीत करने के लिए सेवा तालिका
आधारभूत - आधार के रूप में उपयोग की जाने वाली समय अवधि के पैरामीटर
जांच की चौकी - डेटाबेस की स्थिति की जाँच के लिए मैट्रिक्स का विन्यास
चेकप्वाइंट_अलर्ट_इतिहास - डेटाबेस स्थिति जांच मेट्रिक्स का चेतावनी इतिहास
pg_stat_db_queries - सक्रिय अनुरोधों की सेवा तालिका
गतिविधि लॉग - गतिविधि लॉग सेवा तालिका
ट्रैप_ॉइड - ट्रैप कॉन्फ़िगरेशन सेवा तालिका
चरण 1 - प्रदर्शन आँकड़े एकत्र करें और रिपोर्ट प्राप्त करें
सांख्यिकीय जानकारी संग्रहीत करने के लिए एक तालिका का उपयोग किया जाता है। pg_stat_इतिहास
pg_stat_history तालिका संरचना
तालिका "public.pg_stat_history" कॉलम | प्रकार | संशोधक ------------------+--------------------------------+---------------------------------------------------------------- आईडी | पूर्णांक | शून्य नहीं डिफ़ॉल्ट अगलावल('pg_stat_history_id_seq'::regclass) स्नैपशॉट_टाइमस्टैम्प | टाइमज़ोन के बिना टाइमस्टैम्प | डेटाबेस_आईडी | पूर्णांक | डीबीआईडी | ओइड | उपयोगकर्ता आईडी | ओइड | क्वेरीआईडी | बिगिंट | प्रश्न | पाठ | कॉल | बिगिंट | कुल_समय | दोहरी परिशुद्धता | मिनट_समय | दोहरी परिशुद्धता | अधिकतम_समय | दोहरी परिशुद्धता | माध्य_समय | दोहरी परिशुद्धता | stddev_time | दोहरी परिशुद्धता | पंक्तियाँ | बिगिंट | शेयर्ड_ब्लक्स_हिट | बिगिंट | share_blks_read | बिगिंट | share_blks_dirtied | बिगिंट | साझा_ब्लक्स_लिखित | बिगिंट | लोकल_ब्लक्स_हिट | बिगिंट | local_blks_read | बिगिंट | local_blks_dirtied | बिगिंट | स्थानीय_ब्लक्स_लिखित | बिगिंट | temp_blks_read | बिगिंट | temp_blks_लिखित | बिगिंट | blk_read_time | दोहरी परिशुद्धता | blk_write_time | दोहरी परिशुद्धता | बेसलाइन_आईडी | पूर्णांक | सूचकांक: "pg_stat_history_pkey" प्राथमिक कुंजी, Btree (id) "Database_idx" BTREE (DATABASE_ID) "Queryid_idx" BTREE (QUERYID) "SNAPSHOT_TIMESTAMP_IDX" BTREE (SNAPSHOTRE (SNAPSH _timestamp) विदेशी-कुंजी बाधाएं: "डेटाबेस_id_fk" विदेशी कुंजी (डेटाबेस_आईडी) डिलीट कैस्केड पर संदर्भ डेटाबेस (आईडी)।
जैसा कि आप देख सकते हैं, तालिका केवल एक संचयी दृश्य डेटा है pg_stat_statements लक्ष्य डेटाबेस में.
इस तालिका का उपयोग बहुत सरल है.
pg_stat_इतिहास प्रत्येक घंटे के लिए क्वेरी निष्पादन के संचित आंकड़ों का प्रतिनिधित्व करेगा। प्रत्येक घंटे की शुरुआत में, तालिका भरने के बाद, आँकड़े pg_stat_statements के साथ रीसेट करें pg_stat_statements_reset().
नोट: 1 सेकंड से अधिक की अवधि वाले अनुरोधों के लिए आंकड़े एकत्र किए जाते हैं।
pg_stat_history तालिका को पॉप्युलेट करना
--pg_stat_history.sql
CREATE OR REPLACE FUNCTION pg_stat_history( ) RETURNS boolean AS $$
DECLARE
endpoint_rec record ;
database_rec record ;
pg_stat_snapshot record ;
current_snapshot_timestamp timestamp without time zone;
BEGIN
current_snapshot_timestamp = date_trunc('minute',now());
FOR endpoint_rec IN SELECT * FROM endpoint
LOOP
FOR database_rec IN SELECT * FROM database WHERE endpoint_id = endpoint_rec.id
LOOP
RAISE NOTICE 'NEW SHAPSHOT IS CREATING';
--Connect to the target DB
EXECUTE 'SELECT dblink_connect(''LINK1'',''host='||endpoint_rec.host||' dbname='||database_rec.name||' user=USER password=PASSWORD '')';
RAISE NOTICE 'host % and dbname % ',endpoint_rec.host,database_rec.name;
RAISE NOTICE 'Creating snapshot of pg_stat_statements for database %',database_rec.name;
SELECT
*
INTO
pg_stat_snapshot
FROM dblink('LINK1',
'SELECT
dbid , SUM(calls),SUM(total_time),SUM(rows) ,SUM(shared_blks_hit) ,SUM(shared_blks_read) ,SUM(shared_blks_dirtied) ,SUM(shared_blks_written) ,
SUM(local_blks_hit) , SUM(local_blks_read) , SUM(local_blks_dirtied) , SUM(local_blks_written) , SUM(temp_blks_read) , SUM(temp_blks_written) , SUM(blk_read_time) , SUM(blk_write_time)
FROM pg_stat_statements WHERE dbid=(SELECT oid from pg_database where datname=current_database() )
GROUP BY dbid
'
)
AS t
( dbid oid , calls bigint ,
total_time double precision ,
rows bigint , shared_blks_hit bigint , shared_blks_read bigint ,shared_blks_dirtied bigint ,shared_blks_written bigint ,
local_blks_hit bigint ,local_blks_read bigint , local_blks_dirtied bigint ,local_blks_written bigint ,
temp_blks_read bigint ,temp_blks_written bigint ,
blk_read_time double precision , blk_write_time double precision
);
INSERT INTO pg_stat_history
(
snapshot_timestamp ,database_id ,
dbid , calls ,total_time ,
rows ,shared_blks_hit ,shared_blks_read ,shared_blks_dirtied ,shared_blks_written ,local_blks_hit ,
local_blks_read,local_blks_dirtied,local_blks_written,temp_blks_read,temp_blks_written,
blk_read_time, blk_write_time
)
VALUES
(
current_snapshot_timestamp ,
database_rec.id ,
pg_stat_snapshot.dbid ,pg_stat_snapshot.calls,
pg_stat_snapshot.total_time,
pg_stat_snapshot.rows ,pg_stat_snapshot.shared_blks_hit ,pg_stat_snapshot.shared_blks_read ,pg_stat_snapshot.shared_blks_dirtied ,pg_stat_snapshot.shared_blks_written ,
pg_stat_snapshot.local_blks_hit , pg_stat_snapshot.local_blks_read , pg_stat_snapshot.local_blks_dirtied , pg_stat_snapshot.local_blks_written ,
pg_stat_snapshot.temp_blks_read , pg_stat_snapshot.temp_blks_written , pg_stat_snapshot.blk_read_time , pg_stat_snapshot.blk_write_time
);
RAISE NOTICE 'Creating snapshot of pg_stat_statements for queries with min_time more than 1000ms';
FOR pg_stat_snapshot IN
--All queries with max_time greater than 1000 ms
SELECT
*
FROM dblink('LINK1',
'SELECT
dbid , userid ,queryid,query,calls,total_time,min_time ,max_time,mean_time, stddev_time ,rows ,shared_blks_hit ,
shared_blks_read ,shared_blks_dirtied ,shared_blks_written ,
local_blks_hit , local_blks_read , local_blks_dirtied ,
local_blks_written , temp_blks_read , temp_blks_written , blk_read_time ,
blk_write_time
FROM pg_stat_statements
WHERE dbid=(SELECT oid from pg_database where datname=current_database() AND min_time >= 1000 )
'
)
AS t
( dbid oid , userid oid , queryid bigint ,query text , calls bigint ,
total_time double precision ,min_time double precision ,max_time double precision , mean_time double precision , stddev_time double precision ,
rows bigint , shared_blks_hit bigint , shared_blks_read bigint ,shared_blks_dirtied bigint ,shared_blks_written bigint ,
local_blks_hit bigint ,local_blks_read bigint , local_blks_dirtied bigint ,local_blks_written bigint ,
temp_blks_read bigint ,temp_blks_written bigint ,
blk_read_time double precision , blk_write_time double precision
)
LOOP
INSERT INTO pg_stat_history
(
snapshot_timestamp ,database_id ,
dbid ,userid , queryid , query , calls ,total_time ,min_time ,max_time ,mean_time ,stddev_time ,
rows ,shared_blks_hit ,shared_blks_read ,shared_blks_dirtied ,shared_blks_written ,local_blks_hit ,
local_blks_read,local_blks_dirtied,local_blks_written,temp_blks_read,temp_blks_written,
blk_read_time, blk_write_time
)
VALUES
(
current_snapshot_timestamp ,
database_rec.id ,
pg_stat_snapshot.dbid ,pg_stat_snapshot.userid ,pg_stat_snapshot.queryid,pg_stat_snapshot.query,pg_stat_snapshot.calls,
pg_stat_snapshot.total_time,pg_stat_snapshot.min_time ,pg_stat_snapshot.max_time,pg_stat_snapshot.mean_time, pg_stat_snapshot.stddev_time ,
pg_stat_snapshot.rows ,pg_stat_snapshot.shared_blks_hit ,pg_stat_snapshot.shared_blks_read ,pg_stat_snapshot.shared_blks_dirtied ,pg_stat_snapshot.shared_blks_written ,
pg_stat_snapshot.local_blks_hit , pg_stat_snapshot.local_blks_read , pg_stat_snapshot.local_blks_dirtied , pg_stat_snapshot.local_blks_written ,
pg_stat_snapshot.temp_blks_read , pg_stat_snapshot.temp_blks_written , pg_stat_snapshot.blk_read_time , pg_stat_snapshot.blk_write_time
);
END LOOP;
PERFORM dblink_disconnect('LINK1');
END LOOP ;--FOR database_rec IN SELECT * FROM database WHERE endpoint_id = endpoint_rec.id
END LOOP;
RETURN TRUE;
END
$$ LANGUAGE plpgsql;
परिणामस्वरूप, तालिका में एक निश्चित अवधि के बाद pg_stat_इतिहास हमारे पास तालिका की सामग्री के स्नैपशॉट का एक सेट होगा pg_stat_statements लक्ष्य डेटाबेस.
असल में रिपोर्टिंग
सरल प्रश्नों का उपयोग करके, आप काफी उपयोगी और दिलचस्प रिपोर्ट प्राप्त कर सकते हैं।
किसी निश्चित समयावधि के लिए एकत्रित डेटा
जांच
SELECT
database_id ,
SUM(calls) AS calls ,SUM(total_time) AS total_time ,
SUM(rows) AS rows , SUM(shared_blks_hit) AS shared_blks_hit,
SUM(shared_blks_read) AS shared_blks_read ,
SUM(shared_blks_dirtied) AS shared_blks_dirtied,
SUM(shared_blks_written) AS shared_blks_written ,
SUM(local_blks_hit) AS local_blks_hit ,
SUM(local_blks_read) AS local_blks_read ,
SUM(local_blks_dirtied) AS local_blks_dirtied ,
SUM(local_blks_written) AS local_blks_written,
SUM(temp_blks_read) AS temp_blks_read,
SUM(temp_blks_written) temp_blks_written ,
SUM(blk_read_time) AS blk_read_time ,
SUM(blk_write_time) AS blk_write_time
FROM
pg_stat_history
WHERE
queryid IS NULL AND
database_id = DATABASE_ID AND
snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY database_id ;
डी.बी. समय
to_char(अंतराल '1 मिलीसेकंड' * pg_total_stat_history_rec.total_time, 'HH24:MI:SS.MS')
I/O समय
to_char(अंतराल '1 मिलीसेकंड' * (pg_total_stat_history_rec.blk_read_time + pg_total_stat_history_rec.blk_write_time ), 'HH24:MI:SS.MS')
कुल समय के अनुसार TOP10 SQL
जांच
SELECT
queryid ,
SUM(calls) AS calls ,
SUM(total_time) AS total_time
FROM
pg_stat_history
WHERE
queryid IS NOT NULL AND
database_id = DATABASE_ID AND
snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY queryid
ORDER BY 3 DESC
LIMIT 10
---------------------------------------------------------------------------------- | कुल निष्पादन समय के अनुसार टॉप10 एसक्यूएल | #| क्वेरी आईडी| कॉल| कॉल %| कुल_समय (एमएस) | dbtime %+----+-----------+-----------+-----------+------------------------------------+---------- | 1| 821760255| 2| .00001|00:03:23.141(203141.681 एमएस)| 5.42 | 2| 4152624390| 2| .00001|00:03:13.929( 193929.215 एमएस)| 5.17 | 3| 1484454471| 4| .00001|00:02:09.129( 129129.057 एमएस)| 3.44 | 4| 655729273| 1| .00000|00:02:01.869(121869.981 एमएस)| 3.25 | 5| 2460318461| 1| .00000|00:01:33.113(93113.835 एमएस)| 2.48 | 6| 2194493487| 4| .00001|00:00:17.377(17377.868 एमएस)| .46 | 7| 1053044345| 1| .00000|00:00:06.156( 6156.352 एमएस)| .16 | 8| 3644780286| 1| .00000|00:00:01.063(1063.830 एमएस)| .03
कुल I/O समय के अनुसार TOP10 SQL
जांच
SELECT
queryid ,
SUM(calls) AS calls ,
SUM(blk_read_time + blk_write_time) AS io_time
FROM
pg_stat_history
WHERE
queryid IS NOT NULL AND
database_id = DATABASE_ID AND
snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY queryid
ORDER BY 3 DESC
LIMIT 10
-------------------------------------------------------------------------------------------------- | कुल I/O समय के अनुसार TOP10 SQL | #| क्वेरी आईडी| कॉल| कॉल %| I/O समय (ms)|db I/O समय % +----+-----------+-----------+--------+--------------------------------+---------------- | 1| 4152624390| 2| .00001|00:08:31.616(511616.592 एमएस)| 31.06 जून | 2| 821760255| 2| .00001|00:08:27.099( 507099.036 एमएस)| 30.78 | 3| 655729273| 1| .00000|00:05:02.209( 302209.137 एमएस)| 18.35 | 4| 2460318461| 1| .00000|00:04:05.981(245981.117 एमएस)| 14.93 | 5| 1484454471| 4| .00001|00:00:39.144(39144.221 एमएस)| 2.38 | 6| 2194493487| 4| .00001|00:00:18.182(18182.816 एमएस)| 1.10 | 7| 1053044345| 1| .00000|00:00:16.611(16611.722 एमएस)| 1.01 | 8| 3644780286| 1| .00000|00:00:00.436( 436.205 एमएस)| .03
निष्पादन के अधिकतम समय के अनुसार TOP10 SQL
जांच
SELECT
id AS snapshotid ,
queryid ,
snapshot_timestamp ,
max_time
FROM
pg_stat_history
WHERE
queryid IS NOT NULL AND
database_id = DATABASE_ID AND
snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
ORDER BY 4 DESC
LIMIT 10
-------------------------------------------------------------------------------------------------- | अधिकतम निष्पादन समय के अनुसार टॉप10 एसक्यूएल | #| स्नैपशॉट| स्नैपशॉटआईडी| क्वेरी आईडी| अधिकतम समय (एमएस) 1| 05.04.2019/01/03 4169:655729273| 00| 02| 01.869:121869.981:2(04.04.2019 एमएस) | 17| 00/4153/821760255 00:01| 41.570| 101570.841| 3:04.04.2019:16(00 एमएस) | 4146| 821760255/00/01 41.570:101570.841| 4| 04.04.2019| 16:00:4144(4152624390 एमएस) | 00| 01/36.964/96964.607 5:04.04.2019| 17| 00| 4151:4152624390:00(01 एमएस) | 36.964| 96964.607/6/05.04.2019 10:00| 4188| 1484454471| 00:01:33.452(93452.150 एमएस) | 7| 04.04.2019/17/00 4150:2460318461 | 00| 01| 33.113:93113.835:8(04.04.2019 एमएस) | 15| 00/4140/1484454471 00:00| 11.892| 11892.302| 9:04.04.2019:16(00 एमएस) | 4145| 1484454471/00/00 11.892:11892.302| 10| 04.04.2019| 17:00:4152(1484454471 एमएस) | 00| 00/11.892/11892.302 XNUMX:XNUMX| XNUMX| XNUMX| XNUMX:XNUMX:XNUMX(XNUMX एमएस) | XNUMX| XNUMX/XNUMX/XNUMX XNUMX:XNUMX| XNUMX| XNUMX| XNUMX:XNUMX:XNUMX(XNUMX एमएस)
साझा बफ़र द्वारा TOP10 SQL पढ़ें/लिखें
जांच
SELECT
id AS snapshotid ,
queryid ,
snapshot_timestamp ,
shared_blks_read ,
shared_blks_written
FROM
pg_stat_history
WHERE
queryid IS NOT NULL AND
database_id = DATABASE_ID AND
snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND
( shared_blks_read > 0 OR shared_blks_written > 0 )
ORDER BY 4 DESC , 5 DESC
LIMIT 10
-------------------------------------------------------------------------------------------------- | साझा बफ़र द्वारा TOP10 SQL पढ़ें/लिखें | #| स्नैपशॉट| स्नैपशॉटआईडी| क्वेरी आईडी| साझा किए गए ब्लॉक पढ़ें| साझा किए गए ब्लॉक लिखें +----+---+---+---+---+---+----+----+----+----+----+---- 1| 04.04.2019/17/00 4153:821760255| 797308| 0| 2| 04.04.2019 | 16| 00/4146/821760255 797308:0| 3| 05.04.2019| 01| 03 | 4169| 655729273/797158/0 4:04.04.2019| 16| 00| 4144| 4152624390 | 756514| 0/5/04.04.2019 17:00| 4151| 4152624390| 756514| 0 | 6| 04.04.2019/17/00 4150:2460318461| 734117| 0| 7| 04.04.2019 | 17| 00/4155/3644780286 52973:0| 8| 05.04.2019| 01| 03 | 4168| 1053044345/52818/0 9:04.04.2019| 15| 00| 4141| 2194493487 | 52813| 0/10/04.04.2019 16:00| 4147| 2194493487| 52813| 0 | XNUMX| XNUMX/XNUMX/XNUMX XNUMX:XNUMX| XNUMX| XNUMX| XNUMX| XNUMX | XNUMX| XNUMX/XNUMX/XNUMX XNUMX:XNUMX| XNUMX| XNUMX| XNUMX| XNUMX --------------------------------------------------------------------------------------------------
अधिकतम निष्पादन समय के अनुसार क्वेरी वितरण का हिस्टोग्राम
अनुरोध
SELECT
MIN(max_time) AS hist_min ,
MAX(max_time) AS hist_max ,
(( MAX(max_time) - MIN(min_time) ) / hist_columns ) as hist_width
FROM
pg_stat_history
WHERE
queryid IS NOT NULL AND
database_id = DATABASE_ID AND
snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT ;
SELECT
SUM(calls) AS calls
FROM
pg_stat_history
WHERE
queryid IS NOT NULL AND
database_id =DATABASE_ID AND
snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND
( max_time >= hist_current_min AND max_time < hist_current_max ) ;
|---------------------------------------------------------------------------------------------------------------- | MAX_TIME हिस्टोग्राम | कुल कॉल: 33851920 | न्यूनतम समय: 00:00:01.063 | अधिकतम समय : 00:02:01.869 ---------------------------------------------------------------------------------- | न्यूनतम अवधि| अधिकतम अवधि| कॉल +------------------------------------------------+--------------------------------+------- | 00:00:01.063(1063.830 एमएस) | 00:00:13.144(13144.445 एमएस) | 9 | 00:00:13.144(13144.445 एमएस) | 00:00:25.225(25225.060 एमएस) | 0 | 00:00:25.225(25225.060 एमएस) | 00:00:37.305(37305.675 एमएस) | 0 | 00:00:37.305(37305.675 एमएस) | 00:00:49.386(49386.290 एमएस) | 0 | 00:00:49.386(49386.290 एमएस) | 00:01:01.466(61466.906 एमएस) | 0 | 00:01:01.466(61466.906 एमएस) | 00:01:13.547(73547.521 एमएस) | 0 | 00:01:13.547(73547.521 एमएस) | 00:01:25.628(85628.136 एमएस) | 0 | 00:01:25.628(85628.136 एमएस) | 00:01:37.708(97708.751 एमएस) | 4 | 00:01:37.708(97708.751 एमएस) | 00:01:49.789(109789.366 एमएस) | 2 | 00:01:49.789(109789.366 एमएस) | 00:02:01.869(121869.981 एमएस) | 0
प्रति सेकंड क्वेरी के अनुसार TOP10 स्नैपशॉट
अनुरोध
--pg_qps.sql
--Calculate Query Per Second
CREATE OR REPLACE FUNCTION pg_qps( pg_stat_history_id integer ) RETURNS double precision AS $$
DECLARE
pg_stat_history_rec record ;
prev_pg_stat_history_id integer ;
prev_pg_stat_history_rec record;
total_seconds double precision ;
result double precision;
BEGIN
result = 0 ;
SELECT *
INTO pg_stat_history_rec
FROM
pg_stat_history
WHERE id = pg_stat_history_id ;
IF pg_stat_history_rec.snapshot_timestamp IS NULL
THEN
RAISE EXCEPTION 'ERROR - Not found pg_stat_history for id = %',pg_stat_history_id;
END IF ;
--RAISE NOTICE 'pg_stat_history_id = % , snapshot_timestamp = %', pg_stat_history_id ,
pg_stat_history_rec.snapshot_timestamp ;
SELECT
MAX(id)
INTO
prev_pg_stat_history_id
FROM
pg_stat_history
WHERE
database_id = pg_stat_history_rec.database_id AND
queryid IS NULL AND
id < pg_stat_history_rec.id ;
IF prev_pg_stat_history_id IS NULL
THEN
RAISE NOTICE 'Not found previous pg_stat_history shapshot for id = %',pg_stat_history_id;
RETURN NULL ;
END IF;
SELECT *
INTO prev_pg_stat_history_rec
FROM
pg_stat_history
WHERE id = prev_pg_stat_history_id ;
--RAISE NOTICE 'prev_pg_stat_history_id = % , prev_snapshot_timestamp = %', prev_pg_stat_history_id , prev_pg_stat_history_rec.snapshot_timestamp ;
total_seconds = extract(epoch from ( pg_stat_history_rec.snapshot_timestamp - prev_pg_stat_history_rec.snapshot_timestamp ));
--RAISE NOTICE 'total_seconds = % ', total_seconds ;
--RAISE NOTICE 'calls = % ', pg_stat_history_rec.calls ;
IF total_seconds > 0
THEN
result = pg_stat_history_rec.calls / total_seconds ;
ELSE
result = 0 ;
END IF;
RETURN result ;
END
$$ LANGUAGE plpgsql;
SELECT
id ,
snapshot_timestamp ,
calls ,
total_time ,
( select pg_qps( id )) AS QPS ,
blk_read_time ,
blk_write_time
FROM
pg_stat_history
WHERE
queryid IS NULL AND
database_id = DATABASE_ID AND
snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT AND
( select pg_qps( id )) IS NOT NULL
ORDER BY 5 DESC
LIMIT 10
|---------------------------------------------------------------------------------------------------------------- | QueryPerSeconds नंबरों द्वारा ऑर्डर किए गए TOP10 स्नैपशॉट ---------------------------------------------------------------------------------------------------------------------------------------------------------------- | #| स्नैपशॉट| स्नैपशॉटआईडी| कॉल| कुल dbtime| क्यूपीएस | I/O समय | I/O समय % +-----+------------------+----+----+----+----+----+----+----+----+----+----+----+----+----+----+----+----+----+----+----+----+----+----+----+----+----+----+----- 1| 04.04.2019/20/04 4161:5758631| 00| 06| 30.513:390513.926:1573.396(00 एमएस)| 00| 01.470:1470.110:376(2 एमएस)| .04.04.2019 | 17| 00/4149/3529197 00:11| 48.830| 708830.618| 980.332:00:12(47.834 एमएस)| 767834.052| 108.324:3:04.04.2019(16 एमएस)| 00 | 4143| 3525360/00/10 13.492:613492.351| 979.267| 00| 08:41.396:521396.555(84.988 एमएस)| 4| 04.04.2019:21:03(4163 एमएस)| 2781536 | 00| 03/06.470/186470.979 785.745:00| 00| 00.249| 249.865:134:5(04.04.2019 एमएस)| 19| 03:4159:2890362(00 एमएस)| .03 | 16.784| 196784.755/776.979/00 00:01.441| 1441.386| 732| 6:04.04.2019:14(00 एमएस)| 4137| 2397326:00:04(43.033 एमएस)| .283033.854 | 665.924| 00/00/00.024 24.505:009 | 7| 04.04.2019| 15:00:4139(2394416 एमएस)| 00| 04:51.435:291435.010(665.116 एमएस)| .00 | 00| 12.025/12025.895/4.126 8:04.04.2019| 13| 00| 4135:2373043:00(04 एमएस)| 26.791| 266791.988:659.179:00(00 एमएस)| 00.064 | 64.261| 024/9/05.04.2019 01:03 | 4167| 4387191| 00:06:51.380(411380.293 एमएस)| 609.332| 00:05:18.847(318847.407 एमएस)| .77.507 | 10| 04.04.2019/18/01 4157:1145596| 00| 01| 19.217:79217.372:313.004(00 एमएस)| 00| 01.319:1319.676:1.666(XNUMX एमएस)| XNUMX | XNUMX| XNUMX/XNUMX/XNUMX XNUMX:XNUMX| XNUMX| XNUMX| XNUMX:XNUMX:XNUMX(XNUMX एमएस)| XNUMX| XNUMX:XNUMX:XNUMX(XNUMX एमएस)| XNUMX
QueryPerSeconds और I/O समय के साथ प्रति घंटा निष्पादन इतिहास
जांच
SELECT
id ,
snapshot_timestamp ,
calls ,
total_time ,
( select pg_qps( id )) AS QPS ,
blk_read_time ,
blk_write_time
FROM
pg_stat_history
WHERE
queryid IS NULL AND
database_id = DATABASE_ID AND
snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
ORDER BY 2
|----------------------------------------------------------------------------------------------- | HOURLY EXECUTION HISTORY WITH QueryPerSeconds and I/O Time ----------------------------------------------------------------------------------------------------------------------------------------------- | QUERY PER SECOND HISTORY | #| snapshot| snapshotID| calls| total dbtime| QPS| I/O time| I/O time % +-----+------------------+-----------+-----------+----------------------------------+-----------+----------------------------------+----------- | 1| 04.04.2019 11:00| 4131| 3747| 00:00:00.835( 835.374 ms.)| 1.041| 00:00:00.000( .000 ms.)| .000 | 2| 04.04.2019 12:00| 4133| 1002722| 00:01:52.419( 112419.376 ms.)| 278.534| 00:00:00.149( 149.105 ms.)| .133 | 3| 04.04.2019 13:00| 4135| 2373043| 00:04:26.791( 266791.988 ms.)| 659.179| 00:00:00.064( 64.261 ms.)| .024 | 4| 04.04.2019 14:00| 4137| 2397326| 00:04:43.033( 283033.854 ms.)| 665.924| 00:00:00.024( 24.505 ms.)| .009 | 5| 04.04.2019 15:00| 4139| 2394416| 00:04:51.435( 291435.010 ms.)| 665.116| 00:00:12.025( 12025.895 ms.)| 4.126 | 6| 04.04.2019 16:00| 4143| 3525360| 00:10:13.492( 613492.351 ms.)| 979.267| 00:08:41.396( 521396.555 ms.)| 84.988 | 7| 04.04.2019 17:00| 4149| 3529197| 00:11:48.830( 708830.618 ms.)| 980.332| 00:12:47.834( 767834.052 ms.)| 108.324 | 8| 04.04.2019 18:01| 4157| 1145596| 00:01:19.217( 79217.372 ms.)| 313.004| 00:00:01.319( 1319.676 ms.)| 1.666 | 9| 04.04.2019 19:03| 4159| 2890362| 00:03:16.784( 196784.755 ms.)| 776.979| 00:00:01.441( 1441.386 ms.)| .732 | 10| 04.04.2019 20:04| 4161| 5758631| 00:06:30.513( 390513.926 ms.)| 1573.396| 00:00:01.470( 1470.110 ms.)| .376 | 11| 04.04.2019 21:03| 4163| 2781536| 00:03:06.470( 186470.979 ms.)| 785.745| 00:00:00.249( 249.865 ms.)| .134 | 12| 04.04.2019 23:03| 4165| 1443155| 00:01:34.467( 94467.539 ms.)| 200.438| 00:00:00.015( 15.287 ms.)| .016 | 13| 05.04.2019 01:03| 4167| 4387191| 00:06:51.380( 411380.293 ms.)| 609.332| 00:05:18.847( 318847.407 ms.)| 77.507 | 14| 05.04.2019 02:03| 4171| 189852| 00:00:10.989( 10989.899 ms.)| 52.737| 00:00:00.539( 539.110 ms.)| 4.906 | 15| 05.04.2019 03:01| 4173| 3627| 00:00:00.103( 103.000 ms.)| 1.042| 00:00:00.004( 4.131 ms.)| 4.010 | 16| 05.04.2019 04:00| 4175| 3627| 00:00:00.085( 85.235 ms.)| 1.025| 00:00:00.003( 3.811 ms.)| 4.471 | 17| 05.04.2019 05:00| 4177| 3747| 00:00:00.849( 849.454 ms.)| 1.041| 00:00:00.006( 6.124 ms.)| .721 | 18| 05.04.2019 06:00| 4179| 3747| 00:00:00.849( 849.561 ms.)| 1.041| 00:00:00.000( .051 ms.)| .006 | 19| 05.04.2019 07:00| 4181| 3747| 00:00:00.839( 839.416 ms.)| 1.041| 00:00:00.000( .062 ms.)| .007 | 20| 05.04.2019 08:00| 4183| 3747| 00:00:00.846( 846.382 ms.)| 1.041| 00:00:00.000( .007 ms.)| .001 | 21| 05.04.2019 09:00| 4185| 3747| 00:00:00.855( 855.426 ms.)| 1.041| 00:00:00.000( .065 ms.)| .008 | 22| 05.04.2019 10:00| 4187| 3797| 00:01:40.150( 100150.165 ms.)| 1.055| 00:00:21.845( 21845.217 ms.)| 21.812
सभी SQL चयनों का पाठ
जांच
SELECT
queryid ,
query
FROM
pg_stat_history
WHERE
queryid IS NOT NULL AND
database_id = DATABASE_ID AND
snapshot_timestamp BETWEEN BEGIN_TIMEPOINT AND END_TIMEPOINT
GROUP BY queryid , query
संपूर्ण
जैसा कि आप देख सकते हैं, काफी सरल तरीकों से, आप कार्यभार और डेटाबेस की स्थिति के बारे में बहुत सारी उपयोगी जानकारी प्राप्त कर सकते हैं।
Primechenie:यदि आप प्रश्नों में queryid को ठीक करते हैं, तो हमें एक अलग अनुरोध के लिए इतिहास मिलेगा (स्थान बचाने के लिए, एक अलग अनुरोध के लिए रिपोर्ट छोड़ दी जाती है)।
इसलिए, क्वेरी प्रदर्शन पर सांख्यिकीय डेटा उपलब्ध और एकत्र किया गया है।
पहला चरण "सांख्यिकीय डेटा का संग्रह" पूरा हो गया है।
आप दूसरे चरण पर आगे बढ़ सकते हैं - "प्रदर्शन मेट्रिक्स कॉन्फ़िगर करना"।
लेकिन यह एक और कहानी है।
को जारी रखा जाएगा ...
स्रोत: www.habr.com