మేము ఏనుగును భాగాలుగా తింటాము. ఉదాహరణలతో అప్లికేషన్ ఆరోగ్య పర్యవేక్షణ వ్యూహం

హలో అందరికీ!

మా కంపెనీ సాఫ్ట్‌వేర్ అభివృద్ధి మరియు తదుపరి సాంకేతిక మద్దతులో నిమగ్నమై ఉంది. సాంకేతిక మద్దతుకు కేవలం లోపాలను పరిష్కరించడం మాత్రమే కాదు, మా అప్లికేషన్‌ల పనితీరును పర్యవేక్షించడం అవసరం.

ఉదాహరణకు, సేవల్లో ఒకటి క్రాష్ అయినట్లయితే, మీరు ఈ సమస్యను స్వయంచాలకంగా రికార్డ్ చేయాలి మరియు దాన్ని పరిష్కరించడం ప్రారంభించాలి మరియు అసంతృప్తిగా ఉన్న వినియోగదారులు సాంకేతిక మద్దతును సంప్రదించడానికి వేచి ఉండకూడదు.

మా వద్ద చిన్న కంపెనీ ఉంది, మానిటరింగ్ అప్లికేషన్‌ల కోసం ఎలాంటి సంక్లిష్ట పరిష్కారాలను అధ్యయనం చేయడానికి మరియు నిర్వహించడానికి మాకు వనరులు లేవు, మేము సరళమైన మరియు సమర్థవంతమైన పరిష్కారాన్ని కనుగొనవలసి ఉంటుంది.

మేము ఏనుగును భాగాలుగా తింటాము. ఉదాహరణలతో అప్లికేషన్ ఆరోగ్య పర్యవేక్షణ వ్యూహం

పర్యవేక్షణ వ్యూహం

అప్లికేషన్ యొక్క కార్యాచరణను తనిఖీ చేయడం అంత సులభం కాదు; సంక్లిష్టమైన బహుళ-లింక్ సిస్టమ్‌ను ధృవీకరించడం చాలా కష్టం.

మీరు ఏనుగును ఎలా తినగలరు? భాగాలుగా మాత్రమే! అప్లికేషన్‌లను పర్యవేక్షించడానికి మేము ఈ విధానాన్ని ఉపయోగిస్తాము.

మా పర్యవేక్షణ వ్యూహం యొక్క సారాంశం:

మీ అప్లికేషన్‌ను భాగాలుగా విభజించండి.
ప్రతి భాగం కోసం నియంత్రణ తనిఖీలను సృష్టించండి.

అన్ని నియంత్రణ తనిఖీలు లోపాలు లేకుండా నిర్వహించబడితే ఒక భాగం కార్యాచరణగా పరిగణించబడుతుంది. అప్లికేషన్ యొక్క అన్ని భాగాలు క్రియాత్మకంగా ఉంటే అది ఆరోగ్యకరమైనదిగా పరిగణించబడుతుంది.

అందువల్ల, ఏదైనా వ్యవస్థను భాగాల చెట్టుగా సూచించవచ్చు. సంక్లిష్ట భాగాలు సరళమైనవిగా విభజించబడ్డాయి. సాధారణ భాగాలు తనిఖీలను కలిగి ఉంటాయి.

మేము ఏనుగును భాగాలుగా తింటాము. ఉదాహరణలతో అప్లికేషన్ ఆరోగ్య పర్యవేక్షణ వ్యూహం

బెంచ్‌మార్క్‌లు ఫంక్షనల్ టెస్టింగ్ చేయడానికి ఉద్దేశించినవి కావు, అవి యూనిట్ పరీక్షలు కాదు. నియంత్రణ తనిఖీలు ప్రస్తుత సమయంలో భాగం ఎలా అనిపిస్తుందో, దాని పనితీరుకు అవసరమైన అన్ని వనరులు ఉన్నాయా మరియు ఏవైనా సమస్యలు ఉన్నాయా అని తనిఖీ చేయాలి.

అద్భుతాలు లేవు; చాలా తనిఖీలను స్వతంత్రంగా అభివృద్ధి చేయాలి. కానీ భయపడవద్దు, ఎందుకంటే చాలా సందర్భాలలో ఒక చెక్ కోడ్ యొక్క 5-10 లైన్లను తీసుకుంటుంది, కానీ మీరు ఏదైనా లాజిక్ని అమలు చేయవచ్చు మరియు చెక్ ఎలా పనిచేస్తుందో మీరు స్పష్టంగా అర్థం చేసుకుంటారు.

పర్యవేక్షణ వ్యవస్థ

మేము అప్లికేషన్‌ను భాగాలుగా విభజించాము, ప్రతి భాగం కోసం తనిఖీలను రూపొందించాము మరియు అమలు చేస్తాము, అయితే ఈ తనిఖీల ఫలితాలతో ఏమి చేయాలి? కొన్ని చెక్ విఫలమైతే మనకు ఎలా తెలుస్తుంది?

మాకు పర్యవేక్షణ వ్యవస్థ అవసరం. ఆమె ఈ క్రింది విధులను నిర్వహిస్తుంది:

  • పరీక్ష ఫలితాలను స్వీకరించండి మరియు భాగాల స్థితిని గుర్తించడానికి వాటిని ఉపయోగించండి.
    దృశ్యమానంగా, ఇది కాంపోనెంట్ ట్రీని హైలైట్ చేస్తున్నట్లు కనిపిస్తోంది. ఫంక్షనల్ భాగాలు ఆకుపచ్చగా మారుతాయి, సమస్యాత్మకమైనవి ఎరుపు రంగులోకి మారుతాయి.
  • బాక్స్ వెలుపల సాధారణ తనిఖీలను నిర్వహించండి.
    పర్యవేక్షణ వ్యవస్థ కొన్ని తనిఖీలను స్వయంగా చేయగలదు. చక్రాన్ని ఎందుకు తిరిగి ఆవిష్కరించాలి, వాటిని ఉపయోగించుకుందాం. ఉదాహరణకు, మీరు వెబ్‌సైట్ పేజీ తెరవబడుతుందో లేదా సర్వర్ పింగ్ అవుతుందో లేదో తనిఖీ చేయవచ్చు.
  • ఆసక్తి గల పార్టీలకు సమస్యల నోటిఫికేషన్‌లను పంపండి.
  • పర్యవేక్షణ డేటా యొక్క విజువలైజేషన్, నివేదికలు, గ్రాఫ్‌లు మరియు గణాంకాలను అందించడం.

ASMO వ్యవస్థ యొక్క సంక్షిప్త వివరణ

ఒక ఉదాహరణతో వివరించడం ఉత్తమం. ASMO వ్యవస్థ యొక్క పనితీరు యొక్క పర్యవేక్షణ ఎలా నిర్వహించబడుతుందో చూద్దాం.

ASMO అనేది ఆటోమేటెడ్ వాతావరణ సహాయక వ్యవస్థ. డి-ఐసింగ్ మెటీరియల్స్‌తో రహదారిని ఎక్కడ మరియు ఎప్పుడు ట్రీట్ చేయడం అవసరం అనే విషయాన్ని రోడ్ సర్వీస్ స్పెషలిస్ట్‌లకు అర్థం చేసుకోవడానికి సిస్టమ్ సహాయం చేస్తుంది. సిస్టమ్ రోడ్ కంట్రోల్ పాయింట్ల నుండి డేటాను సేకరిస్తుంది. రహదారి నియంత్రణ స్థానం అనేది రహదారిపై పరికరాలు వ్యవస్థాపించబడిన ప్రదేశం: వాతావరణ స్టేషన్, వీడియో కెమెరా మొదలైనవి. ప్రమాదకరమైన పరిస్థితులను అంచనా వేయడానికి, సిస్టమ్ బాహ్య వనరుల నుండి వాతావరణ సూచనలను అందుకుంటుంది.

మేము ఏనుగును భాగాలుగా తింటాము. ఉదాహరణలతో అప్లికేషన్ ఆరోగ్య పర్యవేక్షణ వ్యూహం

కాబట్టి, సిస్టమ్ యొక్క కూర్పు చాలా విలక్షణమైనది: వెబ్‌సైట్, ఏజెంట్, పరికరాలు. పర్యవేక్షణ ప్రారంభిద్దాం.

వ్యవస్థను భాగాలుగా విభజించడం

ASMO వ్యవస్థలో క్రింది భాగాలను వేరు చేయవచ్చు:

1. వ్యక్తిగత ఖాతా
ఇది వెబ్ అప్లికేషన్. కనీసం, మీరు అప్లికేషన్ ఇంటర్నెట్‌లో అందుబాటులో ఉందో లేదో తనిఖీ చేయాలి.

2. డేటాబేస్
డేటాబేస్ రిపోర్టింగ్ కోసం ముఖ్యమైన డేటాను నిల్వ చేస్తుంది మరియు డేటాబేస్ బ్యాకప్‌లు విజయవంతంగా సృష్టించబడతాయని మీరు నిర్ధారించుకోవాలి.

3. సర్వర్
సర్వర్ అంటే అప్లికేషన్లు రన్ అయ్యే హార్డ్‌వేర్ అని అర్థం. HDD, RAM, CPU యొక్క స్థితిని తనిఖీ చేయడం అవసరం.

4. ఏజెంట్
ఇది షెడ్యూల్‌లో అనేక విభిన్న పనులను చేసే Windows సర్వీస్. కనీసం, మీరు సేవ అమలవుతుందో లేదో తనిఖీ చేయాలి.

5. ఏజెంట్ పని
ఏజెంట్ పనిచేస్తున్నాడని తెలిస్తే సరిపోదు. ఏజెంట్ పని చేయవచ్చు, కానీ తనకు కేటాయించిన విధులను నిర్వర్తించకపోవచ్చు. ఏజెంట్ కాంపోనెంట్‌ను టాస్క్‌లుగా విభజించి, ప్రతి ఏజెంట్ టాస్క్ విజయవంతంగా పనిచేస్తుందో లేదో తనిఖీ చేద్దాం.

6. రోడ్డు నియంత్రణ పాయింట్లు (అన్ని MPCల కంటైనర్)
అనేక రహదారి నియంత్రణ పాయింట్లు ఉన్నాయి, కాబట్టి అన్ని MPCలను ఒక భాగంలో కలపండి. ఇది పర్యవేక్షణ డేటాను చదవడానికి మరింత సౌకర్యవంతంగా ఉంటుంది. "ASMO సిస్టమ్" భాగం యొక్క స్థితిని చూసినప్పుడు, సమస్యలు ఎక్కడ ఉన్నాయో వెంటనే స్పష్టంగా తెలుస్తుంది: అప్లికేషన్లు, హార్డ్వేర్ లేదా గరిష్ట నియంత్రణ వ్యవస్థలో.

7. రోడ్ కంట్రోల్ పాయింట్ (ఒక గరిష్ట పరిమితి)
ఈ MPCలోని అన్ని పరికరాలు సేవ చేయదగినవి అయితే, మేము ఈ కాంపోనెంట్‌ను సేవ చేయదగినదిగా పరిగణిస్తాము.

8. పరికరం
ఇది గరిష్ట ఏకాగ్రత పరిమితిలో ఇన్‌స్టాల్ చేయబడిన వీడియో కెమెరా లేదా వాతావరణ స్టేషన్. పరికరం సరిగ్గా పని చేస్తుందో లేదో తనిఖీ చేయడం అవసరం.

పర్యవేక్షణ వ్యవస్థలో, కాంపోనెంట్ ట్రీ ఇలా కనిపిస్తుంది:

మేము ఏనుగును భాగాలుగా తింటాము. ఉదాహరణలతో అప్లికేషన్ ఆరోగ్య పర్యవేక్షణ వ్యూహం

వెబ్ అప్లికేషన్ మానిటరింగ్

కాబట్టి, మేము సిస్టమ్‌ను భాగాలుగా విభజించాము, ఇప్పుడు మేము ప్రతి భాగం కోసం తనిఖీలతో ముందుకు రావాలి.

వెబ్ అప్లికేషన్‌ను పర్యవేక్షించడానికి మేము ఈ క్రింది తనిఖీలను ఉపయోగిస్తాము:

1. ప్రధాన పేజీ ప్రారంభాన్ని తనిఖీ చేస్తోంది
ఈ తనిఖీ పర్యవేక్షణ వ్యవస్థచే నిర్వహించబడుతుంది. దీన్ని అమలు చేయడానికి, మేము పేజీ చిరునామా, ఆశించిన ప్రతిస్పందన భాగం మరియు గరిష్ట అభ్యర్థన అమలు సమయాన్ని సూచిస్తాము.

2. డొమైన్ చెల్లింపు గడువును తనిఖీ చేస్తోంది
చాలా ముఖ్యమైన చెక్. డొమైన్ చెల్లించబడనప్పుడు, వినియోగదారులు సైట్‌ను తెరవలేరు. సమస్యను పరిష్కరించడానికి చాలా రోజులు పట్టవచ్చు, ఎందుకంటే... DNS మార్పులు వెంటనే వర్తించవు.

3. SSL ప్రమాణపత్రాన్ని తనిఖీ చేస్తోంది
ఈ రోజుల్లో, దాదాపు అన్ని వెబ్‌సైట్‌లు యాక్సెస్ కోసం https ప్రోటోకాల్‌ను ఉపయోగిస్తున్నాయి. ప్రోటోకాల్ సరిగ్గా పని చేయడానికి, మీకు చెల్లుబాటు అయ్యే SSL ప్రమాణపత్రం అవసరం.

పర్యవేక్షణ సిస్టమ్‌లోని “వ్యక్తిగత ఖాతా” భాగం దిగువన ఉంది:

మేము ఏనుగును భాగాలుగా తింటాము. ఉదాహరణలతో అప్లికేషన్ ఆరోగ్య పర్యవేక్షణ వ్యూహం

పైన ఉన్న అన్ని చెక్‌లు చాలా అప్లికేషన్‌లకు పని చేస్తాయి మరియు కోడింగ్ అవసరం లేదు. ఇది చాలా బాగుంది ఎందుకంటే మీరు ఏదైనా వెబ్ అప్లికేషన్‌ను 5 నిమిషాల్లో పర్యవేక్షించడం ప్రారంభించవచ్చు. వెబ్ అప్లికేషన్ కోసం నిర్వహించగల అదనపు తనిఖీలు క్రింద ఉన్నాయి, కానీ వాటి అమలు మరింత సంక్లిష్టమైనది మరియు అప్లికేషన్-నిర్దిష్టమైనది, కాబట్టి మేము వాటిని ఈ కథనంలో కవర్ చేయము.

మీరు ఇంకా ఏమి తనిఖీ చేయవచ్చు?

మీ వెబ్ అప్లికేషన్‌ను మరింత పూర్తిగా పర్యవేక్షించడానికి, మీరు ఈ క్రింది తనిఖీలను చేయవచ్చు:

  • వ్యవధికి JavaScript ఎర్రర్‌ల సంఖ్య
  • వ్యవధి కోసం వెబ్ అప్లికేషన్ వైపు (బ్యాక్-ఎండ్) లోపాల సంఖ్య
  • విజయవంతం కాని వెబ్ అప్లికేషన్ ప్రతిస్పందనల సంఖ్య (ప్రతిస్పందన కోడ్ 404, 500, మొదలైనవి)
  • సగటు ప్రశ్న అమలు సమయం

విండోస్ సేవను పర్యవేక్షించడం (ఏజెంట్)

ASMO సిస్టమ్‌లో, ఏజెంట్ టాస్క్ షెడ్యూలర్ పాత్రను పోషిస్తాడు, ఇది నేపథ్యంలో షెడ్యూల్ చేసిన పనులను అమలు చేస్తుంది.

అన్ని ఏజెంట్ పనులు విజయవంతంగా పూర్తయితే, ఏజెంట్ సరిగ్గా పని చేస్తున్నాడు. ఏజెంట్‌ను పర్యవేక్షించడానికి, మీరు దాని పనులను పర్యవేక్షించాల్సిన అవసరం ఉందని తేలింది. అందువల్ల, మేము "ఏజెంట్" భాగాన్ని పనులుగా విభజిస్తాము. ప్రతి పని కోసం, మేము మానిటరింగ్ సిస్టమ్‌లో ఒక ప్రత్యేక భాగాన్ని సృష్టిస్తాము, ఇక్కడ “ఏజెంట్” భాగం “పేరెంట్” అవుతుంది.

మేము ఏజెంట్ కాంపోనెంట్‌ని చైల్డ్ కాంపోనెంట్‌లుగా విభజిస్తాము (టాస్క్‌లు):

మేము ఏనుగును భాగాలుగా తింటాము. ఉదాహరణలతో అప్లికేషన్ ఆరోగ్య పర్యవేక్షణ వ్యూహం

కాబట్టి, మేము సంక్లిష్టమైన భాగాన్ని అనేక సాధారణమైనవిగా విభజించాము. ఇప్పుడు మనం ప్రతి సాధారణ భాగానికి చెక్‌లతో ముందుకు రావాలి. దయచేసి పేరెంట్ కాంపోనెంట్ "ఏజెంట్"కి ఎటువంటి తనిఖీలు ఉండవని గమనించండి, ఎందుకంటే పర్యవేక్షణ వ్యవస్థ దాని పిల్లల భాగాల స్థితిని బట్టి దాని స్థితిని స్వతంత్రంగా గణిస్తుంది. మరో మాటలో చెప్పాలంటే, అన్ని పనులు విజయవంతంగా పూర్తయితే, అప్పుడు ఏజెంట్ విజయవంతంగా నడుస్తోంది.

ASMO సిస్టమ్‌లో వందకు పైగా టాస్క్‌లు ఉన్నాయి, ప్రతి పనికి ప్రత్యేకమైన తనిఖీలతో ముందుకు రావడం నిజంగా అవసరమా? వాస్తవానికి, మేము ప్రతి ఏజెంట్ పని కోసం మా స్వంత ప్రత్యేక తనిఖీలను రూపొందించి అమలు చేస్తే నియంత్రణ మెరుగ్గా ఉంటుంది, కానీ చాలా సందర్భాలలో సార్వత్రిక తనిఖీలను ఉపయోగించడం సరిపోతుంది.

ASMO సిస్టమ్ పనుల కోసం సార్వత్రిక తనిఖీలను మాత్రమే ఉపయోగిస్తుంది మరియు సిస్టమ్ పనితీరును పర్యవేక్షించడానికి ఇది సరిపోతుంది.

పురోగతిని తనిఖీ చేస్తోంది
సరళమైన మరియు అత్యంత ప్రభావవంతమైన చెక్ ఎగ్జిక్యూషన్ చెక్. తప్పులు లేకుండా పని పూర్తయిందని చెక్ ధృవీకరిస్తుంది. అన్ని పనులకు ఈ చెక్ ఉంటుంది.

ధ్రువీకరణ అల్గోరిథం

ప్రతి టాస్క్ ఎగ్జిక్యూషన్ తర్వాత, టాస్క్ ఎగ్జిక్యూషన్ విజయవంతమైతే మీరు SUCCESS చెక్ ఫలితాన్ని మానిటరింగ్ సిస్టమ్‌కి పంపాలి, లేదా ఎగ్జిక్యూషన్ లోపంతో పూర్తయితే ERROR.

ఈ తనిఖీ కింది సమస్యలను గుర్తించగలదు:

  1. పని నడుస్తుంది కానీ లోపంతో విఫలమవుతుంది.
  2. పని అమలు చేయడం ఆగిపోయింది, ఉదాహరణకు, అది స్తంభింపజేసింది.

ఈ సమస్యలు ఎలా పరిష్కరించబడతాయో మరింత వివరంగా చూద్దాం.

సమస్య 1 - టాస్క్ నడుస్తుంది కానీ లోపంతో విఫలమవుతుంది
టాస్క్ నడుస్తుంది కానీ 14:00 మరియు 16:00 మధ్య విఫలమయ్యే సందర్భం క్రింద ఉంది.

మేము ఏనుగును భాగాలుగా తింటాము. ఉదాహరణలతో అప్లికేషన్ ఆరోగ్య పర్యవేక్షణ వ్యూహం

ఒక పని విఫలమైనప్పుడు, ఒక సిగ్నల్ వెంటనే పర్యవేక్షణ వ్యవస్థకు పంపబడుతుంది మరియు పర్యవేక్షణ వ్యవస్థలో సంబంధిత చెక్ యొక్క స్థితి అలారం అవుతుంది అని ఫిగర్ చూపిస్తుంది.

దయచేసి పర్యవేక్షణ వ్యవస్థలో, భాగం యొక్క స్థితి ధృవీకరణ స్థితిపై ఆధారపడి ఉంటుందని గమనించండి. చెక్ యొక్క అలారం స్థితి అన్ని ఉన్నత-స్థాయి భాగాలను అలారంగా మారుస్తుంది, దిగువ బొమ్మను చూడండి.

మేము ఏనుగును భాగాలుగా తింటాము. ఉదాహరణలతో అప్లికేషన్ ఆరోగ్య పర్యవేక్షణ వ్యూహం

సమస్య 2 - పనిని అమలు చేయడం ఆగిపోయింది (స్తంభింపజేయబడింది)
ఒక పని నిలిచిపోయిందని పర్యవేక్షణ వ్యవస్థ ఎలా అర్థం చేసుకుంటుంది?

చెక్ ఫలితం చెల్లుబాటు వ్యవధిని కలిగి ఉంటుంది, ఉదాహరణకు, 1 గంట. ఒక గంట గడిచినా మరియు కొత్త పరీక్ష ఫలితం లేనట్లయితే, పర్యవేక్షణ వ్యవస్థ పరీక్ష స్థితిని అలారంకు సెట్ చేస్తుంది.

మేము ఏనుగును భాగాలుగా తింటాము. ఉదాహరణలతో అప్లికేషన్ ఆరోగ్య పర్యవేక్షణ వ్యూహం

పై చిత్రంలో, మధ్యాహ్నం 14:00 గంటలకు లైట్లు ఆపివేయబడ్డాయి. 15:00 గంటలకు, పరీక్ష ఫలితం (14:00 నుండి) కుళ్ళిపోయిందని పర్యవేక్షణ వ్యవస్థ గుర్తిస్తుంది, ఎందుకంటే ఔచిత్యం సమయం ముగిసింది (ఒక గంట), కానీ కొత్త ఫలితం లేదు మరియు చెక్ అలారం స్థితికి మారుతుంది.

16:00 గంటలకు లైట్లు మళ్లీ ఆన్ చేయబడ్డాయి, ప్రోగ్రామ్ పనిని పూర్తి చేస్తుంది మరియు అమలు ఫలితాన్ని పర్యవేక్షణ వ్యవస్థకు పంపుతుంది, పరీక్ష స్థితి మళ్లీ విజయవంతమవుతుంది.

నేను ఏ తనిఖీ సంబంధిత సమయాన్ని ఉపయోగించాలి?

ఔచిత్యం సమయం విధిని అమలు చేసే కాలం కంటే ఎక్కువగా ఉండాలి. టాస్క్ ఎగ్జిక్యూషన్ వ్యవధి కంటే 2-3 రెట్లు ఎక్కువ ఔచిత్యం సమయాన్ని సెట్ చేయాలని నేను సిఫార్సు చేస్తున్నాను. ఉదాహరణకు, ఒక పని సాధారణం కంటే ఎక్కువ సమయం తీసుకున్నప్పుడు లేదా ప్రోగ్రామ్‌ను ఎవరైనా రీలోడ్ చేసినప్పుడు తప్పుడు నోటిఫికేషన్‌లను స్వీకరించకుండా ఉండటానికి ఇది అవసరం.

పురోగతిని తనిఖీ చేస్తోంది

ASMO సిస్టమ్ "లోడ్ ఫోర్‌కాస్ట్" టాస్క్‌ను కలిగి ఉంది, ఇది గంటకు ఒకసారి బాహ్య మూలం నుండి కొత్త సూచనను డౌన్‌లోడ్ చేయడానికి ప్రయత్నిస్తుంది. బాహ్య వ్యవస్థలో కొత్త సూచన కనిపించినప్పుడు ఖచ్చితమైన సమయం తెలియదు, కానీ ఇది రోజుకు 2 సార్లు జరుగుతుందని తెలుసు. చాలా గంటలు కొత్త సూచన లేకపోతే, ఇది సాధారణం, కానీ ఒక రోజు కంటే ఎక్కువ కాలం కొత్త సూచన లేకపోతే, ఎక్కడో ఏదో విచ్ఛిన్నమైంది. ఉదాహరణకు, బాహ్య సూచన సిస్టమ్‌లోని డేటా ఫార్మాట్ మారవచ్చు, అందుకే ASMO కొత్త సూచన విడుదలను చూడదు.

ధ్రువీకరణ అల్గోరిథం

పని పురోగతిని పొందడంలో విజయవంతమైనప్పుడు (కొత్త వాతావరణ సూచనను డౌన్‌లోడ్ చేయడం) పర్యవేక్షణ సిస్టమ్‌కు SUCCESS చెక్ ఫలితాన్ని పంపుతుంది. పురోగతి లేకుంటే లేదా లోపం సంభవించినట్లయితే, పర్యవేక్షణ వ్యవస్థకు ఏమీ పంపబడదు.

చెక్ తప్పనిసరిగా సంబంధిత విరామాన్ని కలిగి ఉండాలి, ఈ సమయంలో అది కొత్త పురోగతిని పొందుతుందని హామీ ఇవ్వబడుతుంది.

మేము ఏనుగును భాగాలుగా తింటాము. ఉదాహరణలతో అప్లికేషన్ ఆరోగ్య పర్యవేక్షణ వ్యూహం

మానిటరింగ్ సిస్టమ్ చివరి స్కాన్ ఫలితం యొక్క చెల్లుబాటు వ్యవధి ముగిసే వరకు వేచి ఉన్నందున, సమస్య గురించి ఆలస్యంగా తెలుసుకుంటామని దయచేసి గమనించండి. అందువల్ల, చెక్కు యొక్క చెల్లుబాటు వ్యవధి చాలా ఎక్కువ కాలం చేయవలసిన అవసరం లేదు.

డేటాబేస్ పర్యవేక్షణ

ASMO సిస్టమ్‌లో డేటాబేస్ను నియంత్రించడానికి, మేము ఈ క్రింది తనిఖీలను చేస్తాము:

  1. బ్యాకప్ సృష్టిని ధృవీకరిస్తోంది
  2. ఖాళీ డిస్క్ స్థలాన్ని తనిఖీ చేస్తోంది

బ్యాకప్ సృష్టిని ధృవీకరిస్తోంది
చాలా అప్లికేషన్‌లలో, నవీనమైన డేటాబేస్ బ్యాకప్‌లను కలిగి ఉండటం ముఖ్యం, తద్వారా సర్వర్ విఫలమైతే, మీరు ప్రోగ్రామ్‌ను కొత్త సర్వర్‌కి అమలు చేయవచ్చు.

ASMO వారానికి ఒకసారి బ్యాకప్ కాపీని సృష్టించి, నిల్వకు పంపుతుంది. ఈ ప్రక్రియ విజయవంతంగా పూర్తయినప్పుడు, విజయవంతమైన తనిఖీ ఫలితం పర్యవేక్షణ వ్యవస్థకు పంపబడుతుంది. ధృవీకరణ ఫలితం 9 రోజులు చెల్లుబాటు అవుతుంది. ఆ. బ్యాకప్‌ల సృష్టిని నియంత్రించడానికి, మేము పైన చర్చించిన "ప్రోగ్రెస్ చెక్" మెకానిజం ఉపయోగించబడుతుంది.

ఖాళీ డిస్క్ స్థలాన్ని తనిఖీ చేస్తోంది
డిస్క్‌లో తగినంత ఖాళీ స్థలం లేనట్లయితే, డేటాబేస్ సరిగ్గా పనిచేయదు, కాబట్టి ఖాళీ స్థలాన్ని నియంత్రించడం చాలా ముఖ్యం.

సంఖ్యా పారామితులను తనిఖీ చేయడానికి కొలమానాలను ఉపయోగించడం సౌకర్యంగా ఉంటుంది.

కొలమానాలు ఒక సంఖ్యా వేరియబుల్, దీని విలువ పర్యవేక్షణ వ్యవస్థకు ప్రసారం చేయబడుతుంది. పర్యవేక్షణ వ్యవస్థ థ్రెషోల్డ్ విలువలను తనిఖీ చేస్తుంది మరియు మెట్రిక్ స్థితిని లెక్కిస్తుంది.

పర్యవేక్షణ సిస్టమ్‌లో “డేటాబేస్” భాగం ఎలా ఉంటుందో దాని చిత్రం క్రింద ఉంది:

మేము ఏనుగును భాగాలుగా తింటాము. ఉదాహరణలతో అప్లికేషన్ ఆరోగ్య పర్యవేక్షణ వ్యూహం

సర్వర్ పర్యవేక్షణ

సర్వర్‌ని పర్యవేక్షించడానికి మేము ఈ క్రింది తనిఖీలు మరియు కొలమానాలను ఉపయోగిస్తాము:

1. ఉచిత డిస్క్ స్థలం
డిస్క్ ఖాళీ అయిపోతే, అప్లికేషన్ పని చేయదు. మేము 2 థ్రెషోల్డ్ విలువలను ఉపయోగిస్తాము: మొదటి స్థాయి హెచ్చరిక, రెండవ స్థాయి అలారం.

2. సగటు RAM విలువ గంటకు శాతం
మేము గంట సగటును ఉపయోగిస్తాము ఎందుకంటే... అరుదైన జాతులపై మాకు ఆసక్తి లేదు.

3. గంటకు సగటు CPU శాతం
మేము గంట సగటును ఉపయోగిస్తాము ఎందుకంటే... అరుదైన జాతులపై మాకు ఆసక్తి లేదు.

4. పింగ్ చెక్
సర్వర్ ఆన్‌లైన్‌లో ఉందో లేదో తనిఖీ చేస్తుంది. పర్యవేక్షణ వ్యవస్థ ఈ తనిఖీని చేయగలదు; కోడ్ వ్రాయవలసిన అవసరం లేదు.

పర్యవేక్షణ సిస్టమ్‌లో “సర్వర్” భాగం ఎలా ఉంటుందో దాని చిత్రం క్రింద ఉంది:

మేము ఏనుగును భాగాలుగా తింటాము. ఉదాహరణలతో అప్లికేషన్ ఆరోగ్య పర్యవేక్షణ వ్యూహం

సామగ్రి పర్యవేక్షణ

డేటా ఎలా పొందాలో నేను మీకు చెప్తాను. ప్రతి రహదారి నియంత్రణ పాయింట్ (MPC) కోసం టాస్క్ ప్లానర్‌లో ఒక పని ఉంది, ఉదాహరణకు, "సర్వే MPC M2 km 200". టాస్క్ ప్రతి 30 నిమిషాలకు అన్ని MPC పరికరాల నుండి డేటాను స్వీకరిస్తుంది.

కమ్యూనికేషన్ ఛానల్ సమస్య
చాలా పరికరాలు నగరం వెలుపల ఉన్నాయి; డేటా ట్రాన్స్మిషన్ కోసం GSM నెట్‌వర్క్ ఉపయోగించబడుతుంది, ఇది స్థిరంగా పనిచేయదు (నెట్‌వర్క్ ఉంది, లేదా ఒకటి లేదు).

తరచుగా నెట్‌వర్క్ వైఫల్యాల కారణంగా, మొదట, పర్యవేక్షణలో MPC సర్వేని తనిఖీ చేయడం ఇలా కనిపించింది:

మేము ఏనుగును భాగాలుగా తింటాము. ఉదాహరణలతో అప్లికేషన్ ఆరోగ్య పర్యవేక్షణ వ్యూహం

సమస్యల గురించి చాలా తప్పుడు నోటిఫికేషన్‌లు ఉన్నందున ఇది పని చేసే ఎంపిక కాదని స్పష్టమైంది. అప్పుడు ప్రతి పరికరానికి "ప్రగతి తనిఖీ"ని ఉపయోగించాలని నిర్ణయించబడింది, అనగా. పరికరం లోపం లేకుండా పోల్ చేయబడినప్పుడు మానిటరింగ్ సిస్టమ్‌కు సక్సెస్ సిగ్నల్ మాత్రమే పంపబడుతుంది. ఔచిత్యం సమయం 5 గంటలకు సెట్ చేయబడింది.

మేము ఏనుగును భాగాలుగా తింటాము. ఉదాహరణలతో అప్లికేషన్ ఆరోగ్య పర్యవేక్షణ వ్యూహం

పరికరాన్ని 5 గంటల కంటే ఎక్కువ పోల్ చేయలేనప్పుడు మాత్రమే ఇప్పుడు పర్యవేక్షణ సమస్యల గురించి నోటిఫికేషన్‌లను పంపుతుంది. అధిక స్థాయి సంభావ్యతతో, ఇవి తప్పుడు అలారాలు కాదు, కానీ నిజమైన సమస్యలు.

మానిటరింగ్ సిస్టమ్‌లో పరికరం ఎలా ఉంటుందో దాని చిత్రం క్రింద ఉంది:

మేము ఏనుగును భాగాలుగా తింటాము. ఉదాహరణలతో అప్లికేషన్ ఆరోగ్య పర్యవేక్షణ వ్యూహం

ముఖ్యం!
GSM నెట్‌వర్క్ పని చేయడం ఆపివేసినప్పుడు, అన్ని MDC పరికరాలు పోల్ చేయబడవు. మానిటరింగ్ సిస్టమ్ నుండి ఇమెయిల్‌ల సంఖ్యను తగ్గించడానికి, మా ఇంజనీర్లు "పరికరం" కంటే "MPC" రకంతో కాంపోనెంట్ సమస్యల గురించి నోటిఫికేషన్‌లకు సబ్‌స్క్రయిబ్ చేస్తారు. ఇది ప్రతి పరికరానికి ప్రత్యేక నోటిఫికేషన్‌ను స్వీకరించకుండా, ప్రతి MPCకి ఒక నోటిఫికేషన్‌ను స్వీకరించడానికి మిమ్మల్ని అనుమతిస్తుంది.

చివరి ASMO పర్యవేక్షణ పథకం

అన్నింటినీ ఒకచోట చేర్చి, మనకు ఎలాంటి పర్యవేక్షణ పథకం ఉందో చూద్దాం.

మేము ఏనుగును భాగాలుగా తింటాము. ఉదాహరణలతో అప్లికేషన్ ఆరోగ్య పర్యవేక్షణ వ్యూహం

తీర్మానం

సారాంశం చేద్దాం.
ASMO పనితీరును పర్యవేక్షించడం మాకు ఏమి ఇచ్చింది?

1. లోపం తొలగింపు సమయం తగ్గింది
మేము వినియోగదారుల నుండి లోపాల గురించి గతంలో విన్నాము, కానీ అందరు వినియోగదారులు లోపాలను నివేదించలేదు. సిస్టమ్ భాగం కనిపించిన వారం తర్వాత దాని లోపం గురించి మేము తెలుసుకున్నాము. ఇప్పుడు మానిటరింగ్ సిస్టమ్ సమస్యను గుర్తించిన వెంటనే సమస్యలను తెలియజేస్తుంది.

2. సిస్టమ్ స్థిరత్వం పెరిగింది
లోపాలను ముందుగానే తొలగించడం ప్రారంభించినందున, మొత్తం వ్యవస్థ మరింత స్థిరంగా పనిచేయడం ప్రారంభించింది.

3. సాంకేతిక మద్దతుకు కాల్‌ల సంఖ్యను తగ్గించడం
వినియోగదారులు వాటి గురించి తెలుసుకోకముందే ఇప్పుడు చాలా సమస్యలు పరిష్కరించబడ్డాయి. వినియోగదారులు సాంకేతిక మద్దతును తక్కువ తరచుగా సంప్రదించడం ప్రారంభించారు. ఇవన్నీ మన ప్రతిష్టపై మంచి ప్రభావం చూపుతాయి.

4. కస్టమర్ మరియు యూజర్ లాయల్టీని పెంచడం
కస్టమర్ సిస్టమ్ యొక్క స్థిరత్వంలో సానుకూల మార్పులను గమనించారు. సిస్టమ్‌ని ఉపయోగించి వినియోగదారులు తక్కువ సమస్యలను ఎదుర్కొంటారు.

5. సాంకేతిక మద్దతు ఖర్చులను తగ్గించండి
మేము మాన్యువల్ తనిఖీలను నిర్వహించడం మానేశాము. ఇప్పుడు అన్ని తనిఖీలు స్వయంచాలకంగా ఉన్నాయి. మునుపు, మేము వినియోగదారుల నుండి సమస్యల గురించి తెలుసుకున్నాము; వినియోగదారు ఏ సమస్య గురించి మాట్లాడుతున్నారో అర్థం చేసుకోవడం చాలా కష్టం. ఇప్పుడు, చాలా సమస్యలు పర్యవేక్షణ వ్యవస్థ ద్వారా నివేదించబడ్డాయి, నోటిఫికేషన్‌లు సాంకేతిక డేటాను కలిగి ఉంటాయి, ఇది ఎక్కడ తప్పు జరిగిందో ఎల్లప్పుడూ స్పష్టం చేస్తుంది.

ముఖ్యం!
మీ అప్లికేషన్లు రన్ అయ్యే సర్వర్‌లోనే మీరు మానిటరింగ్ సిస్టమ్‌ను ఇన్‌స్టాల్ చేయలేరు. సర్వర్ డౌన్ అయితే, అప్లికేషన్‌లు పని చేయడం ఆగిపోతాయి మరియు దాని గురించి తెలియజేయడానికి ఎవరూ ఉండరు.

పర్యవేక్షణ వ్యవస్థ తప్పనిసరిగా మరొక డేటా సెంటర్‌లోని ప్రత్యేక సర్వర్‌లో అమలు చేయబడాలి.

మీరు కొత్త డేటా సెంటర్‌లో డెడికేటెడ్ సర్వర్‌ని ఉపయోగించకూడదనుకుంటే, మీరు క్లౌడ్ మానిటరింగ్ సిస్టమ్‌ని ఉపయోగించవచ్చు. మా కంపెనీ Zidium క్లౌడ్ మానిటరింగ్ సిస్టమ్‌ను ఉపయోగిస్తుంది, కానీ మీరు ఏదైనా ఇతర పర్యవేక్షణ వ్యవస్థను ఉపయోగించవచ్చు. క్లౌడ్ మానిటరింగ్ సిస్టమ్ ధర కొత్త సర్వర్‌ను అద్దెకు తీసుకోవడం కంటే తక్కువగా ఉంటుంది.

సిఫార్సులు:

  1. వీలైనంత వివరంగా భాగాల చెట్టు రూపంలో అప్లికేషన్లు మరియు సిస్టమ్‌లను విచ్ఛిన్నం చేయండి, కాబట్టి ఎక్కడ మరియు ఏది విచ్ఛిన్నమైందో అర్థం చేసుకోవడం సౌకర్యంగా ఉంటుంది మరియు నియంత్రణ మరింత పూర్తి అవుతుంది.
  2. ఒక భాగం యొక్క కార్యాచరణను తనిఖీ చేయడానికి, పరీక్షలను ఉపయోగించండి. ఒక కాంప్లెక్స్ కంటే అనేక సాధారణ తనిఖీలను ఉపయోగించడం ఉత్తమం.
  3. మెట్రిక్ థ్రెషోల్డ్‌లను కోడ్‌లో రాయడం కంటే మానిటరింగ్ సిస్టమ్ వైపు కాన్ఫిగర్ చేయండి. ఇది అప్లికేషన్‌ను మళ్లీ కంపైల్ చేయడం, రీకాన్ఫిగర్ చేయడం లేదా రీస్టార్ట్ చేయడం నుండి మిమ్మల్ని కాపాడుతుంది.
  4. కస్టమ్ చెక్‌ల కోసం, తప్పుడు నోటిఫికేషన్‌లను స్వీకరించకుండా ఉండేందుకు ఔచిత్యం యొక్క మార్జిన్‌ని ఉపయోగించండి, ఎందుకంటే కొన్ని చెక్‌లు సాధారణం కంటే పూర్తి చేయడానికి కొంచెం ఎక్కువ సమయం పట్టింది.
  5. ఖచ్చితంగా సమస్య ఉన్నప్పుడే మానిటరింగ్ సిస్టమ్‌లోని భాగాలను ఎరుపు రంగులోకి మార్చడానికి ప్రయత్నించండి. అవి ఏమీ లేకుండా ఎర్రగా మారితే, మీరు పర్యవేక్షణ వ్యవస్థ యొక్క నోటిఫికేషన్‌లకు శ్రద్ధ చూపడం మానేస్తారు, దాని అర్థం పోతుంది.

మీరు ఇంకా పర్యవేక్షణ వ్యవస్థను ఉపయోగించకుంటే, ప్రారంభించండి! ఇది కనిపించేంత కష్టం కాదు. మీరు మీరే పెంచుకున్న ఆకుపచ్చ పదార్థాల చెట్టును చూసి ఆనందించండి.

అదృష్టవంతులు.

మూలం: www.habr.com

ఒక వ్యాఖ్యను జోడించండి