హలో అందరికీ!
మా కంపెనీ సాఫ్ట్వేర్ అభివృద్ధి మరియు తదుపరి సాంకేతిక మద్దతులో నిమగ్నమై ఉంది. సాంకేతిక మద్దతుకు కేవలం లోపాలను పరిష్కరించడం మాత్రమే కాదు, మా అప్లికేషన్ల పనితీరును పర్యవేక్షించడం అవసరం.
ఉదాహరణకు, సేవల్లో ఒకటి క్రాష్ అయినట్లయితే, మీరు ఈ సమస్యను స్వయంచాలకంగా రికార్డ్ చేయాలి మరియు దాన్ని పరిష్కరించడం ప్రారంభించాలి మరియు అసంతృప్తిగా ఉన్న వినియోగదారులు సాంకేతిక మద్దతును సంప్రదించడానికి వేచి ఉండకూడదు.
మా వద్ద చిన్న కంపెనీ ఉంది, మానిటరింగ్ అప్లికేషన్ల కోసం ఎలాంటి సంక్లిష్ట పరిష్కారాలను అధ్యయనం చేయడానికి మరియు నిర్వహించడానికి మాకు వనరులు లేవు, మేము సరళమైన మరియు సమర్థవంతమైన పరిష్కారాన్ని కనుగొనవలసి ఉంటుంది.
పర్యవేక్షణ వ్యూహం
అప్లికేషన్ యొక్క కార్యాచరణను తనిఖీ చేయడం అంత సులభం కాదు; సంక్లిష్టమైన బహుళ-లింక్ సిస్టమ్ను ధృవీకరించడం చాలా కష్టం.
మీరు ఏనుగును ఎలా తినగలరు? భాగాలుగా మాత్రమే! అప్లికేషన్లను పర్యవేక్షించడానికి మేము ఈ విధానాన్ని ఉపయోగిస్తాము.
మా పర్యవేక్షణ వ్యూహం యొక్క సారాంశం:
మీ అప్లికేషన్ను భాగాలుగా విభజించండి.
ప్రతి భాగం కోసం నియంత్రణ తనిఖీలను సృష్టించండి.
అన్ని నియంత్రణ తనిఖీలు లోపాలు లేకుండా నిర్వహించబడితే ఒక భాగం కార్యాచరణగా పరిగణించబడుతుంది. అప్లికేషన్ యొక్క అన్ని భాగాలు క్రియాత్మకంగా ఉంటే అది ఆరోగ్యకరమైనదిగా పరిగణించబడుతుంది.
అందువల్ల, ఏదైనా వ్యవస్థను భాగాల చెట్టుగా సూచించవచ్చు. సంక్లిష్ట భాగాలు సరళమైనవిగా విభజించబడ్డాయి. సాధారణ భాగాలు తనిఖీలను కలిగి ఉంటాయి.
బెంచ్మార్క్లు ఫంక్షనల్ టెస్టింగ్ చేయడానికి ఉద్దేశించినవి కావు, అవి యూనిట్ పరీక్షలు కాదు. నియంత్రణ తనిఖీలు ప్రస్తుత సమయంలో భాగం ఎలా అనిపిస్తుందో, దాని పనితీరుకు అవసరమైన అన్ని వనరులు ఉన్నాయా మరియు ఏవైనా సమస్యలు ఉన్నాయా అని తనిఖీ చేయాలి.
అద్భుతాలు లేవు; చాలా తనిఖీలను స్వతంత్రంగా అభివృద్ధి చేయాలి. కానీ భయపడవద్దు, ఎందుకంటే చాలా సందర్భాలలో ఒక చెక్ కోడ్ యొక్క 5-10 లైన్లను తీసుకుంటుంది, కానీ మీరు ఏదైనా లాజిక్ని అమలు చేయవచ్చు మరియు చెక్ ఎలా పనిచేస్తుందో మీరు స్పష్టంగా అర్థం చేసుకుంటారు.
పర్యవేక్షణ వ్యవస్థ
మేము అప్లికేషన్ను భాగాలుగా విభజించాము, ప్రతి భాగం కోసం తనిఖీలను రూపొందించాము మరియు అమలు చేస్తాము, అయితే ఈ తనిఖీల ఫలితాలతో ఏమి చేయాలి? కొన్ని చెక్ విఫలమైతే మనకు ఎలా తెలుస్తుంది?
మాకు పర్యవేక్షణ వ్యవస్థ అవసరం. ఆమె ఈ క్రింది విధులను నిర్వహిస్తుంది:
- పరీక్ష ఫలితాలను స్వీకరించండి మరియు భాగాల స్థితిని గుర్తించడానికి వాటిని ఉపయోగించండి.
దృశ్యమానంగా, ఇది కాంపోనెంట్ ట్రీని హైలైట్ చేస్తున్నట్లు కనిపిస్తోంది. ఫంక్షనల్ భాగాలు ఆకుపచ్చగా మారుతాయి, సమస్యాత్మకమైనవి ఎరుపు రంగులోకి మారుతాయి. - బాక్స్ వెలుపల సాధారణ తనిఖీలను నిర్వహించండి.
పర్యవేక్షణ వ్యవస్థ కొన్ని తనిఖీలను స్వయంగా చేయగలదు. చక్రాన్ని ఎందుకు తిరిగి ఆవిష్కరించాలి, వాటిని ఉపయోగించుకుందాం. ఉదాహరణకు, మీరు వెబ్సైట్ పేజీ తెరవబడుతుందో లేదా సర్వర్ పింగ్ అవుతుందో లేదో తనిఖీ చేయవచ్చు. - ఆసక్తి గల పార్టీలకు సమస్యల నోటిఫికేషన్లను పంపండి.
- పర్యవేక్షణ డేటా యొక్క విజువలైజేషన్, నివేదికలు, గ్రాఫ్లు మరియు గణాంకాలను అందించడం.
ASMO వ్యవస్థ యొక్క సంక్షిప్త వివరణ
ఒక ఉదాహరణతో వివరించడం ఉత్తమం. ASMO వ్యవస్థ యొక్క పనితీరు యొక్క పర్యవేక్షణ ఎలా నిర్వహించబడుతుందో చూద్దాం.
ASMO అనేది ఆటోమేటెడ్ వాతావరణ సహాయక వ్యవస్థ. డి-ఐసింగ్ మెటీరియల్స్తో రహదారిని ఎక్కడ మరియు ఎప్పుడు ట్రీట్ చేయడం అవసరం అనే విషయాన్ని రోడ్ సర్వీస్ స్పెషలిస్ట్లకు అర్థం చేసుకోవడానికి సిస్టమ్ సహాయం చేస్తుంది. సిస్టమ్ రోడ్ కంట్రోల్ పాయింట్ల నుండి డేటాను సేకరిస్తుంది. రహదారి నియంత్రణ స్థానం అనేది రహదారిపై పరికరాలు వ్యవస్థాపించబడిన ప్రదేశం: వాతావరణ స్టేషన్, వీడియో కెమెరా మొదలైనవి. ప్రమాదకరమైన పరిస్థితులను అంచనా వేయడానికి, సిస్టమ్ బాహ్య వనరుల నుండి వాతావరణ సూచనలను అందుకుంటుంది.
కాబట్టి, సిస్టమ్ యొక్క కూర్పు చాలా విలక్షణమైనది: వెబ్సైట్, ఏజెంట్, పరికరాలు. పర్యవేక్షణ ప్రారంభిద్దాం.
వ్యవస్థను భాగాలుగా విభజించడం
ASMO వ్యవస్థలో క్రింది భాగాలను వేరు చేయవచ్చు:
1. వ్యక్తిగత ఖాతా
ఇది వెబ్ అప్లికేషన్. కనీసం, మీరు అప్లికేషన్ ఇంటర్నెట్లో అందుబాటులో ఉందో లేదో తనిఖీ చేయాలి.
2. డేటాబేస్
డేటాబేస్ రిపోర్టింగ్ కోసం ముఖ్యమైన డేటాను నిల్వ చేస్తుంది మరియు డేటాబేస్ బ్యాకప్లు విజయవంతంగా సృష్టించబడతాయని మీరు నిర్ధారించుకోవాలి.
3. సర్వర్
సర్వర్ అంటే అప్లికేషన్లు రన్ అయ్యే హార్డ్వేర్ అని అర్థం. HDD, RAM, CPU యొక్క స్థితిని తనిఖీ చేయడం అవసరం.
4. ఏజెంట్
ఇది షెడ్యూల్లో అనేక విభిన్న పనులను చేసే Windows సర్వీస్. కనీసం, మీరు సేవ అమలవుతుందో లేదో తనిఖీ చేయాలి.
5. ఏజెంట్ పని
ఏజెంట్ పనిచేస్తున్నాడని తెలిస్తే సరిపోదు. ఏజెంట్ పని చేయవచ్చు, కానీ తనకు కేటాయించిన విధులను నిర్వర్తించకపోవచ్చు. ఏజెంట్ కాంపోనెంట్ను టాస్క్లుగా విభజించి, ప్రతి ఏజెంట్ టాస్క్ విజయవంతంగా పనిచేస్తుందో లేదో తనిఖీ చేద్దాం.
6. రోడ్డు నియంత్రణ పాయింట్లు (అన్ని MPCల కంటైనర్)
అనేక రహదారి నియంత్రణ పాయింట్లు ఉన్నాయి, కాబట్టి అన్ని MPCలను ఒక భాగంలో కలపండి. ఇది పర్యవేక్షణ డేటాను చదవడానికి మరింత సౌకర్యవంతంగా ఉంటుంది. "ASMO సిస్టమ్" భాగం యొక్క స్థితిని చూసినప్పుడు, సమస్యలు ఎక్కడ ఉన్నాయో వెంటనే స్పష్టంగా తెలుస్తుంది: అప్లికేషన్లు, హార్డ్వేర్ లేదా గరిష్ట నియంత్రణ వ్యవస్థలో.
7. రోడ్ కంట్రోల్ పాయింట్ (ఒక గరిష్ట పరిమితి)
ఈ MPCలోని అన్ని పరికరాలు సేవ చేయదగినవి అయితే, మేము ఈ కాంపోనెంట్ను సేవ చేయదగినదిగా పరిగణిస్తాము.
8. పరికరం
ఇది గరిష్ట ఏకాగ్రత పరిమితిలో ఇన్స్టాల్ చేయబడిన వీడియో కెమెరా లేదా వాతావరణ స్టేషన్. పరికరం సరిగ్గా పని చేస్తుందో లేదో తనిఖీ చేయడం అవసరం.
పర్యవేక్షణ వ్యవస్థలో, కాంపోనెంట్ ట్రీ ఇలా కనిపిస్తుంది:
వెబ్ అప్లికేషన్ మానిటరింగ్
కాబట్టి, మేము సిస్టమ్ను భాగాలుగా విభజించాము, ఇప్పుడు మేము ప్రతి భాగం కోసం తనిఖీలతో ముందుకు రావాలి.
వెబ్ అప్లికేషన్ను పర్యవేక్షించడానికి మేము ఈ క్రింది తనిఖీలను ఉపయోగిస్తాము:
1. ప్రధాన పేజీ ప్రారంభాన్ని తనిఖీ చేస్తోంది
ఈ తనిఖీ పర్యవేక్షణ వ్యవస్థచే నిర్వహించబడుతుంది. దీన్ని అమలు చేయడానికి, మేము పేజీ చిరునామా, ఆశించిన ప్రతిస్పందన భాగం మరియు గరిష్ట అభ్యర్థన అమలు సమయాన్ని సూచిస్తాము.
2. డొమైన్ చెల్లింపు గడువును తనిఖీ చేస్తోంది
చాలా ముఖ్యమైన చెక్. డొమైన్ చెల్లించబడనప్పుడు, వినియోగదారులు సైట్ను తెరవలేరు. సమస్యను పరిష్కరించడానికి చాలా రోజులు పట్టవచ్చు, ఎందుకంటే... DNS మార్పులు వెంటనే వర్తించవు.
3. SSL ప్రమాణపత్రాన్ని తనిఖీ చేస్తోంది
ఈ రోజుల్లో, దాదాపు అన్ని వెబ్సైట్లు యాక్సెస్ కోసం https ప్రోటోకాల్ను ఉపయోగిస్తున్నాయి. ప్రోటోకాల్ సరిగ్గా పని చేయడానికి, మీకు చెల్లుబాటు అయ్యే SSL ప్రమాణపత్రం అవసరం.
పర్యవేక్షణ సిస్టమ్లోని “వ్యక్తిగత ఖాతా” భాగం దిగువన ఉంది:
పైన ఉన్న అన్ని చెక్లు చాలా అప్లికేషన్లకు పని చేస్తాయి మరియు కోడింగ్ అవసరం లేదు. ఇది చాలా బాగుంది ఎందుకంటే మీరు ఏదైనా వెబ్ అప్లికేషన్ను 5 నిమిషాల్లో పర్యవేక్షించడం ప్రారంభించవచ్చు. వెబ్ అప్లికేషన్ కోసం నిర్వహించగల అదనపు తనిఖీలు క్రింద ఉన్నాయి, కానీ వాటి అమలు మరింత సంక్లిష్టమైనది మరియు అప్లికేషన్-నిర్దిష్టమైనది, కాబట్టి మేము వాటిని ఈ కథనంలో కవర్ చేయము.
మీరు ఇంకా ఏమి తనిఖీ చేయవచ్చు?
మీ వెబ్ అప్లికేషన్ను మరింత పూర్తిగా పర్యవేక్షించడానికి, మీరు ఈ క్రింది తనిఖీలను చేయవచ్చు:
- వ్యవధికి JavaScript ఎర్రర్ల సంఖ్య
- వ్యవధి కోసం వెబ్ అప్లికేషన్ వైపు (బ్యాక్-ఎండ్) లోపాల సంఖ్య
- విజయవంతం కాని వెబ్ అప్లికేషన్ ప్రతిస్పందనల సంఖ్య (ప్రతిస్పందన కోడ్ 404, 500, మొదలైనవి)
- సగటు ప్రశ్న అమలు సమయం
విండోస్ సేవను పర్యవేక్షించడం (ఏజెంట్)
ASMO సిస్టమ్లో, ఏజెంట్ టాస్క్ షెడ్యూలర్ పాత్రను పోషిస్తాడు, ఇది నేపథ్యంలో షెడ్యూల్ చేసిన పనులను అమలు చేస్తుంది.
అన్ని ఏజెంట్ పనులు విజయవంతంగా పూర్తయితే, ఏజెంట్ సరిగ్గా పని చేస్తున్నాడు. ఏజెంట్ను పర్యవేక్షించడానికి, మీరు దాని పనులను పర్యవేక్షించాల్సిన అవసరం ఉందని తేలింది. అందువల్ల, మేము "ఏజెంట్" భాగాన్ని పనులుగా విభజిస్తాము. ప్రతి పని కోసం, మేము మానిటరింగ్ సిస్టమ్లో ఒక ప్రత్యేక భాగాన్ని సృష్టిస్తాము, ఇక్కడ “ఏజెంట్” భాగం “పేరెంట్” అవుతుంది.
మేము ఏజెంట్ కాంపోనెంట్ని చైల్డ్ కాంపోనెంట్లుగా విభజిస్తాము (టాస్క్లు):
కాబట్టి, మేము సంక్లిష్టమైన భాగాన్ని అనేక సాధారణమైనవిగా విభజించాము. ఇప్పుడు మనం ప్రతి సాధారణ భాగానికి చెక్లతో ముందుకు రావాలి. దయచేసి పేరెంట్ కాంపోనెంట్ "ఏజెంట్"కి ఎటువంటి తనిఖీలు ఉండవని గమనించండి, ఎందుకంటే పర్యవేక్షణ వ్యవస్థ దాని పిల్లల భాగాల స్థితిని బట్టి దాని స్థితిని స్వతంత్రంగా గణిస్తుంది. మరో మాటలో చెప్పాలంటే, అన్ని పనులు విజయవంతంగా పూర్తయితే, అప్పుడు ఏజెంట్ విజయవంతంగా నడుస్తోంది.
ASMO సిస్టమ్లో వందకు పైగా టాస్క్లు ఉన్నాయి, ప్రతి పనికి ప్రత్యేకమైన తనిఖీలతో ముందుకు రావడం నిజంగా అవసరమా? వాస్తవానికి, మేము ప్రతి ఏజెంట్ పని కోసం మా స్వంత ప్రత్యేక తనిఖీలను రూపొందించి అమలు చేస్తే నియంత్రణ మెరుగ్గా ఉంటుంది, కానీ చాలా సందర్భాలలో సార్వత్రిక తనిఖీలను ఉపయోగించడం సరిపోతుంది.
ASMO సిస్టమ్ పనుల కోసం సార్వత్రిక తనిఖీలను మాత్రమే ఉపయోగిస్తుంది మరియు సిస్టమ్ పనితీరును పర్యవేక్షించడానికి ఇది సరిపోతుంది.
పురోగతిని తనిఖీ చేస్తోంది
సరళమైన మరియు అత్యంత ప్రభావవంతమైన చెక్ ఎగ్జిక్యూషన్ చెక్. తప్పులు లేకుండా పని పూర్తయిందని చెక్ ధృవీకరిస్తుంది. అన్ని పనులకు ఈ చెక్ ఉంటుంది.
ధ్రువీకరణ అల్గోరిథం
ప్రతి టాస్క్ ఎగ్జిక్యూషన్ తర్వాత, టాస్క్ ఎగ్జిక్యూషన్ విజయవంతమైతే మీరు SUCCESS చెక్ ఫలితాన్ని మానిటరింగ్ సిస్టమ్కి పంపాలి, లేదా ఎగ్జిక్యూషన్ లోపంతో పూర్తయితే ERROR.
ఈ తనిఖీ కింది సమస్యలను గుర్తించగలదు:
- పని నడుస్తుంది కానీ లోపంతో విఫలమవుతుంది.
- పని అమలు చేయడం ఆగిపోయింది, ఉదాహరణకు, అది స్తంభింపజేసింది.
ఈ సమస్యలు ఎలా పరిష్కరించబడతాయో మరింత వివరంగా చూద్దాం.
సమస్య 1 - టాస్క్ నడుస్తుంది కానీ లోపంతో విఫలమవుతుంది
టాస్క్ నడుస్తుంది కానీ 14:00 మరియు 16:00 మధ్య విఫలమయ్యే సందర్భం క్రింద ఉంది.
ఒక పని విఫలమైనప్పుడు, ఒక సిగ్నల్ వెంటనే పర్యవేక్షణ వ్యవస్థకు పంపబడుతుంది మరియు పర్యవేక్షణ వ్యవస్థలో సంబంధిత చెక్ యొక్క స్థితి అలారం అవుతుంది అని ఫిగర్ చూపిస్తుంది.
దయచేసి పర్యవేక్షణ వ్యవస్థలో, భాగం యొక్క స్థితి ధృవీకరణ స్థితిపై ఆధారపడి ఉంటుందని గమనించండి. చెక్ యొక్క అలారం స్థితి అన్ని ఉన్నత-స్థాయి భాగాలను అలారంగా మారుస్తుంది, దిగువ బొమ్మను చూడండి.
సమస్య 2 - పనిని అమలు చేయడం ఆగిపోయింది (స్తంభింపజేయబడింది)
ఒక పని నిలిచిపోయిందని పర్యవేక్షణ వ్యవస్థ ఎలా అర్థం చేసుకుంటుంది?
చెక్ ఫలితం చెల్లుబాటు వ్యవధిని కలిగి ఉంటుంది, ఉదాహరణకు, 1 గంట. ఒక గంట గడిచినా మరియు కొత్త పరీక్ష ఫలితం లేనట్లయితే, పర్యవేక్షణ వ్యవస్థ పరీక్ష స్థితిని అలారంకు సెట్ చేస్తుంది.
పై చిత్రంలో, మధ్యాహ్నం 14:00 గంటలకు లైట్లు ఆపివేయబడ్డాయి. 15:00 గంటలకు, పరీక్ష ఫలితం (14:00 నుండి) కుళ్ళిపోయిందని పర్యవేక్షణ వ్యవస్థ గుర్తిస్తుంది, ఎందుకంటే ఔచిత్యం సమయం ముగిసింది (ఒక గంట), కానీ కొత్త ఫలితం లేదు మరియు చెక్ అలారం స్థితికి మారుతుంది.
16:00 గంటలకు లైట్లు మళ్లీ ఆన్ చేయబడ్డాయి, ప్రోగ్రామ్ పనిని పూర్తి చేస్తుంది మరియు అమలు ఫలితాన్ని పర్యవేక్షణ వ్యవస్థకు పంపుతుంది, పరీక్ష స్థితి మళ్లీ విజయవంతమవుతుంది.
నేను ఏ తనిఖీ సంబంధిత సమయాన్ని ఉపయోగించాలి?
ఔచిత్యం సమయం విధిని అమలు చేసే కాలం కంటే ఎక్కువగా ఉండాలి. టాస్క్ ఎగ్జిక్యూషన్ వ్యవధి కంటే 2-3 రెట్లు ఎక్కువ ఔచిత్యం సమయాన్ని సెట్ చేయాలని నేను సిఫార్సు చేస్తున్నాను. ఉదాహరణకు, ఒక పని సాధారణం కంటే ఎక్కువ సమయం తీసుకున్నప్పుడు లేదా ప్రోగ్రామ్ను ఎవరైనా రీలోడ్ చేసినప్పుడు తప్పుడు నోటిఫికేషన్లను స్వీకరించకుండా ఉండటానికి ఇది అవసరం.
పురోగతిని తనిఖీ చేస్తోంది
ASMO సిస్టమ్ "లోడ్ ఫోర్కాస్ట్" టాస్క్ను కలిగి ఉంది, ఇది గంటకు ఒకసారి బాహ్య మూలం నుండి కొత్త సూచనను డౌన్లోడ్ చేయడానికి ప్రయత్నిస్తుంది. బాహ్య వ్యవస్థలో కొత్త సూచన కనిపించినప్పుడు ఖచ్చితమైన సమయం తెలియదు, కానీ ఇది రోజుకు 2 సార్లు జరుగుతుందని తెలుసు. చాలా గంటలు కొత్త సూచన లేకపోతే, ఇది సాధారణం, కానీ ఒక రోజు కంటే ఎక్కువ కాలం కొత్త సూచన లేకపోతే, ఎక్కడో ఏదో విచ్ఛిన్నమైంది. ఉదాహరణకు, బాహ్య సూచన సిస్టమ్లోని డేటా ఫార్మాట్ మారవచ్చు, అందుకే ASMO కొత్త సూచన విడుదలను చూడదు.
ధ్రువీకరణ అల్గోరిథం
పని పురోగతిని పొందడంలో విజయవంతమైనప్పుడు (కొత్త వాతావరణ సూచనను డౌన్లోడ్ చేయడం) పర్యవేక్షణ సిస్టమ్కు SUCCESS చెక్ ఫలితాన్ని పంపుతుంది. పురోగతి లేకుంటే లేదా లోపం సంభవించినట్లయితే, పర్యవేక్షణ వ్యవస్థకు ఏమీ పంపబడదు.
చెక్ తప్పనిసరిగా సంబంధిత విరామాన్ని కలిగి ఉండాలి, ఈ సమయంలో అది కొత్త పురోగతిని పొందుతుందని హామీ ఇవ్వబడుతుంది.
మానిటరింగ్ సిస్టమ్ చివరి స్కాన్ ఫలితం యొక్క చెల్లుబాటు వ్యవధి ముగిసే వరకు వేచి ఉన్నందున, సమస్య గురించి ఆలస్యంగా తెలుసుకుంటామని దయచేసి గమనించండి. అందువల్ల, చెక్కు యొక్క చెల్లుబాటు వ్యవధి చాలా ఎక్కువ కాలం చేయవలసిన అవసరం లేదు.
డేటాబేస్ పర్యవేక్షణ
ASMO సిస్టమ్లో డేటాబేస్ను నియంత్రించడానికి, మేము ఈ క్రింది తనిఖీలను చేస్తాము:
- బ్యాకప్ సృష్టిని ధృవీకరిస్తోంది
- ఖాళీ డిస్క్ స్థలాన్ని తనిఖీ చేస్తోంది
బ్యాకప్ సృష్టిని ధృవీకరిస్తోంది
చాలా అప్లికేషన్లలో, నవీనమైన డేటాబేస్ బ్యాకప్లను కలిగి ఉండటం ముఖ్యం, తద్వారా సర్వర్ విఫలమైతే, మీరు ప్రోగ్రామ్ను కొత్త సర్వర్కి అమలు చేయవచ్చు.
ASMO వారానికి ఒకసారి బ్యాకప్ కాపీని సృష్టించి, నిల్వకు పంపుతుంది. ఈ ప్రక్రియ విజయవంతంగా పూర్తయినప్పుడు, విజయవంతమైన తనిఖీ ఫలితం పర్యవేక్షణ వ్యవస్థకు పంపబడుతుంది. ధృవీకరణ ఫలితం 9 రోజులు చెల్లుబాటు అవుతుంది. ఆ. బ్యాకప్ల సృష్టిని నియంత్రించడానికి, మేము పైన చర్చించిన "ప్రోగ్రెస్ చెక్" మెకానిజం ఉపయోగించబడుతుంది.
ఖాళీ డిస్క్ స్థలాన్ని తనిఖీ చేస్తోంది
డిస్క్లో తగినంత ఖాళీ స్థలం లేనట్లయితే, డేటాబేస్ సరిగ్గా పనిచేయదు, కాబట్టి ఖాళీ స్థలాన్ని నియంత్రించడం చాలా ముఖ్యం.
సంఖ్యా పారామితులను తనిఖీ చేయడానికి కొలమానాలను ఉపయోగించడం సౌకర్యంగా ఉంటుంది.
కొలమానాలు ఒక సంఖ్యా వేరియబుల్, దీని విలువ పర్యవేక్షణ వ్యవస్థకు ప్రసారం చేయబడుతుంది. పర్యవేక్షణ వ్యవస్థ థ్రెషోల్డ్ విలువలను తనిఖీ చేస్తుంది మరియు మెట్రిక్ స్థితిని లెక్కిస్తుంది.
పర్యవేక్షణ సిస్టమ్లో “డేటాబేస్” భాగం ఎలా ఉంటుందో దాని చిత్రం క్రింద ఉంది:
సర్వర్ పర్యవేక్షణ
సర్వర్ని పర్యవేక్షించడానికి మేము ఈ క్రింది తనిఖీలు మరియు కొలమానాలను ఉపయోగిస్తాము:
1. ఉచిత డిస్క్ స్థలం
డిస్క్ ఖాళీ అయిపోతే, అప్లికేషన్ పని చేయదు. మేము 2 థ్రెషోల్డ్ విలువలను ఉపయోగిస్తాము: మొదటి స్థాయి హెచ్చరిక, రెండవ స్థాయి అలారం.
2. సగటు RAM విలువ గంటకు శాతం
మేము గంట సగటును ఉపయోగిస్తాము ఎందుకంటే... అరుదైన జాతులపై మాకు ఆసక్తి లేదు.
3. గంటకు సగటు CPU శాతం
మేము గంట సగటును ఉపయోగిస్తాము ఎందుకంటే... అరుదైన జాతులపై మాకు ఆసక్తి లేదు.
4. పింగ్ చెక్
సర్వర్ ఆన్లైన్లో ఉందో లేదో తనిఖీ చేస్తుంది. పర్యవేక్షణ వ్యవస్థ ఈ తనిఖీని చేయగలదు; కోడ్ వ్రాయవలసిన అవసరం లేదు.
పర్యవేక్షణ సిస్టమ్లో “సర్వర్” భాగం ఎలా ఉంటుందో దాని చిత్రం క్రింద ఉంది:
సామగ్రి పర్యవేక్షణ
డేటా ఎలా పొందాలో నేను మీకు చెప్తాను. ప్రతి రహదారి నియంత్రణ పాయింట్ (MPC) కోసం టాస్క్ ప్లానర్లో ఒక పని ఉంది, ఉదాహరణకు, "సర్వే MPC M2 km 200". టాస్క్ ప్రతి 30 నిమిషాలకు అన్ని MPC పరికరాల నుండి డేటాను స్వీకరిస్తుంది.
కమ్యూనికేషన్ ఛానల్ సమస్య
చాలా పరికరాలు నగరం వెలుపల ఉన్నాయి; డేటా ట్రాన్స్మిషన్ కోసం GSM నెట్వర్క్ ఉపయోగించబడుతుంది, ఇది స్థిరంగా పనిచేయదు (నెట్వర్క్ ఉంది, లేదా ఒకటి లేదు).
తరచుగా నెట్వర్క్ వైఫల్యాల కారణంగా, మొదట, పర్యవేక్షణలో MPC సర్వేని తనిఖీ చేయడం ఇలా కనిపించింది:
సమస్యల గురించి చాలా తప్పుడు నోటిఫికేషన్లు ఉన్నందున ఇది పని చేసే ఎంపిక కాదని స్పష్టమైంది. అప్పుడు ప్రతి పరికరానికి "ప్రగతి తనిఖీ"ని ఉపయోగించాలని నిర్ణయించబడింది, అనగా. పరికరం లోపం లేకుండా పోల్ చేయబడినప్పుడు మానిటరింగ్ సిస్టమ్కు సక్సెస్ సిగ్నల్ మాత్రమే పంపబడుతుంది. ఔచిత్యం సమయం 5 గంటలకు సెట్ చేయబడింది.
పరికరాన్ని 5 గంటల కంటే ఎక్కువ పోల్ చేయలేనప్పుడు మాత్రమే ఇప్పుడు పర్యవేక్షణ సమస్యల గురించి నోటిఫికేషన్లను పంపుతుంది. అధిక స్థాయి సంభావ్యతతో, ఇవి తప్పుడు అలారాలు కాదు, కానీ నిజమైన సమస్యలు.
మానిటరింగ్ సిస్టమ్లో పరికరం ఎలా ఉంటుందో దాని చిత్రం క్రింద ఉంది:
ముఖ్యం!
GSM నెట్వర్క్ పని చేయడం ఆపివేసినప్పుడు, అన్ని MDC పరికరాలు పోల్ చేయబడవు. మానిటరింగ్ సిస్టమ్ నుండి ఇమెయిల్ల సంఖ్యను తగ్గించడానికి, మా ఇంజనీర్లు "పరికరం" కంటే "MPC" రకంతో కాంపోనెంట్ సమస్యల గురించి నోటిఫికేషన్లకు సబ్స్క్రయిబ్ చేస్తారు. ఇది ప్రతి పరికరానికి ప్రత్యేక నోటిఫికేషన్ను స్వీకరించకుండా, ప్రతి MPCకి ఒక నోటిఫికేషన్ను స్వీకరించడానికి మిమ్మల్ని అనుమతిస్తుంది.
చివరి ASMO పర్యవేక్షణ పథకం
అన్నింటినీ ఒకచోట చేర్చి, మనకు ఎలాంటి పర్యవేక్షణ పథకం ఉందో చూద్దాం.
తీర్మానం
సారాంశం చేద్దాం.
ASMO పనితీరును పర్యవేక్షించడం మాకు ఏమి ఇచ్చింది?
1. లోపం తొలగింపు సమయం తగ్గింది
మేము వినియోగదారుల నుండి లోపాల గురించి గతంలో విన్నాము, కానీ అందరు వినియోగదారులు లోపాలను నివేదించలేదు. సిస్టమ్ భాగం కనిపించిన వారం తర్వాత దాని లోపం గురించి మేము తెలుసుకున్నాము. ఇప్పుడు మానిటరింగ్ సిస్టమ్ సమస్యను గుర్తించిన వెంటనే సమస్యలను తెలియజేస్తుంది.
2. సిస్టమ్ స్థిరత్వం పెరిగింది
లోపాలను ముందుగానే తొలగించడం ప్రారంభించినందున, మొత్తం వ్యవస్థ మరింత స్థిరంగా పనిచేయడం ప్రారంభించింది.
3. సాంకేతిక మద్దతుకు కాల్ల సంఖ్యను తగ్గించడం
వినియోగదారులు వాటి గురించి తెలుసుకోకముందే ఇప్పుడు చాలా సమస్యలు పరిష్కరించబడ్డాయి. వినియోగదారులు సాంకేతిక మద్దతును తక్కువ తరచుగా సంప్రదించడం ప్రారంభించారు. ఇవన్నీ మన ప్రతిష్టపై మంచి ప్రభావం చూపుతాయి.
4. కస్టమర్ మరియు యూజర్ లాయల్టీని పెంచడం
కస్టమర్ సిస్టమ్ యొక్క స్థిరత్వంలో సానుకూల మార్పులను గమనించారు. సిస్టమ్ని ఉపయోగించి వినియోగదారులు తక్కువ సమస్యలను ఎదుర్కొంటారు.
5. సాంకేతిక మద్దతు ఖర్చులను తగ్గించండి
మేము మాన్యువల్ తనిఖీలను నిర్వహించడం మానేశాము. ఇప్పుడు అన్ని తనిఖీలు స్వయంచాలకంగా ఉన్నాయి. మునుపు, మేము వినియోగదారుల నుండి సమస్యల గురించి తెలుసుకున్నాము; వినియోగదారు ఏ సమస్య గురించి మాట్లాడుతున్నారో అర్థం చేసుకోవడం చాలా కష్టం. ఇప్పుడు, చాలా సమస్యలు పర్యవేక్షణ వ్యవస్థ ద్వారా నివేదించబడ్డాయి, నోటిఫికేషన్లు సాంకేతిక డేటాను కలిగి ఉంటాయి, ఇది ఎక్కడ తప్పు జరిగిందో ఎల్లప్పుడూ స్పష్టం చేస్తుంది.
ముఖ్యం!
మీ అప్లికేషన్లు రన్ అయ్యే సర్వర్లోనే మీరు మానిటరింగ్ సిస్టమ్ను ఇన్స్టాల్ చేయలేరు. సర్వర్ డౌన్ అయితే, అప్లికేషన్లు పని చేయడం ఆగిపోతాయి మరియు దాని గురించి తెలియజేయడానికి ఎవరూ ఉండరు.
పర్యవేక్షణ వ్యవస్థ తప్పనిసరిగా మరొక డేటా సెంటర్లోని ప్రత్యేక సర్వర్లో అమలు చేయబడాలి.
మీరు కొత్త డేటా సెంటర్లో డెడికేటెడ్ సర్వర్ని ఉపయోగించకూడదనుకుంటే, మీరు క్లౌడ్ మానిటరింగ్ సిస్టమ్ని ఉపయోగించవచ్చు. మా కంపెనీ Zidium క్లౌడ్ మానిటరింగ్ సిస్టమ్ను ఉపయోగిస్తుంది, కానీ మీరు ఏదైనా ఇతర పర్యవేక్షణ వ్యవస్థను ఉపయోగించవచ్చు. క్లౌడ్ మానిటరింగ్ సిస్టమ్ ధర కొత్త సర్వర్ను అద్దెకు తీసుకోవడం కంటే తక్కువగా ఉంటుంది.
సిఫార్సులు:
- వీలైనంత వివరంగా భాగాల చెట్టు రూపంలో అప్లికేషన్లు మరియు సిస్టమ్లను విచ్ఛిన్నం చేయండి, కాబట్టి ఎక్కడ మరియు ఏది విచ్ఛిన్నమైందో అర్థం చేసుకోవడం సౌకర్యంగా ఉంటుంది మరియు నియంత్రణ మరింత పూర్తి అవుతుంది.
- ఒక భాగం యొక్క కార్యాచరణను తనిఖీ చేయడానికి, పరీక్షలను ఉపయోగించండి. ఒక కాంప్లెక్స్ కంటే అనేక సాధారణ తనిఖీలను ఉపయోగించడం ఉత్తమం.
- మెట్రిక్ థ్రెషోల్డ్లను కోడ్లో రాయడం కంటే మానిటరింగ్ సిస్టమ్ వైపు కాన్ఫిగర్ చేయండి. ఇది అప్లికేషన్ను మళ్లీ కంపైల్ చేయడం, రీకాన్ఫిగర్ చేయడం లేదా రీస్టార్ట్ చేయడం నుండి మిమ్మల్ని కాపాడుతుంది.
- కస్టమ్ చెక్ల కోసం, తప్పుడు నోటిఫికేషన్లను స్వీకరించకుండా ఉండేందుకు ఔచిత్యం యొక్క మార్జిన్ని ఉపయోగించండి, ఎందుకంటే కొన్ని చెక్లు సాధారణం కంటే పూర్తి చేయడానికి కొంచెం ఎక్కువ సమయం పట్టింది.
- ఖచ్చితంగా సమస్య ఉన్నప్పుడే మానిటరింగ్ సిస్టమ్లోని భాగాలను ఎరుపు రంగులోకి మార్చడానికి ప్రయత్నించండి. అవి ఏమీ లేకుండా ఎర్రగా మారితే, మీరు పర్యవేక్షణ వ్యవస్థ యొక్క నోటిఫికేషన్లకు శ్రద్ధ చూపడం మానేస్తారు, దాని అర్థం పోతుంది.
మీరు ఇంకా పర్యవేక్షణ వ్యవస్థను ఉపయోగించకుంటే, ప్రారంభించండి! ఇది కనిపించేంత కష్టం కాదు. మీరు మీరే పెంచుకున్న ఆకుపచ్చ పదార్థాల చెట్టును చూసి ఆనందించండి.
అదృష్టవంతులు.
మూలం: www.habr.com