మేము స్పోర్ట్‌మాస్టర్‌ని పర్యవేక్షిస్తాము - ఎలా మరియు దేనితో

మేము ఉత్పత్తి బృందాలను ఏర్పాటు చేసే దశలో పర్యవేక్షణ వ్యవస్థను రూపొందించడం గురించి ఆలోచించాము. మా వ్యాపారం - దోపిడీ - ఈ టీమ్‌లలోకి రాదని స్పష్టమైంది. అది ఎందుకు?

వాస్తవం ఏమిటంటే, మా బృందాలన్నీ వ్యక్తిగత సమాచార వ్యవస్థలు, మైక్రోసర్వీస్‌లు మరియు ఫ్రంట్‌ల చుట్టూ నిర్మించబడ్డాయి, కాబట్టి బృందాలు మొత్తం సిస్టమ్ యొక్క మొత్తం ఆరోగ్యాన్ని చూడవు. ఉదాహరణకు, లోతైన బ్యాకెండ్‌లోని కొన్ని చిన్న భాగం ఫ్రంట్ ఎండ్‌ను ఎలా ప్రభావితం చేస్తుందో వారికి తెలియకపోవచ్చు. వారి ఆసక్తి పరిధి వారి వ్యవస్థ ఏకీకృతమైన వ్యవస్థలకు పరిమితం చేయబడింది. ఒక బృందం మరియు దాని సేవ A సేవ Bతో దాదాపుగా ఎటువంటి సంబంధం కలిగి ఉండకపోతే, అటువంటి సేవ జట్టుకు దాదాపు కనిపించదు.

మేము స్పోర్ట్‌మాస్టర్‌ని పర్యవేక్షిస్తాము - ఎలా మరియు దేనితో

మా బృందం, క్రమంగా, ఒకదానికొకటి చాలా బలంగా అనుసంధానించబడిన వ్యవస్థలతో పనిచేస్తుంది: వాటి మధ్య చాలా కనెక్షన్లు ఉన్నాయి, ఇది చాలా పెద్ద అవస్థాపన. మరియు ఆన్‌లైన్ స్టోర్ యొక్క ఆపరేషన్ ఈ అన్ని వ్యవస్థలపై ఆధారపడి ఉంటుంది (వీటిలో మనకు, మార్గం ద్వారా, భారీ సంఖ్యలో ఉంది).

కాబట్టి మా డిపార్ట్‌మెంట్ ఏ బృందానికి చెందినది కాదని, కానీ కొంచెం ప్రక్కన ఉందని తేలింది. ఈ మొత్తం కథలో, సమాచార వ్యవస్థలు ఎలా పనిచేస్తాయి, వాటి కార్యాచరణ, ఇంటిగ్రేషన్‌లు, సాఫ్ట్‌వేర్, నెట్‌వర్క్, హార్డ్‌వేర్ మరియు ఇవన్నీ ఒకదానికొకటి ఎలా కనెక్ట్ అయ్యాయో సమగ్రంగా అర్థం చేసుకోవడం మా పని.

మా ఆన్‌లైన్ స్టోర్‌లు పనిచేసే ప్లాట్‌ఫారమ్ ఇలా కనిపిస్తుంది:

  • ఫ్రంట్
  • మధ్య కార్యాలయం
  • తిరిగి కార్యాలయం

మనం ఎంత కోరుకున్నా, అన్ని వ్యవస్థలు సజావుగా మరియు దోషరహితంగా పని చేయడం జరగదు. పాయింట్, మళ్ళీ, సిస్టమ్స్ మరియు ఇంటిగ్రేషన్ల సంఖ్య - మాది వంటి వాటితో, పరీక్ష నాణ్యత ఉన్నప్పటికీ, కొన్ని సంఘటనలు అనివార్యం. అంతేకాకుండా, ప్రత్యేక వ్యవస్థలో మరియు వాటి ఏకీకరణ పరంగా రెండూ. మరియు మీరు మొత్తం ప్లాట్‌ఫారమ్ యొక్క స్థితిని సమగ్రంగా పర్యవేక్షించాలి మరియు దానిలోని ఏదైనా వ్యక్తిగత భాగాన్ని మాత్రమే కాకుండా.

ఆదర్శవంతంగా, ప్లాట్‌ఫారమ్-వ్యాప్త ఆరోగ్య పర్యవేక్షణ స్వయంచాలకంగా ఉండాలి. మరియు మేము ఈ ప్రక్రియలో ఒక అనివార్య భాగంగా పర్యవేక్షణకు వచ్చాము. ప్రారంభంలో, ఇది ఫ్రంట్-లైన్ భాగం కోసం మాత్రమే నిర్మించబడింది, అయితే నెట్‌వర్క్ నిపుణులు, సాఫ్ట్‌వేర్ మరియు హార్డ్‌వేర్ నిర్వాహకులు వారి స్వంత లేయర్-బై-లేయర్ మానిటరింగ్ సిస్టమ్‌లను కలిగి ఉన్నారు. ఈ వ్యక్తులందరూ పర్యవేక్షణను వారి స్వంత స్థాయిలో మాత్రమే అనుసరించారు; ఎవరికీ సమగ్ర అవగాహన లేదు.

ఉదాహరణకు, వర్చువల్ మిషన్ క్రాష్ అయినట్లయితే, చాలా సందర్భాలలో హార్డ్‌వేర్ మరియు వర్చువల్ మెషీన్‌కు బాధ్యత వహించే నిర్వాహకుడికి మాత్రమే దాని గురించి తెలుసు. అటువంటి సందర్భాలలో, అప్లికేషన్ క్రాష్ యొక్క వాస్తవాన్ని ఫ్రంట్‌లైన్ బృందం చూసింది, కానీ అది వర్చువల్ మిషన్ క్రాష్ గురించి డేటాను కలిగి లేదు. మరియు అడ్మినిస్ట్రేటర్ కస్టమర్ ఎవరో తెలుసుకోవచ్చు మరియు ఈ వర్చువల్ మెషీన్‌లో ప్రస్తుతం ఏమి నడుస్తోంది అనే దాని గురించి స్థూలమైన ఆలోచన ఉంటుంది, ఇది ఒక రకమైన పెద్ద ప్రాజెక్ట్ అని అందించబడుతుంది. అతనికి చిన్నపిల్లల గురించి ఎక్కువగా తెలియదు. ఏదైనా సందర్భంలో, నిర్వాహకుడు యజమాని వద్దకు వెళ్లి ఈ మెషీన్‌లో ఏమి ఉంది, ఏమి పునరుద్ధరించాలి మరియు ఏమి మార్చాలి అని అడగాలి. మరియు నిజంగా ఏదైనా తీవ్రమైనది విచ్ఛిన్నమైతే, వారు సర్కిల్‌లలో పరిగెత్తడం ప్రారంభించారు - ఎందుకంటే ఎవరూ సిస్టమ్‌ను మొత్తంగా చూడలేదు.

అంతిమంగా, ఇటువంటి అసమాన కథనాలు మొత్తం ఫ్రంటెండ్, వినియోగదారులు మరియు మా ప్రధాన వ్యాపార పనితీరు - ఆన్‌లైన్ అమ్మకాలను ప్రభావితం చేస్తాయి. మేము బృందంలో భాగం కానందున, ఆన్‌లైన్ స్టోర్‌లో భాగంగా అన్ని ఇకామర్స్ అప్లికేషన్‌ల ఆపరేషన్‌లో నిమగ్నమై ఉన్నందున, మేము ఇకామర్స్ ప్లాట్‌ఫారమ్ కోసం సమగ్ర పర్యవేక్షణ వ్యవస్థను రూపొందించే పనిని చేపట్టాము.

సిస్టమ్ నిర్మాణం మరియు స్టాక్

మేము మా సిస్టమ్‌ల కోసం అనేక మానిటరింగ్ లేయర్‌లను గుర్తించడం ద్వారా ప్రారంభించాము, దానిలో మేము కొలమానాలను సేకరించాలి. మరియు ఇవన్నీ కలపడం అవసరం, ఇది మేము మొదటి దశలో చేసాము. ఇప్పుడు ఈ దశలో సహసంబంధాన్ని ఏర్పరచుకోవడానికి మరియు సిస్టమ్‌లు ఒకదానికొకటి ఎలా ప్రభావితం చేస్తాయో అర్థం చేసుకోవడానికి మేము మా అన్ని లేయర్‌లలో అత్యధిక నాణ్యత గల కొలమానాల సేకరణను ఖరారు చేస్తున్నాము.

అప్లికేషన్ లాంచ్ యొక్క ప్రారంభ దశలలో సమగ్ర పర్యవేక్షణ లేకపోవడం (అనేక సిస్టమ్‌లు ఉత్పత్తిలో ఉన్నప్పుడు మేము దానిని నిర్మించడం ప్రారంభించాము) మొత్తం ప్లాట్‌ఫారమ్‌ను పర్యవేక్షించడానికి మేము గణనీయమైన సాంకేతిక రుణాన్ని కలిగి ఉన్నాము. మేము ఒక IS కోసం మానిటరింగ్‌ని సెటప్ చేయడం మరియు దాని కోసం మానిటరింగ్‌ని వివరంగా పని చేయడంపై దృష్టి పెట్టలేకపోయాము, ఎందుకంటే మిగిలిన సిస్టమ్‌లు కొంతకాలం పర్యవేక్షణ లేకుండా వదిలివేయబడతాయి. ఈ సమస్యను పరిష్కరించడానికి, సమాచార వ్యవస్థ యొక్క స్థితిని పొరల వారీగా అంచనా వేయడానికి అత్యంత అవసరమైన కొలమానాల జాబితాను మేము గుర్తించాము మరియు దానిని అమలు చేయడం ప్రారంభించాము.

అందువల్ల, వారు ఏనుగును భాగాలుగా తినాలని నిర్ణయించుకున్నారు.

మా సిస్టమ్ వీటిని కలిగి ఉంటుంది:

  • హార్డ్వేర్;
  • ఆపరేటింగ్ సిస్టమ్;
  • సాఫ్ట్‌వేర్;
  • పర్యవేక్షణ అప్లికేషన్‌లోని UI భాగాలు;
  • వ్యాపార కొలమానాలు;
  • ఏకీకరణ అప్లికేషన్లు;
  • సమాచార రక్షణ;
  • నెట్వర్క్లు;
  • ట్రాఫిక్ బాలన్సర్.

మేము స్పోర్ట్‌మాస్టర్‌ని పర్యవేక్షిస్తాము - ఎలా మరియు దేనితో

ఈ వ్యవస్థ యొక్క కేంద్రం తనను తాను పర్యవేక్షిస్తుంది. మొత్తం సిస్టమ్ స్థితిని సాధారణంగా అర్థం చేసుకోవడానికి, మీరు ఈ అన్ని లేయర్‌లలో మరియు మొత్తం అప్లికేషన్‌ల సెట్‌లో అప్లికేషన్‌లతో ఏమి జరుగుతుందో తెలుసుకోవాలి.

కాబట్టి, స్టాక్ గురించి.

మేము స్పోర్ట్‌మాస్టర్‌ని పర్యవేక్షిస్తాము - ఎలా మరియు దేనితో

మేము ఓపెన్ సోర్స్ సాఫ్ట్‌వేర్‌ని ఉపయోగిస్తాము. మధ్యలో మనకు Zabbix ఉంది, దీనిని మేము ప్రాథమికంగా హెచ్చరిక వ్యవస్థగా ఉపయోగిస్తాము. మౌలిక సదుపాయాల పర్యవేక్షణకు ఇది అనువైనదని అందరికీ తెలుసు. దీని అర్థం ఏమిటి? దాని స్వంత డేటా సెంటర్‌ను నిర్వహించే ప్రతి కంపెనీ (మరియు స్పోర్ట్‌మాస్టర్‌కు దాని స్వంత డేటా సెంటర్‌లు ఉన్నాయి) - సర్వర్ ఉష్ణోగ్రత, మెమరీ స్థితి, రైడ్, నెట్‌వర్క్ పరికర కొలమానాలు కలిగి ఉండే తక్కువ-స్థాయి కొలమానాలు.

మేము జబ్బిక్స్‌ని టెలిగ్రామ్ మెసెంజర్ మరియు మైక్రోసాఫ్ట్ టీమ్‌లతో ఏకీకృతం చేసాము, ఇవి జట్లలో చురుకుగా ఉపయోగించబడుతున్నాయి. Zabbix వాస్తవ నెట్‌వర్క్, హార్డ్‌వేర్ మరియు కొన్ని సాఫ్ట్‌వేర్ యొక్క పొరను కవర్ చేస్తుంది, అయితే ఇది వినాశనం కాదు. మేము ఈ డేటాను కొన్ని ఇతర సేవల నుండి మెరుగుపరుస్తాము. ఉదాహరణకు, హార్డ్‌వేర్ స్థాయిలో, మేము నేరుగా API ద్వారా మా వర్చువలైజేషన్ సిస్టమ్‌కి కనెక్ట్ చేస్తాము మరియు డేటాను సేకరిస్తాము.

ఇంకేం. Zabbixతో పాటు, మేము ప్రోమేథియస్‌ని ఉపయోగిస్తాము, ఇది డైనమిక్ ఎన్విరాన్‌మెంట్ అప్లికేషన్‌లో కొలమానాలను పర్యవేక్షించడానికి అనుమతిస్తుంది. అంటే, మేము HTTP ఎండ్‌పాయింట్ ద్వారా అప్లికేషన్ మెట్రిక్‌లను అందుకోవచ్చు మరియు దానిలో ఏ కొలమానాలను లోడ్ చేయాలి మరియు ఏది చేయకూడదు అనే దాని గురించి చింతించకూడదు. ఈ డేటా ఆధారంగా, విశ్లేషణాత్మక ప్రశ్నలను అభివృద్ధి చేయవచ్చు.

ఇతర లేయర్‌ల కోసం డేటా సోర్స్‌లు, ఉదాహరణకు, బిజినెస్ మెట్రిక్‌లు, మూడు భాగాలుగా విభజించబడ్డాయి.

ముందుగా, ఇవి బాహ్య వ్యాపార వ్యవస్థలు, Google Analytics, మేము లాగ్‌ల నుండి కొలమానాలను సేకరిస్తాము. వారి నుండి మేము యాక్టివ్ యూజర్‌లు, మార్పిడులు మరియు వ్యాపారానికి సంబంధించిన అన్నింటిపై డేటాను పొందుతాము. రెండవది, ఇది UI పర్యవేక్షణ వ్యవస్థ. ఇది మరింత వివరంగా వివరించబడాలి.

ఒకప్పుడు మేము మాన్యువల్ టెస్టింగ్‌తో ప్రారంభించాము మరియు అది ఫంక్షనాలిటీ మరియు ఇంటిగ్రేషన్‌ల యొక్క ఆటోమేటిక్ టెస్ట్‌లుగా ఎదిగింది. దీని నుండి మేము మానిటరింగ్ చేసాము, ప్రధాన కార్యాచరణను మాత్రమే వదిలివేసాము మరియు వీలైనంత స్థిరంగా ఉండే మరియు కాలక్రమేణా తరచుగా మారని మార్కర్‌లపై ఆధారపడతాము.

కొత్త టీమ్ స్ట్రక్చర్ అంటే అన్ని అప్లికేషన్ యాక్టివిటీలు ప్రోడక్ట్ టీమ్‌లకు మాత్రమే పరిమితం చేయబడ్డాయి కాబట్టి మేము ప్యూర్ టెస్టింగ్ చేయడం మానేస్తాము. బదులుగా, మేము జావా, సెలీనియం మరియు జెంకిన్స్‌లో వ్రాసిన పరీక్షల నుండి UI పర్యవేక్షణను చేసాము (రిపోర్ట్‌లను లాంచ్ చేయడానికి మరియు రూపొందించడానికి సిస్టమ్‌గా ఉపయోగించబడుతుంది).

మాకు చాలా పరీక్షలు ఉన్నాయి, కానీ చివరికి మేము ప్రధాన రహదారికి వెళ్లాలని నిర్ణయించుకున్నాము, ఉన్నత స్థాయి మెట్రిక్. మరియు మనకు చాలా నిర్దిష్ట పరీక్షలు ఉంటే, డేటాను తాజాగా ఉంచడం కష్టం. ప్రతి తదుపరి విడుదల మొత్తం సిస్టమ్‌ను గణనీయంగా విచ్ఛిన్నం చేస్తుంది మరియు మేము దీన్ని సరిచేయడమే. అందువల్ల, మేము చాలా అరుదుగా మారే చాలా ప్రాథమిక విషయాలపై దృష్టి సారించాము మరియు మేము వాటిని మాత్రమే పర్యవేక్షిస్తాము.

చివరగా, మూడవదిగా, డేటా సోర్స్ అనేది కేంద్రీకృత లాగింగ్ సిస్టమ్. మేము లాగ్‌ల కోసం ఎలాస్టిక్ స్టాక్‌ని ఉపయోగిస్తాము, ఆపై మేము ఈ డేటాను వ్యాపార కొలమానాల కోసం మా పర్యవేక్షణ సిస్టమ్‌లోకి లాగవచ్చు. వీటన్నింటికీ అదనంగా, మేము మా స్వంత మానిటరింగ్ API సేవను కలిగి ఉన్నాము, ఇది పైథాన్‌లో వ్రాయబడింది, ఇది API ద్వారా ఏదైనా సేవలను ప్రశ్నిస్తుంది మరియు వాటి నుండి డేటాను Zabbixలోకి సేకరిస్తుంది.

పర్యవేక్షణ యొక్క మరొక అనివార్య లక్షణం విజువలైజేషన్. మాది గ్రాఫానాపై ఆధారపడి ఉంటుంది. ఇది ఇతర విజువలైజేషన్ సిస్టమ్‌లలో ప్రత్యేకంగా నిలుస్తుంది, డాష్‌బోర్డ్‌లోని వివిధ డేటా సోర్స్‌ల నుండి మెట్రిక్‌లను విజువలైజ్ చేయడానికి ఇది మిమ్మల్ని అనుమతిస్తుంది. మేము ఆన్‌లైన్ స్టోర్ కోసం టాప్-లెవల్ మెట్రిక్‌లను సేకరించవచ్చు, ఉదాహరణకు, DBMS నుండి చివరి గంటలో చేసిన ఆర్డర్‌ల సంఖ్య, Zabbix నుండి ఈ ఆన్‌లైన్ స్టోర్ నడుస్తున్న OS యొక్క పనితీరు కొలమానాలు మరియు ఈ అప్లికేషన్ యొక్క ఉదాహరణల కోసం కొలమానాలు ప్రోమేతియస్ నుండి. మరియు ఇవన్నీ ఒకే డాష్‌బోర్డ్‌లో ఉంటాయి. క్లియర్ మరియు యాక్సెస్.

నేను భద్రత గురించి గమనించనివ్వండి - మేము ప్రస్తుతం సిస్టమ్‌ను ఖరారు చేస్తున్నాము, దానిని మేము తరువాత గ్లోబల్ మానిటరింగ్ సిస్టమ్‌తో అనుసంధానిస్తాము. నా అభిప్రాయం ప్రకారం, సమాచార భద్రత రంగంలో ఇ-కామర్స్ ఎదుర్కొంటున్న ప్రధాన సమస్యలు బాట్‌లు, పార్సర్‌లు మరియు బ్రూట్ ఫోర్స్‌కు సంబంధించినవి. మేము దీనిపై నిఘా ఉంచాలి, ఎందుకంటే ఇవన్నీ మా అప్లికేషన్‌ల ఆపరేషన్ మరియు వ్యాపార దృక్కోణం నుండి మా కీర్తి రెండింటినీ విమర్శనాత్మకంగా ప్రభావితం చేస్తాయి. మరియు ఎంచుకున్న స్టాక్‌తో మేము ఈ పనులను విజయవంతంగా కవర్ చేస్తాము.

మరొక ముఖ్యమైన విషయం ఏమిటంటే, అప్లికేషన్ లేయర్ ప్రోమేతియస్ చేత అసెంబుల్ చేయబడింది. అతను కూడా Zabbix తో కలిసిపోయాడు. మరియు మేము సైట్‌స్పీడ్‌ని కూడా కలిగి ఉన్నాము, మా పేజీ యొక్క లోడింగ్ వేగం, అడ్డంకులు, పేజీ రెండరింగ్, స్క్రిప్ట్‌లను లోడ్ చేయడం మొదలైన పారామితులను వీక్షించడానికి మమ్మల్ని అనుమతించే సేవ, ఇది కూడా API ఇంటిగ్రేటెడ్. కాబట్టి మా కొలమానాలు Zabbixలో సేకరించబడతాయి మరియు తదనుగుణంగా, మేము అక్కడ నుండి కూడా హెచ్చరిస్తాము. అన్ని హెచ్చరికలు ప్రస్తుతం ప్రధాన పంపే పద్ధతులకు పంపబడ్డాయి (ప్రస్తుతానికి ఇది ఇమెయిల్ మరియు టెలిగ్రామ్, MS బృందాలు కూడా ఇటీవలే కనెక్ట్ చేయబడ్డాయి). స్మార్ట్ బాట్‌లు సేవగా పని చేసే స్థితికి హెచ్చరికను అప్‌గ్రేడ్ చేయడానికి మరియు ఆసక్తిగల ఉత్పత్తి బృందాలందరికీ పర్యవేక్షణ సమాచారాన్ని అందించే ప్రణాళికలు ఉన్నాయి.

మాకు, కొలమానాలు వ్యక్తిగత సమాచార వ్యవస్థలకు మాత్రమే కాకుండా, అప్లికేషన్‌లు ఉపయోగించే మొత్తం అవస్థాపనకు సాధారణ కొలమానాలు కూడా ముఖ్యమైనవి: వర్చువల్ మిషన్లు పనిచేసే భౌతిక సర్వర్‌ల క్లస్టర్‌లు, ట్రాఫిక్ బ్యాలెన్సర్‌లు, నెట్‌వర్క్ లోడ్ బ్యాలెన్సర్‌లు, నెట్‌వర్క్ కూడా, కమ్యూనికేషన్ ఛానెల్‌ల వినియోగం . మా స్వంత డేటా సెంటర్‌ల కోసం ప్లస్ మెట్రిక్‌లు (మాకు వాటిలో చాలా ఉన్నాయి మరియు మౌలిక సదుపాయాలు చాలా పెద్దవి).

మేము స్పోర్ట్‌మాస్టర్‌ని పర్యవేక్షిస్తాము - ఎలా మరియు దేనితో

మా పర్యవేక్షణ వ్యవస్థ యొక్క ప్రయోజనాలు ఏమిటంటే, దాని సహాయంతో మేము అన్ని సిస్టమ్‌ల ఆరోగ్య స్థితిని చూస్తాము మరియు ఒకదానికొకటి మరియు భాగస్వామ్య వనరులపై వాటి ప్రభావాన్ని అంచనా వేయగలము. మరియు అంతిమంగా, ఇది వనరుల ప్రణాళికలో నిమగ్నమవ్వడానికి అనుమతిస్తుంది, ఇది మా బాధ్యత కూడా. మేము సర్వర్ వనరులను నిర్వహిస్తాము - ఇ-కామర్స్‌లో ఒక పూల్, కమీషన్ మరియు కొత్త పరికరాలను తొలగించడం, అదనపు కొత్త పరికరాలను కొనుగోలు చేయడం, వనరుల వినియోగం యొక్క ఆడిట్ నిర్వహించడం మొదలైనవి. ప్రతి సంవత్సరం, బృందాలు కొత్త ప్రాజెక్ట్‌లను ప్లాన్ చేస్తాయి, వారి సిస్టమ్‌లను అభివృద్ధి చేస్తాయి మరియు వారికి వనరులను అందించడం మాకు ముఖ్యం.

మరియు కొలమానాల సహాయంతో, మా సమాచార వ్యవస్థల ద్వారా వనరుల వినియోగంలో ధోరణిని మేము చూస్తాము. మరియు వాటి ఆధారంగా మనం ఏదైనా ప్లాన్ చేసుకోవచ్చు. వర్చువలైజేషన్ స్థాయిలో, మేము డేటాను సేకరిస్తాము మరియు డేటా సెంటర్ ద్వారా అందుబాటులో ఉన్న వనరుల మొత్తం సమాచారాన్ని చూస్తాము. మరియు ఇప్పటికే డేటా సెంటర్ లోపల మీరు రీసైక్లింగ్, వాస్తవ పంపిణీ మరియు వనరుల వినియోగాన్ని చూడవచ్చు. అంతేకాకుండా, స్వతంత్ర సర్వర్‌లు మరియు వర్చువల్ మెషీన్‌లు మరియు భౌతిక సర్వర్‌ల క్లస్టర్‌లు రెండూ ఈ వర్చువల్ మెషీన్‌లు తీవ్రంగా తిరుగుతున్నాయి.

అవకాశాలు

ఇప్పుడు మనకు సిస్టమ్ యొక్క ప్రధాన భాగం సిద్ధంగా ఉంది, కానీ ఇంకా చాలా విషయాలు పని చేయవలసి ఉంది. కనిష్టంగా, ఇది సమాచార భద్రతా పొర, కానీ నెట్‌వర్క్‌ను చేరుకోవడం, హెచ్చరికను అభివృద్ధి చేయడం మరియు సహసంబంధ సమస్యను పరిష్కరించడం కూడా చాలా ముఖ్యం. మనకు అనేక లేయర్‌లు మరియు సిస్టమ్‌లు ఉన్నాయి మరియు ప్రతి లేయర్‌లో మరెన్నో కొలమానాలు ఉన్నాయి. ఇది మాట్రియోష్కా స్థాయికి మాట్రియోష్కాగా మారుతుంది.

అంతిమంగా సరైన హెచ్చరికలు చేయడమే మా పని. ఉదాహరణకు, హార్డ్‌వేర్‌తో సమస్య ఉంటే, మళ్లీ, వర్చువల్ మెషీన్‌తో, మరియు ఒక ముఖ్యమైన అప్లికేషన్ ఉంది మరియు సేవ ఏ విధంగానూ బ్యాకప్ చేయబడదు. వర్చువల్ మెషీన్ చనిపోయిందని మేము కనుగొన్నాము. అప్పుడు వ్యాపార కొలమానాలు మిమ్మల్ని హెచ్చరిస్తాయి: వినియోగదారులు ఎక్కడో అదృశ్యమయ్యారు, మార్పిడి లేదు, ఇంటర్‌ఫేస్‌లోని UI అందుబాటులో లేదు, సాఫ్ట్‌వేర్ మరియు సేవలు కూడా చనిపోయాయి.

ఈ పరిస్థితిలో, మేము హెచ్చరికల నుండి స్పామ్‌ను స్వీకరిస్తాము మరియు ఇది ఇకపై సరైన పర్యవేక్షణ వ్యవస్థ ఆకృతికి సరిపోదు. సహసంబంధం యొక్క ప్రశ్న తలెత్తుతుంది. కాబట్టి, ఆదర్శవంతంగా, మా పర్యవేక్షణ వ్యవస్థ ఇలా చెప్పాలి: “గైస్, మీ ఫిజికల్ మెషీన్ చనిపోయింది, దానితో పాటు ఈ అప్లికేషన్ మరియు ఈ మెట్రిక్‌లు,” వంద హెచ్చరికలతో ఆవేశంగా బాంబు పేల్చడానికి బదులుగా ఒక హెచ్చరిక సహాయంతో. ఇది ప్రధాన విషయాన్ని నివేదించాలి - కారణం, దాని స్థానికీకరణ కారణంగా సమస్యను త్వరగా తొలగించడానికి సహాయపడుతుంది.

మా నోటిఫికేషన్ సిస్టమ్ మరియు అలర్ట్ ప్రాసెసింగ్ XNUMX గంటల హాట్‌లైన్ సేవ చుట్టూ రూపొందించబడింది. తప్పనిసరిగా కలిగి ఉండవలసినదిగా పరిగణించబడే మరియు చెక్‌లిస్ట్‌లో చేర్చబడిన అన్ని హెచ్చరికలు అక్కడకు పంపబడతాయి. ప్రతి హెచ్చరిక తప్పనిసరిగా వివరణను కలిగి ఉండాలి: ఏమి జరిగింది, దాని అసలు అర్థం ఏమిటి, అది ఏమి ప్రభావితం చేస్తుంది. అలాగే డ్యాష్‌బోర్డ్‌కి లింక్ మరియు ఈ సందర్భంలో ఏమి చేయాలనే దానిపై సూచన.

ఇది అలర్ట్‌ను రూపొందించడానికి అవసరమైన అవసరాలకు సంబంధించినది. అప్పుడు పరిస్థితి రెండు దిశలలో అభివృద్ధి చెందుతుంది - సమస్య ఉంది మరియు పరిష్కరించాల్సిన అవసరం ఉంది, లేదా పర్యవేక్షణ వ్యవస్థలో వైఫల్యం ఉంది. కానీ ఏదైనా సందర్భంలో, మీరు వెళ్లి దాన్ని గుర్తించాలి.

సగటున, మేము ఇప్పుడు రోజుకు వంద హెచ్చరికలను స్వీకరిస్తాము, హెచ్చరికల సహసంబంధం ఇంకా సరిగ్గా కాన్ఫిగర్ చేయబడలేదు అనే వాస్తవాన్ని పరిగణనలోకి తీసుకుంటాము. మరియు మేము సాంకేతిక పనిని నిర్వహించాల్సిన అవసరం ఉంటే, మరియు మేము బలవంతంగా ఏదైనా ఆఫ్ చేస్తే, వారి సంఖ్య గణనీయంగా పెరుగుతుంది.

మేము నిర్వహించే సిస్టమ్‌లను పర్యవేక్షించడం మరియు మా వైపు ముఖ్యమైనవిగా పరిగణించబడే మెట్రిక్‌లను సేకరించడంతోపాటు, మానిటరింగ్ సిస్టమ్ ఉత్పత్తి బృందాల కోసం డేటాను సేకరించడానికి మమ్మల్ని అనుమతిస్తుంది. మేము పర్యవేక్షించే సమాచార వ్యవస్థల్లోని కొలమానాల కూర్పును అవి ప్రభావితం చేయగలవు.

మా సహోద్యోగి వచ్చి మాకు మరియు టీమ్‌కి ఉపయోగపడే కొన్ని మెట్రిక్‌ను జోడించమని అడగవచ్చు. లేదా, ఉదాహరణకు, మా వద్ద ఉన్న ప్రాథమిక కొలమానాలు తగినంతగా టీమ్‌కి లేకపోవచ్చు; వారు కొన్ని నిర్దిష్టమైన వాటిని ట్రాక్ చేయాలి. గ్రాఫానాలో, మేము ప్రతి బృందానికి ఒక స్థలాన్ని సృష్టిస్తాము మరియు నిర్వాహక హక్కులను మంజూరు చేస్తాము. అలాగే, ఒక టీమ్‌కి డ్యాష్‌బోర్డ్‌లు అవసరమైతే, కానీ వారికి అది ఎలా చేయాలో తెలియకపోతే, మేము వారికి సహాయం చేస్తాము.

మేము బృందం యొక్క విలువ సృష్టి, వారి విడుదలలు మరియు ప్రణాళిక యొక్క ప్రవాహానికి వెలుపల ఉన్నందున, అన్ని సిస్టమ్‌ల విడుదలలు అతుకులు లేనివని మరియు మాతో సమన్వయం లేకుండా ప్రతిరోజూ విడుదల చేయవచ్చని మేము క్రమంగా నిర్ధారణకు వస్తున్నాము. మరియు ఈ విడుదలలను పర్యవేక్షించడం మాకు చాలా ముఖ్యం, ఎందుకంటే అవి అప్లికేషన్ యొక్క ఆపరేషన్‌ను ప్రభావితం చేయగలవు మరియు ఏదైనా విచ్ఛిన్నం చేయగలవు మరియు ఇది చాలా క్లిష్టమైనది. విడుదలలను నిర్వహించడానికి, మేము వెదురును ఉపయోగిస్తాము, అక్కడ నుండి మేము API ద్వారా డేటాను స్వీకరిస్తాము మరియు ఏ సమాచార వ్యవస్థలలో విడుదల చేయబడిందో మరియు వాటి స్థితిని చూడవచ్చు. మరియు అత్యంత ముఖ్యమైన విషయం ఏ సమయంలో. మేము ప్రధాన క్లిష్టమైన కొలమానాలకు విడుదల గుర్తులను వర్తింపజేస్తాము, ఇది సమస్యల విషయంలో దృశ్యపరంగా చాలా సూచనగా ఉంటుంది.

ఈ విధంగా మనం కొత్త విడుదలలు మరియు ఉద్భవిస్తున్న సమస్యల మధ్య సహసంబంధాన్ని చూడవచ్చు. సిస్టమ్ అన్ని లేయర్‌లలో ఎలా పనిచేస్తుందో అర్థం చేసుకోవడం, సమస్యను త్వరగా స్థానికీకరించడం మరియు దాన్ని త్వరగా పరిష్కరించడం ప్రధాన ఆలోచన. అన్నింటికంటే, ఎక్కువ సమయం పట్టేది సమస్యను పరిష్కరించడం కాదు, కారణం కోసం శోధించడం తరచుగా జరుగుతుంది.

మరియు భవిష్యత్తులో ఈ ప్రాంతంలో మేము క్రియాశీలతపై దృష్టి పెట్టాలనుకుంటున్నాము. ఆదర్శవంతంగా, నేను సమీపించే సమస్య గురించి ముందుగానే తెలుసుకోవాలనుకుంటున్నాను మరియు వాస్తవం తర్వాత కాదు, తద్వారా నేను దానిని పరిష్కరించకుండా నిరోధించగలను. మానవ తప్పిదాల వల్ల మరియు అప్లికేషన్‌లోని మార్పుల వల్ల కొన్నిసార్లు మానిటరింగ్ సిస్టమ్ యొక్క తప్పుడు అలారాలు సంభవిస్తాయి. మరియు మేము దీనిపై పని చేస్తాము, డీబగ్ చేయండి మరియు మానిటరింగ్ సిస్టమ్‌లో ఏదైనా తారుమారు చేసే ముందు దీని గురించి మాతో ఉపయోగించే వినియోగదారులను హెచ్చరించడానికి ప్రయత్నిస్తాము. , లేదా సాంకేతిక విండోలో ఈ కార్యకలాపాలను నిర్వహించండి.

కాబట్టి, సిస్టమ్ ప్రారంభించబడింది మరియు వసంతకాలం ప్రారంభం నుండి విజయవంతంగా పని చేస్తోంది... మరియు చాలా నిజమైన లాభాలను చూపుతోంది. అయితే, ఇది దాని చివరి వెర్షన్ కాదు; మేము మరిన్ని ఉపయోగకరమైన ఫీచర్‌లను పరిచయం చేస్తాము. కానీ ప్రస్తుతం, చాలా ఇంటిగ్రేషన్‌లు మరియు అప్లికేషన్‌లతో, ఆటోమేషన్‌ను పర్యవేక్షించడం నిజంగా అనివార్యం.

మీరు గణనీయమైన సంఖ్యలో ఇంటిగ్రేషన్‌లతో పెద్ద ప్రాజెక్ట్‌లను కూడా పర్యవేక్షిస్తే, దీని కోసం మీరు కనుగొన్న వెండి బుల్లెట్‌ను వ్యాఖ్యలలో వ్రాయండి.

మూలం: www.habr.com

ఒక వ్యాఖ్యను జోడించండి