హైలోడ్ IT సిస్టమ్స్ యొక్క ఆపరేషన్ మరియు మద్దతు ప్రక్రియలలో ఐదు సమస్యలు

హలో, హబ్ర్! నేను పదేళ్లుగా హైలోడ్ ఐటీ సిస్టమ్స్‌కు సపోర్ట్ చేస్తున్నాను. 1000+ RPS మోడ్‌లో లేదా ఇతర సాంకేతిక విషయాలలో పని చేయడానికి nginxని సెటప్ చేయడంలో సమస్యల గురించి నేను ఈ వ్యాసంలో వ్రాయను. అటువంటి వ్యవస్థల మద్దతు మరియు ఆపరేషన్‌లో ఉత్పన్నమయ్యే ప్రక్రియలలోని సమస్యల గురించి నేను నా పరిశీలనలను పంచుకుంటాను.

పర్యవేక్షణ

“ఏం ఎందుకు... సైట్ మళ్లీ పని చేయడం లేదు?” అనే కంటెంట్‌తో అభ్యర్థన వచ్చే వరకు సాంకేతిక మద్దతు వేచి ఉండదు. సైట్ క్రాష్ అయిన తర్వాత ఒక నిమిషంలో, మద్దతు ఇప్పటికే సమస్యను చూడాలి మరియు దాన్ని పరిష్కరించడం ప్రారంభించాలి. కానీ సైట్ మంచుకొండ యొక్క కొన. దీని లభ్యత పర్యవేక్షించబడే మొదటి వాటిలో ఒకటి.

ఆన్‌లైన్ స్టోర్ యొక్క మిగిలిన వస్తువులు ఇకపై ERP సిస్టమ్ నుండి రానప్పుడు పరిస్థితిని ఏమి చేయాలి? లేదా క్లయింట్‌లకు తగ్గింపులను లెక్కించే CRM సిస్టమ్ ప్రతిస్పందించడం ఆపివేసిందా? సైట్ పని చేస్తున్నట్లు కనిపిస్తోంది. షరతులతో కూడిన Zabbix దాని 200 ప్రతిస్పందనను పొందుతుంది. డ్యూటీ షిఫ్ట్‌కి మానిటరింగ్ నుండి ఎలాంటి నోటిఫికేషన్‌లు రాలేదు మరియు గేమ్ ఆఫ్ థ్రోన్స్ కొత్త సీజన్ మొదటి ఎపిసోడ్‌ని సంతోషంగా చూస్తున్నారు.

మానిటరింగ్ తరచుగా మెమరీ స్థితి, RAM మరియు సర్వర్ ప్రాసెసర్ లోడ్ యొక్క స్థితిని కొలవడానికి మాత్రమే పరిమితం చేయబడుతుంది. కానీ వ్యాపారం కోసం వెబ్‌సైట్‌లో ఉత్పత్తి లభ్యతను పొందడం చాలా ముఖ్యం. క్లస్టర్‌లోని ఒక వర్చువల్ మెషీన్ యొక్క షరతులతో కూడిన వైఫల్యం ట్రాఫిక్ దానికి వెళ్లడం ఆపివేస్తుంది మరియు ఇతర సర్వర్‌లపై లోడ్ పెరుగుతుంది. కంపెనీ నష్టపోదు.

అందువలన, సర్వర్లలో ఆపరేటింగ్ సిస్టమ్స్ యొక్క సాంకేతిక పారామితులను పర్యవేక్షించడంతోపాటు, మీరు వ్యాపార కొలమానాలను కాన్ఫిగర్ చేయాలి. డబ్బును నేరుగా ప్రభావితం చేసే కొలమానాలు. బాహ్య వ్యవస్థలతో వివిధ పరస్పర చర్యలు (CRM, ERP మరియు ఇతరులు). నిర్దిష్ట కాలానికి ఆర్డర్‌ల సంఖ్య. విజయవంతమైన లేదా విజయవంతం కాని క్లయింట్ అధికారాలు మరియు ఇతర కొలమానాలు.

బాహ్య వ్యవస్థలతో పరస్పర చర్య

బిలియన్ రూబిళ్లు కంటే ఎక్కువ వార్షిక టర్నోవర్ కలిగిన ఏదైనా వెబ్‌సైట్ లేదా మొబైల్ అప్లికేషన్ బాహ్య వ్యవస్థలతో పరస్పర చర్య చేస్తుంది. పైన పేర్కొన్న CRM మరియు ERP నుండి ప్రారంభించి, కొనుగోళ్లను విశ్లేషించడానికి మరియు క్లయింట్‌కు అతను ఖచ్చితంగా కొనుగోలు చేసే (వాస్తవానికి, కాదు) ఉత్పత్తిని అందించడానికి బాహ్య బిగ్ డేటా సిస్టమ్‌కు విక్రయాల డేటా బదిలీతో ముగుస్తుంది. అటువంటి ప్రతి వ్యవస్థకు దాని స్వంత మద్దతు ఉంది. మరియు తరచుగా ఈ వ్యవస్థలతో కమ్యూనికేషన్ నొప్పిని కలిగిస్తుంది. ముఖ్యంగా సమస్య గ్లోబల్‌గా ఉన్నప్పుడు మరియు మీరు దానిని వివిధ సిస్టమ్‌లలో విశ్లేషించాలి.

కొన్ని సిస్టమ్‌లు తమ నిర్వాహకులకు ఫోన్ నంబర్ లేదా టెలిగ్రామ్‌ను అందిస్తాయి. ఎక్కడా మీరు నిర్వాహకులకు లేఖలు వ్రాయాలి లేదా ఈ బాహ్య వ్యవస్థల బగ్ ట్రాకర్లకు వెళ్లాలి. ఒక పెద్ద కంపెనీ సందర్భంలో కూడా, వేర్వేరు సిస్టమ్‌లు తరచుగా వేర్వేరు అప్లికేషన్ అకౌంటింగ్ సిస్టమ్‌లలో పనిచేస్తాయి. కొన్నిసార్లు అప్లికేషన్ యొక్క స్థితిని ట్రాక్ చేయడం అసాధ్యం అవుతుంది. మీరు ఒక షరతులతో కూడిన జిరాలో అభ్యర్థనను స్వీకరిస్తారు. ఈ మొదటి జిరా యొక్క వ్యాఖ్యలో మీరు మరొక జిరాలో సమస్యకు లింక్‌ను ఉంచారు. అప్లికేషన్‌లోని రెండవ జిరాలో, ఎవరో ఇప్పటికే వ్యాఖ్య రాస్తున్నారు సమస్యను పరిష్కరించడానికి మీరు షరతులతో కూడిన అడ్మిన్ ఆండ్రీకి కాల్ చేయాలి. అందువలన న.

ఈ సమస్యకు ఉత్తమ పరిష్కారం కమ్యూనికేషన్ కోసం ఒకే స్థలాన్ని సృష్టించడం, ఉదాహరణకు స్లాక్‌లో. బాహ్య సిస్టమ్‌లను నిర్వహించే ప్రక్రియలో పాల్గొనే వారందరినీ చేరడానికి ఆహ్వానిస్తున్నాము. మరియు అప్లికేషన్లను నకిలీ చేయకుండా ఒకే ట్రాకర్ కూడా. నోటిఫికేషన్‌లను పర్యవేక్షించడం నుండి భవిష్యత్తులో బగ్ పరిష్కారాల అవుట్‌పుట్ వరకు అప్లికేషన్‌లను ఒకే చోట ట్రాక్ చేయాలి. ఇది అవాస్తవమని మీరు చెబుతారు మరియు చారిత్రాత్మకంగా మేము ఒక ట్రాకర్‌లో పని చేస్తాము మరియు అవి మరొకదానిలో పని చేస్తాయి. వివిధ వ్యవస్థలు కనిపించాయి, వారి స్వంత స్వయంప్రతిపత్త ఐటి బృందాలు ఉన్నాయి. నేను అంగీకరిస్తున్నాను, అందువల్ల సమస్యను CIO లేదా ఉత్పత్తి యజమాని స్థాయిలో పై నుండి పరిష్కరించాలి.

మీరు ఇంటరాక్ట్ అయ్యే ప్రతి సిస్టమ్, ప్రాధాన్యత ప్రకారం సమస్యలను పరిష్కరించడానికి స్పష్టమైన SLAతో సేవగా మద్దతును అందించాలి. మరియు షరతులతో కూడిన అడ్మిన్ ఆండ్రీ మీ కోసం ఒక నిమిషం ఉన్నప్పుడు కాదు.

అడ్డంకి మనిషి

ఒక ప్రాజెక్ట్‌లో (లేదా ఉత్పత్తి) ప్రతి ఒక్కరూ సెలవులో వెళ్లడం వారి ఉన్నతాధికారుల మధ్య మూర్ఛలకు కారణమయ్యే వ్యక్తిని కలిగి ఉన్నారా? ఇది డెవొప్స్ ఇంజనీర్, విశ్లేషకుడు లేదా డెవలపర్ కావచ్చు. అన్నింటికంటే, డెవొప్స్ ఇంజనీర్‌కు మాత్రమే ఏ సర్వర్‌లు ఏ కంటైనర్‌లను ఇన్‌స్టాల్ చేశాయో, సమస్య వచ్చినప్పుడు కంటైనర్‌ను ఎలా రీబూట్ చేయాలో మరియు సాధారణంగా, అతను లేకుండా ఏదైనా క్లిష్టమైన సమస్య పరిష్కరించబడదు. మీ సంక్లిష్ట యంత్రాంగం ఎలా పనిచేస్తుందో విశ్లేషకుడికి మాత్రమే తెలుసు. ఏ డేటా స్ట్రీమ్‌లు ఎక్కడికి వెళ్తాయి. ఏయే సేవలకు అభ్యర్థనల యొక్క ఏ పారామీటర్‌ల క్రింద, ఏ వాటికి మేము ప్రతిస్పందనలను స్వీకరిస్తాము.
లాగ్‌లలో లోపాలు ఎందుకు ఉన్నాయో ఎవరు త్వరగా అర్థం చేసుకుంటారు మరియు ఉత్పత్తిలో క్లిష్టమైన బగ్‌ను వెంటనే పరిష్కరిస్తారు? వాస్తవానికి అదే డెవలపర్. ఇతరులు ఉన్నారు, కానీ కొన్ని కారణాల వల్ల మాత్రమే అతను సిస్టమ్ యొక్క వివిధ మాడ్యూల్స్ ఎలా పని చేస్తాడో అర్థం చేసుకుంటాడు.

డాక్యుమెంటేషన్ లేకపోవడమే ఈ సమస్యకు మూలం. అన్నింటికంటే, మీ సిస్టమ్ యొక్క అన్ని సేవలను వివరించినట్లయితే, విశ్లేషకుడు లేకుండా సమస్యను పరిష్కరించడం సాధ్యమవుతుంది. devops అతని బిజీ షెడ్యూల్ నుండి రెండు రోజులు తీసుకొని, అన్ని సర్వర్లు, సేవలు మరియు సాధారణ సమస్యలను పరిష్కరించడానికి సూచనలను వివరించినట్లయితే, అతను లేనప్పుడు సమస్య అతను లేకుండానే పరిష్కరించబడుతుంది. మీరు సెలవులో ఉన్నప్పుడు బీచ్‌లో మీ బీర్‌ని త్వరగా ముగించాల్సిన అవసరం లేదు మరియు సమస్యను పరిష్కరించడానికి wi-fi కోసం వెతకాల్సిన అవసరం లేదు.

సహాయక సిబ్బంది యొక్క యోగ్యత మరియు బాధ్యత

పెద్ద ప్రాజెక్ట్‌లలో, కంపెనీలు డెవలపర్ జీతాలను తగ్గించవు. వారు ఇలాంటి ప్రాజెక్ట్‌ల నుండి ఖరీదైన మధ్యస్థులు లేదా సీనియర్‌ల కోసం చూస్తున్నారు. మద్దతుతో పరిస్థితి కొద్దిగా భిన్నంగా ఉంటుంది. ఈ ఖర్చులను అన్ని విధాలుగా తగ్గించుకునేందుకు ప్రయత్నిస్తున్నారు. కంపెనీలు చవకైన నిన్నటి ఎనికీ కార్మికులను నియమించుకుంటాయి మరియు ధైర్యంగా యుద్ధానికి దిగాయి. మేము జెలెనోగ్రాడ్‌లోని ప్లాంట్ యొక్క వ్యాపార కార్డ్ వెబ్‌సైట్ గురించి మాట్లాడుతున్నట్లయితే ఈ వ్యూహం సాధ్యమవుతుంది.

మేము పెద్ద ఆన్‌లైన్ స్టోర్ గురించి మాట్లాడుతుంటే, ప్రతి గంట పనికిరాని సమయం ఎనికీ అడ్మినిస్ట్రేటర్ యొక్క నెలవారీ జీతం కంటే ఎక్కువ ఖర్చు అవుతుంది. ప్రారంభ బిందువుగా వార్షిక టర్నోవర్ 1 బిలియన్ రూబిళ్లు తీసుకుందాం. రేటింగ్ నుండి ఏదైనా ఆన్‌లైన్ స్టోర్ యొక్క కనీస టర్నోవర్ ఇది 100కి టాప్ 2018. ఈ మొత్తాన్ని సంవత్సరానికి గంటల సంఖ్యతో విభజించి, 100 రూబిళ్లు కంటే ఎక్కువ నికర నష్టాలను పొందండి. మరియు మీరు రాత్రి గంటలను లెక్కించకపోతే, మీరు సురక్షితంగా మొత్తాన్ని రెట్టింపు చేయవచ్చు.

కానీ డబ్బు ప్రధాన విషయం కాదు, సరియైనదా? (లేదు, వాస్తవానికి ప్రధాన విషయం) కీర్తి నష్టాలు కూడా ఉన్నాయి. ప్రసిద్ధ ఆన్‌లైన్ స్టోర్ పతనం సామాజిక నెట్‌వర్క్‌లు మరియు ఇతివృత్త మీడియాలోని ప్రచురణలపై సమీక్షల తరంగాన్ని కలిగిస్తుంది. మరియు "అక్కడ ఏదైనా కొనకండి, వారి వెబ్‌సైట్ ఎల్లప్పుడూ డౌన్‌లో ఉంటుంది" అనే శైలిలో వంటగదిలోని స్నేహితుల సంభాషణలను అస్సలు కొలవలేము.

ఇప్పుడు బాధ్యత. నా ఆచరణలో, సైట్ యొక్క లభ్యత గురించి పర్యవేక్షణ వ్యవస్థ నుండి వచ్చిన నోటిఫికేషన్‌కు విధి నిర్వహణలో ఉన్న నిర్వాహకుడు సకాలంలో స్పందించనప్పుడు ఒక సందర్భం ఉంది. ఆహ్లాదకరమైన వేసవి శుక్రవారం సాయంత్రం, మాస్కోలోని ప్రసిద్ధ ఆన్‌లైన్ స్టోర్ వెబ్‌సైట్ నిశ్శబ్దంగా ఉంది. శనివారం ఉదయం, ఈ సైట్ యొక్క ఉత్పత్తి నిర్వాహకుడికి సైట్ ఎందుకు తెరవలేదో అర్థం కాలేదు మరియు Slackలో మద్దతు మరియు అత్యవసర నోటిఫికేషన్ చాట్‌లలో నిశ్శబ్దం ఉంది. అలాంటి పొరపాటు వల్ల మాకు ఆరు అంకెల మొత్తం మరియు ఈ డ్యూటీ ఆఫీసర్ అతని ఉద్యోగం ఖర్చు అవుతుంది.

బాధ్యతను అభివృద్ధి చేయడం కష్టమైన నైపుణ్యం. ఒక వ్యక్తికి అది ఉందా లేదా. అందువల్ల, ఇంటర్వ్యూల సమయంలో, ఒక వ్యక్తి బాధ్యత తీసుకోవడానికి అలవాటు పడ్డాడో లేదో పరోక్షంగా చూపించే వివిధ ప్రశ్నలతో దాని ఉనికిని గుర్తించడానికి నేను ప్రయత్నిస్తాను. ఒక వ్యక్తి తన తల్లిదండ్రులు చెప్పినందున తాను విశ్వవిద్యాలయాన్ని ఎంచుకున్నానని లేదా అతని భార్య తనకు తగినంత సంపాదించడం లేదని చెప్పినందున ఉద్యోగం మారిందని సమాధానం ఇస్తే, అలాంటి వ్యక్తులతో సంబంధం పెట్టుకోకపోవడమే మంచిది.

అభివృద్ధి బృందంతో పరస్పర చర్య

వినియోగదారులు ఆపరేషన్ సమయంలో ఉత్పత్తితో సాధారణ సమస్యలను ఎదుర్కొన్నప్పుడు, మద్దతు వారి స్వంతంగా వాటిని పరిష్కరిస్తుంది. సమస్యను పునరుత్పత్తి చేయడానికి ప్రయత్నిస్తుంది, లాగ్‌లను విశ్లేషిస్తుంది మరియు మొదలైనవి. కానీ ఉత్పత్తిలో బగ్ కనిపించినప్పుడు ఏమి చేయాలి? ఈ సందర్భంలో, మద్దతు డెవలపర్‌లకు పనిని అప్పగిస్తుంది మరియు ఇక్కడే వినోదం ప్రారంభమవుతుంది.

డెవలపర్లు నిరంతరం ఓవర్‌లోడ్ చేయబడతారు. వారు కొత్త ఫీచర్లను సృష్టిస్తున్నారు. అమ్మకాలతో బగ్‌లను పరిష్కరించడం అత్యంత ఆసక్తికరమైన చర్య కాదు. తదుపరి స్ప్రింట్‌ను పూర్తి చేయడానికి గడువులు సమీపిస్తున్నాయి. ఆపై మద్దతు నుండి అసహ్యకరమైన వ్యక్తులు వచ్చి ఇలా అంటారు: "తక్షణమే ప్రతిదీ వదిలివేయండి, మాకు సమస్యలు ఉన్నాయి." అటువంటి పనులకు ప్రాధాన్యత తక్కువగా ఉంటుంది. ముఖ్యంగా సమస్య చాలా క్లిష్టమైనది కానప్పుడు మరియు సైట్ యొక్క ప్రధాన కార్యాచరణ పని చేస్తుంది, మరియు విడుదల మేనేజర్ ఉబ్బిన కళ్ళతో పరిగెత్తనప్పుడు మరియు ఇలా వ్రాయండి: "తక్షణమే ఈ పనిని తదుపరి విడుదల లేదా హాట్‌ఫిక్స్‌కి జోడించండి."

సాధారణ లేదా తక్కువ ప్రాధాన్యత ఉన్న సమస్యలు విడుదల నుండి విడుదలకు తరలించబడతాయి. "పని ఎప్పుడు పూర్తవుతుంది?" అనే ప్రశ్నకు మీరు ఈ శైలిలో సమాధానాలను అందుకుంటారు: "క్షమించండి, ప్రస్తుతం చాలా టాస్క్‌లు ఉన్నాయి, మీ టీమ్ లీడ్‌లను అడగండి లేదా మేనేజర్‌ని విడుదల చేయండి."

కొత్త ఫీచర్‌లను సృష్టించడం కంటే ఉత్పాదకత సమస్యలకు ఎక్కువ ప్రాధాన్యత ఉంటుంది. వినియోగదారులు నిరంతరం బగ్‌లపై పొరపాట్లు చేస్తే చెడు సమీక్షలు రావడానికి ఎక్కువ కాలం ఉండదు. దెబ్బతిన్న కీర్తిని పునరుద్ధరించడం కష్టం.

అభివృద్ధి మరియు మద్దతు మధ్య పరస్పర చర్యల సమస్యలు DevOps ద్వారా పరిష్కరించబడతాయి. ఈ సంక్షిప్తీకరణ తరచుగా అభివృద్ధి కోసం పరీక్ష వాతావరణాలను సృష్టించేందుకు సహాయపడే నిర్దిష్ట వ్యక్తి రూపంలో ఉపయోగించబడుతుంది, CICD పైప్‌లైన్‌లను నిర్మిస్తుంది మరియు పరీక్షించిన కోడ్‌ను త్వరగా ఉత్పత్తిలోకి తీసుకువస్తుంది. DevOps అనేది సాఫ్ట్‌వేర్ డెవలప్‌మెంట్‌కు ఒక విధానం, ప్రక్రియలో పాల్గొనే వారందరూ ఒకరితో ఒకరు సన్నిహితంగా పరస్పరం పరస్పరం పరస్పరం పరస్పరం పరస్పరం పరస్పరం సంభాషించుకుంటారు మరియు సాఫ్ట్‌వేర్ ఉత్పత్తులు మరియు సేవలను త్వరగా సృష్టించడానికి మరియు నవీకరించడంలో సహాయపడతారు. నా ఉద్దేశ్యం విశ్లేషకులు, డెవలపర్లు, టెస్టర్లు మరియు మద్దతు.

ఈ విధానంలో, మద్దతు మరియు అభివృద్ధి అనేది వారి స్వంత లక్ష్యాలు మరియు లక్ష్యాలతో విభిన్న విభాగాలు కాదు. అభివృద్ధి ఆపరేషన్‌లో పాల్గొంటుంది మరియు దీనికి విరుద్ధంగా ఉంటుంది. పంపిణీ చేయబడిన జట్ల ప్రసిద్ధ పదబంధం: “సమస్య నా వైపు లేదు” ఇకపై చాలా తరచుగా చాట్‌లలో కనిపించదు మరియు తుది వినియోగదారులు కొంచెం సంతోషంగా ఉంటారు.

మూలం: www.habr.com

ఒక వ్యాఖ్యను జోడించండి