የመረጃ ማእከሉ የጭስ ሙከራ "ከተተኮሰ" አገልጋዩ "መጥፋት" አለበት?

አንድ ጥሩ የበጋ ቀን ከመሳሪያዎ ጋር ያለው የመረጃ ማእከል ይህን ቢመስል ምን ይሰማዎታል?

የመረጃ ማእከሉ የጭስ ሙከራ "ከተተኮሰ" አገልጋዩ "መጥፋት" አለበት?

ሰላም ሁላችሁም! ስሜ ዲሚትሪ ሳምሶኖቭ እባላለሁ ፣ በ " ውስጥ እንደ መሪ ስርዓት አስተዳዳሪ እሰራለሁየክፍል ጓደኞች" ፎቶው የሚያሳየው ፕሮጀክታችንን የሚያገለግሉ መሳሪያዎች ከተጫኑባቸው አራት የመረጃ ማዕከሎች አንዱን ነው። ከእነዚህ ግድግዳዎች በስተጀርባ ወደ 4 ሺህ የሚጠጉ መሳሪያዎች አሉ-ሰርቨሮች, የውሂብ ማከማቻ ስርዓቶች, የኔትወርክ እቃዎች, ወዘተ. - ከሁሉም የእኛ መሳሪያዎች ⅓ ማለት ይቻላል.
አብዛኛዎቹ አገልጋዮች ሊኑክስ ናቸው። በዊንዶውስ (MS SQL) ላይ በርካታ ደርዘን ሰርቨሮች አሉ - ቅርሶቻችን ፣ ለብዙ አመታት በዘዴ የተተወነው።
ስለዚህ፣ ሰኔ 5፣ 2019 በ14፡35፣ በእኛ የውሂብ ማዕከሎች ውስጥ ያሉ መሐንዲሶች የእሳት ማንቂያ ደውለው ሪፖርት አድርገዋል።

አሉታዊነት

14፡45። በመረጃ ማእከሎች ውስጥ ያሉ ጥቃቅን ጭስ ክስተቶች እርስዎ ከሚያስቡት በላይ በጣም የተለመዱ ናቸው። በአዳራሾቹ ውስጥ ያሉት ጠቋሚዎች የተለመዱ ናቸው, ስለዚህ የእኛ የመጀመሪያ ምላሽ በአንጻራዊነት የተረጋጋ ነበር: አንድን ነገር ከማስተካከል ጋር የተያያዘ ስራ ካልሆነ በስተቀር ከማምረት ጋር, ማለትም በማናቸውም የውቅረት ለውጦች ላይ, አዲስ ስሪቶችን በመልቀቅ, ወዘተ ላይ እገዳን አስተዋውቀዋል.

ቁጣ

ከእሳት አደጋ ተከላካዮች እሳቱ በጣሪያው ላይ በትክክል የት እንደተከሰተ ለማወቅ ሞክረህ ታውቃለህ ወይም ሁኔታውን ለመገምገም ራስህ የሚነድ ጣሪያ ላይ ለመግባት ሞክረህ ታውቃለህ? በአምስት ሰዎች አማካይነት በመረጃ ላይ ያለው እምነት ምን ያህል ይሆናል?

14: 50. እሳቱ ወደ ማቀዝቀዣው ስርዓት እየተቃረበ እንደሆነ መረጃ ደርሶናል. ግን ይመጣል? በሥራ ላይ ያለው የስርዓት አስተዳዳሪ የውጭ ትራፊክን ከዚህ የውሂብ ማዕከል ፊት ያስወግዳል።

በአሁኑ ጊዜ የሁሉም አገልግሎታችን ግንባሮች በሶስት የመረጃ ቋቶች ተባዝተዋል ፣ ሚዛናዊነት በዲ ኤን ኤስ ደረጃ ጥቅም ላይ ይውላል ፣ ይህም የአንድ የመረጃ ማእከል አድራሻዎችን ከዲ ኤን ኤስ ውስጥ ለማስወገድ ያስችላል ፣ በዚህም ተጠቃሚዎችን ከአገልግሎቶች ተደራሽነት ችግሮች ለመጠበቅ ያስችላል ። . በመረጃ ማዕከሉ ውስጥ ችግሮች አስቀድመው ከተከሰቱ, ማዞሩን በራስ-ሰር ይተዋል. እዚህ የበለጠ ማንበብ ይችላሉ፡- በ Odnoklassniki ውስጥ ጭነት ማመጣጠን እና ስህተት መቻቻል።

እሳቱ እስካሁን በምንም መልኩ አልጎዳንም - በተጠቃሚዎችም ሆነ በመሳሪያዎች ላይ ጉዳት አልደረሰም። ይህ አደጋ ነው? የሰነዱ የመጀመሪያ ክፍል “የአደጋ የድርጊት መርሃ ግብር” የ “አደጋ” ጽንሰ-ሀሳብን ይገልፃል ፣ እና ክፍሉ በዚህ ያበቃል።
«አደጋ መኖሩ ወይም አለመሆኑ ጥርጣሬ ካለ ይህ አደጋ ነው!»

14፡53። የአደጋ ጊዜ አስተባባሪ ይሾማል።

አስተባባሪው በሁሉም ተሳታፊዎች መካከል ያለውን ግንኙነት የሚቆጣጠረው, የአደጋውን መጠን የሚገመግም, የአደጋ ጊዜ የድርጊት መርሃ ግብር ይጠቀማል, አስፈላጊ ሰራተኞችን ይስባል, የጥገና ሥራ መጠናቀቁን ይቆጣጠራል, እና ከሁሉም በላይ ደግሞ ማንኛውንም ተግባራት በውክልና ይሰጣል. በሌላ አነጋገር፣ አጠቃላይ የአደጋ ጊዜ ምላሽ ሂደቱን የሚያስተዳድረው ይህ ሰው ነው።

ድርድር

15፡01። ከምርት ጋር ያልተገናኙ አገልጋዮችን ማሰናከል እንጀምራለን.
15፡03። ሁሉንም የተያዙ አገልግሎቶችን በትክክል እናጠፋለን።
ይህ ግንባሮችን (በዚህ ነጥብ ተጠቃሚዎች ከአሁን በኋላ የማይደርሱባቸውን) እና ረዳት አገልግሎቶቻቸውን (የቢዝነስ አመክንዮ፣ መሸጎጫ፣ ወዘተ) ብቻ ሳይሆን የተለያዩ የመባዛት ፋክተር 2 ወይም ከዚያ በላይ ያላቸው (ካሳንድራ, ሁለትዮሽ ውሂብ ማከማቻ, ቀዝቃዛ ማከማቻ, ኒውSQL ወዘተ)።
15: 06. ከመረጃ ማእከል አዳራሾች መካከል በአንደኛው ላይ የእሳት ቃጠሎ እያስፈራራ መሆኑን መረጃዎች ደርሰውናል። በዚህ ክፍል ውስጥ መሳሪያ የለንም, ነገር ግን እሳቱ ከጣሪያው ወደ አዳራሾች ሊሰራጭ መቻሉ ምን እየሆነ ያለውን ምስል በእጅጉ ይለውጣል.
(በኋላ ላይ በአዳራሹ ላይ ምንም አይነት አካላዊ ስጋት አለመኖሩን ለማወቅ ተችሏል, ምክንያቱም በሄርሜቲክ ሁኔታ ከጣሪያው ላይ የታሸገ ነው. ዛቻው ለእዚህ አዳራሽ ማቀዝቀዣ ስርዓት ብቻ ነበር.)
15፡07። ያለ ተጨማሪ ፍተሻዎች በተፋጠነ ሁኔታ በአገልጋዮች ላይ የትእዛዝ አፈፃፀምን እንፈቅዳለን (ያለእኛ ተወዳጅ ካልኩሌተር).
15፡08። በአዳራሾች ውስጥ ያለው የሙቀት መጠን በተለመደው ገደብ ውስጥ ነው.
15: 12. በአዳራሾች ውስጥ የሙቀት መጨመር ተመዝግቧል.
15፡13። በመረጃ ማዕከሉ ውስጥ ከግማሽ በላይ የሚሆኑ አገልጋዮች ጠፍተዋል። እንቀጥል።
15፡16። ሁሉንም መሳሪያዎች ለማጥፋት ውሳኔ ተላልፏል.
15፡21። አፕሊኬሽኑን እና ኦፕሬቲንግ ሲስተሙን በትክክል ሳንዘጋ ሃይልን ወደ ሀገር አልባ አገልጋዮች ማጥፋት እንጀምራለን።
15፡23። ለ MS SQL ኃላፊነት ያላቸው የሰዎች ቡድን ተመድቧል (ጥቂቶቹ ናቸው ፣ በእነሱ ላይ የአገልግሎቶች ጥገኝነት ጥሩ አይደለም ፣ ግን ተግባራዊነትን ወደነበረበት የመመለስ ሂደት ረዘም ያለ ጊዜ ይወስዳል እና ለምሳሌ ከካሳንድራ የበለጠ የተወሳሰበ ነው)።

ጭንቀት

15: 25. ከ 16 (ቁጥር 6, 7, 8, 9) ውስጥ በአራት አዳራሾች ውስጥ ኃይል ስለጠፋ መረጃ ደረሰ. መሳሪያችን አዳራሾች 7 እና 8 ውስጥ ይገኛሉ። ስለ ሁለቱ አዳራሾች (ቁጥር 1 እና 3) ምንም መረጃ የለም.
አብዛኛውን ጊዜ በእሳት ጊዜ የኃይል አቅርቦቱ ወዲያውኑ ይጠፋል, ነገር ግን በዚህ ሁኔታ, የእሳት አደጋ ተከላካዮች እና የመረጃ ማእከል ቴክኒካል ሰራተኞች የተቀናጀ ሥራ ምስጋና ይግባውና በሁሉም ቦታ አልጠፋም እና ወዲያውኑ አይደለም, ነገር ግን እንደ አስፈላጊነቱ.
(በኋላ ላይ ኃይሉ በአዳራሽ 8 እና 9 እንዳልጠፋ ታወቀ።)
15፡28። የ MS SQL ዳታቤዞችን ከመጠባበቂያ ቅጂዎች በሌሎች የመረጃ ማእከላት ማሰማራት እንጀምራለን.
ምን ያህል ጊዜ ይወስዳል? ለመላው መስመር በቂ የኔትወርክ አቅም አለ?
15: 37. የአንዳንድ የአውታረ መረብ ክፍሎች መዘጋት ተመዝግቧል።
ማኔጅመንት እና የምርት አውታር በአካል ተለያይተዋል. የምርት አውታር ካለ, ከዚያም ወደ አገልጋዩ መሄድ, አፕሊኬሽኑን ማቆም እና ስርዓተ ክወናውን ማጥፋት ይችላሉ. የማይገኝ ከሆነ, በ IPMI በኩል በመለያ መግባት, አፕሊኬሽኑን ማቆም እና ስርዓተ ክወናውን ማጥፋት ይችላሉ. ከአውታረ መረቡ ውስጥ አንዳቸውም ከሌሉ ምንም ነገር ማድረግ አይችሉም። "አመሰግናለሁ, ካፕ!", ታስባለህ.
"እና በአጠቃላይ, ብዙ ብጥብጥ አለ" ብለህ ታስብ ይሆናል.
ነገሩ ሰርቨሮች ያለ እሳት እንኳን ከፍተኛ መጠን ያለው ሙቀት ያመነጫሉ። በትክክል ማቀዝቀዝ በሚኖርበት ጊዜ ሙቀትን ያመነጫሉ, እና ማቀዝቀዝ በማይኖርበት ጊዜ, ገሃነመ እሳትን ይፈጥራሉ, ይህም ቢያንስ የመሳሪያውን ክፍል ይቀልጣል እና ሌላውን ክፍል ያጠፋል, እና በከፋ ሁኔታ ውስጥ ... እሳትን ያስከትላል. ሁሉንም ነገር ለማጥፋት የተረጋገጠው አዳራሽ.

የመረጃ ማእከሉ የጭስ ሙከራ "ከተተኮሰ" አገልጋዩ "መጥፋት" አለበት?

15፡39። በ conf ዳታቤዝ ላይ ችግሮችን እናስተካክላለን።

የ conf ዳታቤዝ ለተመሳሳይ ስም አገልግሎት የጀርባ አመልካች ነው፣ ይህም ሁሉም የምርት መተግበሪያዎች ቅንብሮችን በፍጥነት ለመቀየር ያገለግላሉ። ያለዚህ መሠረት, የፖርታሉን አሠራር መቆጣጠር አንችልም, ግን ፖርታሉ ራሱ ሊሠራ ይችላል.

15፡41። በኮር ኔትወርክ መሳሪያዎች ላይ ያሉ የሙቀት ዳሳሾች ከሚፈቀደው ከፍተኛው ጋር የሚቀራረቡ ንባቦችን ይመዘግባሉ። ይህ ሳጥን ሙሉ መደርደሪያን የሚይዝ እና በመረጃ ማእከሉ ውስጥ ያሉትን ሁሉንም አውታረ መረቦች አሠራር የሚያረጋግጥ ሳጥን ነው።

የመረጃ ማእከሉ የጭስ ሙከራ "ከተተኮሰ" አገልጋዩ "መጥፋት" አለበት?

15፡42። የችግር መከታተያ እና ዊኪ አይገኙም፣ ወደ ተጠባባቂ ይቀይሩ።
ይህ ምርት አይደለም, ነገር ግን በአደጋ ጊዜ, የማንኛውም የእውቀት መሰረት መገኘት ወሳኝ ሊሆን ይችላል.
15፡50። አንዱ የክትትል ሲስተሞች ጠፍቷል።
ከእነሱ ውስጥ በርካቶች አሉ, እና ለተለያዩ የአገልግሎቶቹ ገፅታዎች ተጠያቂዎች ናቸው. አንዳንዶቹ በየዳታ ማእከል ውስጥ ራሳቸውን ችለው እንዲሠሩ የተዋቀሩ ናቸው (ይህም የራሳቸውን የመረጃ ማዕከል ብቻ ይቆጣጠራሉ)፣ ሌሎች ደግሞ ከማንኛውም የመረጃ ማዕከል መጥፋት የሚተርፉ የተከፋፈሉ አካላትን ያቀፈ ነው።
በዚህ ሁኔታ ሥራውን አቁሟል የንግድ አመክንዮ አመላካቾች ያልተለመደ ማወቂያ ስርዓትበማስተር-ተጠባባቂ ሞድ ውስጥ የሚሰራ። ወደ ተጠባባቂነት ተቀይሯል።

ጉዲፈቻ

15፡51። ከMS SQL በስተቀር ሁሉም አገልጋዮች በትክክል ሳይዘጋ በ IPMI በኩል ጠፍተዋል።
አስፈላጊ ከሆነ በIPMI በኩል ለትልቅ የአገልጋይ አስተዳደር ዝግጁ ነዎት?

በመረጃ ማዕከሉ ውስጥ ያሉ መሳሪያዎችን የማዳን ሂደት በዚህ ደረጃ ላይ የተጠናቀቀበት ቅጽበት። ሊደረግ የሚችለው ነገር ሁሉ ተከናውኗል። አንዳንድ ባልደረቦች ማረፍ ይችላሉ።
16: 13. ከአየር ኮንዲሽነሮች የፍሬን ቱቦዎች በጣሪያ ላይ እንደፈነዳ መረጃ ደርሶናል - ይህ እሳቱ ከተነሳ በኋላ የመረጃ ማእከሉን መጀመር ያዘገየዋል.
16፡19። ከመረጃ ማዕከሉ ቴክኒካል ሰራተኞች ያገኘነው መረጃ እንደሚያመለክተው በአዳራሹ ውስጥ ያለው የሙቀት መጠን መጨመር ቆሟል።
17፡10። የ conf ዳታቤዝ ወደነበረበት ተመልሷል። አሁን የመተግበሪያ ቅንብሮችን መለወጥ እንችላለን.
ሁሉም ነገር ስህተትን የሚቋቋም ከሆነ እና ያለ አንድ የውሂብ ማዕከል እንኳን የሚሰራ ከሆነ ይህ ለምን አስፈላጊ ነው?
በመጀመሪያ ደረጃ, ሁሉም ነገር ስህተትን የሚቋቋም አይደለም. ከዳታ ሴንተር ብልሽት በበቂ ሁኔታ ያልዳኑ የተለያዩ ሁለተኛ ደረጃ አገልግሎቶች አሉ እና በ master-ተጠባባቂ ሞድ ውስጥ የውሂብ ጎታዎች አሉ። ቅንብሮችን የማስተዳደር ችሎታ በአስቸጋሪ ሁኔታዎች ውስጥ እንኳን በተጠቃሚዎች ላይ የአደጋ መዘዝን ተፅእኖ ለመቀነስ አስፈላጊውን ሁሉ እንዲያደርጉ ይፈቅድልዎታል.
በሁለተኛ ደረጃ የመረጃ ማእከሉ አሠራር በሚቀጥሉት ሰዓታት ውስጥ ሙሉ በሙሉ ወደነበረበት እንደማይመለስ ግልጽ ሆነ, ስለዚህ የረጅም ጊዜ ቅጂዎች አለመገኘት ወደ ተጨማሪ ችግሮች እንደ ሙሉ ዲስኮች እንዳይፈጠር እርምጃዎችን መውሰድ አስፈላጊ ነበር. የተቀሩት የውሂብ ማዕከሎች.
17፡29። የፒዛ ጊዜ! እኛ የምንቀጥረው ሰዎችን እንጂ ሮቦቶችን አይደለም።

የመረጃ ማእከሉ የጭስ ሙከራ "ከተተኮሰ" አገልጋዩ "መጥፋት" አለበት?

የማገገሚያ

18፡02። በአዳራሾች ቁጥር 8 (የእኛ), 9, 10 እና 11 የሙቀት መጠኑ ተረጋግቷል. ከመስመር ውጭ ከሚቀሩት አንዱ (ቁጥር 7) መሳሪያዎቻችንን ይይዛል, እና እዚያ ያለው የሙቀት መጠን መጨመር ይቀጥላል.
18፡31። በአዳራሾች ቁጥር 1 እና 3 ውስጥ ያሉትን መሳሪያዎች ለመጀመር ፍቃድ ሰጡ - እነዚህ አዳራሾች በእሳቱ አልተጎዱም.

በአሁኑ ጊዜ በጣም ወሳኝ ከሆኑት ጀምሮ በአዳራሾች ቁጥር 1, 3, 8 ውስጥ ሰርቨሮች እየተጀመሩ ነው. የሁሉም አሂድ አገልግሎቶች ትክክለኛ አሠራር ተረጋግጧል። አሁንም በአዳራሽ ቁጥር 7 ላይ ችግሮች አሉ።

18፡44። የመረጃ ማእከል ቴክኒካል ሰራተኞች ክፍል ቁጥር 7 (የእኛ መሳሪያ ብቻ የሚገኝበት) ብዙ ሰርቨሮች እንደማይጠፉ ደርሰውበታል። በእኛ መረጃ መሰረት 26 አገልጋዮች እዚያ መስመር ላይ ይቆያሉ። ከሁለተኛ ቼክ በኋላ, 58 አገልጋዮችን እናገኛለን.
20፡18። የመረጃ ማዕከል ቴክኒሻኖች አየር ማቀዝቀዣ በሌለው ክፍል ውስጥ በኮሪደሩ ውስጥ በሚያልፉ የሞባይል ቱቦዎች አየር ይነፋሉ።
23፡08። የመጀመሪያው አስተዳዳሪ ወደ ቤት ተላከ። ነገ ሥራውን ለመቀጠል አንድ ሰው ሌሊት መተኛት አለበት. በመቀጠል፣ አንዳንድ ተጨማሪ አስተዳዳሪዎችን እና ገንቢዎችን እንለቃለን።
02፡56። ሊጀመር የሚችለውን ሁሉ አስጀምረናል። አውቶማቲክ ሙከራዎችን በመጠቀም ሁሉንም አገልግሎቶች ብዙ ፍተሻ እናደርጋለን።

የመረጃ ማእከሉ የጭስ ሙከራ "ከተተኮሰ" አገልጋዩ "መጥፋት" አለበት?

03:02. በመጨረሻው የአየር ማቀዝቀዣ 7ኛ አዳራሽ ተስተካክሏል።
03፡36። በዳታ ማእከል ውስጥ ያሉትን ግንባሮች በዲ ኤን ኤስ ውስጥ ወደ ማሽከርከር አመጣን ። ከዚህ ቅጽበት ጀምሮ የተጠቃሚ ትራፊክ መምጣት ይጀምራል።
አብዛኛው የአስተዳደር ቡድን ወደ ቤት እየላክን ነው። እኛ ግን ጥቂት ሰዎችን ትተናል።

አነስተኛ የሚጠየቁ ጥያቄዎች፡-
ጥ፡ ከ18፡31 እስከ 02፡56 ምን ሆነ?
መ: "የአደጋ የድርጊት መርሃ ግብር" በመከተል በጣም አስፈላጊ ከሆኑት ጀምሮ ሁሉንም አገልግሎቶች እንጀምራለን. በዚህ አጋጣሚ በቻት ውስጥ ያለው አስተባባሪ አገልግሎቱን ለነፃ አስተዳዳሪ ይሰጣል፣ ኦኤስ እና አፕሊኬሽኑ መጀመሩን፣ ስህተቶች መኖራቸውን እና አመላካቾቹ መደበኛ መሆናቸውን ያረጋግጣል። ማስጀመሪያው ከተጠናቀቀ በኋላ ነፃ እንደሆነ እና ከአስተባባሪው አዲስ አገልግሎት እንደተቀበለ ለውይይቱ ሪፖርት ያደርጋል።
ሂደቱ ባልተሳካ ሃርድዌር የበለጠ ዝግ ነው። ስርዓተ ክወናውን ማቆም እና አገልጋዮቹን መዝጋት በትክክል ቢሄድም ፣ አንዳንድ አገልጋዮች በዲስኮች ፣ ማህደረ ትውስታ እና ቻሲሲስ ድንገተኛ ውድቀት ምክንያት አይመለሱም። ኃይሉ ሲጠፋ የውድቀቱ መጠን ይጨምራል።
ጥ: ለምን ሁሉንም ነገር በአንድ ጊዜ ማሄድ እና ከዚያ በክትትል ውስጥ የሚመጣውን ማስተካከል ያልቻሉት ለምንድን ነው?
መ: ሁሉም ነገር ቀስ በቀስ መከናወን አለበት, ምክንያቱም በአገልግሎቶች መካከል ጥገኛዎች አሉ. እና ሁሉም ነገር ወዲያውኑ መፈተሽ አለበት, ለክትትል ሳይጠብቅ - ምክንያቱም ችግሮችን ወዲያውኑ መቋቋም ይሻላል, እንዲባባስ ሳይጠብቁ.

7፡40። የመጨረሻው አስተዳዳሪ (አስተባባሪ) ወደ መኝታ ሄደ. የመጀመሪያው ቀን ሥራ ተጠናቀቀ.
8፡09። የመጀመሪያዎቹ ገንቢዎች፣ የመረጃ ማዕከል መሐንዲሶች እና አስተዳዳሪዎች (አዲሱን አስተባባሪ ጨምሮ) የተሃድሶ ሥራ ጀመሩ።
09፡37። አዳራሽ ቁጥር 7 (የመጨረሻው) ማሳደግ ጀመርን.
በተመሳሳይ ጊዜ, በሌሎች ክፍሎች ውስጥ ያልተስተካከሉ ነገሮችን ወደነበረበት መመለስ እንቀጥላለን-ዲስኮች / ማህደረ ትውስታ / አገልጋዮችን በመተካት, በክትትል ውስጥ "የሚቃጠሉትን" ሁሉንም ነገሮች ማስተካከል, በማስተር-ተጠባባቂ እቅዶች እና ሌሎች ትናንሽ ነገሮች ውስጥ ሚናዎችን መቀየር. ቢሆንም በጣም ብዙ።
17፡08። ሁሉንም መደበኛ ስራ ከምርት ጋር እንፈቅዳለን።
21፡45። የሁለተኛው ቀን ሥራ ተጠናቅቋል.
09፡45። ዛሬ አርብ ነው. በክትትል ውስጥ አሁንም በጣም ጥቂት ጥቃቅን ችግሮች አሉ. ቅዳሜና እሁድ ቀርቧል, ሁሉም ሰው ዘና ለማለት ይፈልጋል. የምንችለውን ሁሉ በከፍተኛ ሁኔታ መጠገን እንቀጥላለን። ለሌላ ጊዜ ሊተላለፉ የሚችሉ መደበኛ የአስተዳዳሪ ተግባራት ለሌላ ጊዜ ተላልፈዋል። አስተባባሪው አዲስ ነው።
15፡40። በሌላ የመረጃ ማዕከል ውስጥ ካሉት የኮር ኔትወርክ መሳሪያዎች ግማሹ በድንገት እንደገና ተጀመረ። አደጋዎችን ለመቀነስ ግንባሮች ከሽክርክር ውጭ ተወስደዋል። ለተጠቃሚዎች ምንም ተጽእኖ የለም. በኋላ ላይ የተሳሳተ ቻሲስ መሆኑ ታወቀ። አስተባባሪው ሁለት አደጋዎችን በአንድ ጊዜ ለመጠገን እየሰራ ነው።
17፡17። በሌላ የውሂብ ማዕከል ውስጥ ያለው የአውታረ መረብ አሠራር ወደነበረበት ተመልሷል, ሁሉም ነገር ተረጋግጧል. የመረጃ ማእከሉ ወደ ሽክርክርነት ተቀምጧል.
18፡29። የሦስተኛው ቀን ሥራ እና በአጠቃላይ, አደጋው ከተጠናቀቀ በኋላ መልሶ ማገገም.

ከቃል በኋላ

04.04.2013 በ 404 ስህተት ቀን, "የክፍል ጓደኞች" ትልቁን አደጋ ተረፈ - ለሶስት ቀናት ፖርታሉ ሙሉ በሙሉ ወይም በከፊል አይገኝም። በዚህ ጊዜ ሁሉ፣ ከተለያዩ ከተሞች የመጡ ከ100 በላይ ሰዎች፣ ከተለያዩ ኩባንያዎች (በጣም አመሰግናለሁ!)፣ በርቀት እና በቀጥታ በመረጃ ማዕከሎች ውስጥ፣ በእጅ እና በራስ ሰር በሺዎች የሚቆጠሩ አገልጋዮችን ጠግነዋል።
መደምደሚያ ላይ ደርሰናል። ይህ እንዳይደገም እስከ ዛሬ ድረስ ሰፊ ስራዎችን አከናውነን ቀጥለናል።

አሁን ባለው አደጋ እና በ 404 መካከል ያሉት ዋና ዋና ልዩነቶች ምንድን ናቸው?

  • "የአደጋ የድርጊት መርሃ ግብር" አለን። በሩብ አንድ ጊዜ መልመጃዎችን እናካሂዳለን - የአደጋ ጊዜ ሁኔታን እንጫወታለን ፣ ይህም የአስተዳዳሪዎች ቡድን (ሁሉም በተራው) “የአደጋ ጊዜ የድርጊት መርሃ ግብር” በመጠቀም ማስወገድ አለባቸው ። መሪ ስርዓት አስተዳዳሪዎች ተራ በተራ የአስተባባሪነት ሚና ይጫወታሉ።
  • በየሩብ ዓመቱ፣ በሙከራ ሁነታ፣ የመረጃ ማዕከሎችን (ሁሉም በተራው) በ LAN እና WAN አውታረ መረቦች እንገለላለን፣ ይህም ማነቆዎችን በፍጥነት ለመለየት ያስችለናል።
  • ያነሱ የተሰበሩ ዲስኮች፣ መስፈርቶቹን አጥብበነዋልና፡ ጥቂት የስራ ሰአታት፣ ጥብቅ ገደቦች ለ SMART፣
  • አገልጋዩ ዳግም ከጀመረ በኋላ ለማገገም ብዙ ጊዜ የሚጠይቅ የቆየ እና ያልተረጋጋውን የቤርክሌይ ዲቢን ሙሉ በሙሉ ትተናል።
  • እኛ MS SQL ያላቸውን አገልጋዮች ቁጥር ቀንሷል እና ቀሪዎቹ ላይ ጥገኝነት ቀንሷል.
  • የራሳችን አለን። ደመና - አንድ-ደመናአሁን ለሁለት አመታት ሁሉንም አገልግሎቶች በንቃት ስንሰደድ የነበርንበት። ደመናው ከመተግበሪያው ጋር አብሮ የመስራትን አጠቃላይ ዑደት በእጅጉ ያቃልላል ፣ እና በአደጋ ጊዜ እንደዚህ ያሉ ልዩ መሳሪያዎችን ይሰጣል-
    • በአንድ ጠቅታ የሁሉም መተግበሪያዎች ትክክለኛ ማቆም;
    • ከተሳኩ አገልጋዮች የመተግበሪያዎች ቀላል ሽግግር;
    • አውቶማቲክ ደረጃ (በአገልግሎቶች ቅድሚያ የሚሰጠው) የአንድ ሙሉ የውሂብ ማዕከል መጀመር.

በዚህ ጽሑፍ ውስጥ የተገለፀው አደጋ ከ404ኛው ቀን ወዲህ ትልቁ ነው። እርግጥ ነው, ሁሉም ነገር ያለችግር አልሄደም. ለምሳሌ በሌላ የመረጃ ማዕከል ውስጥ በእሳት የተጎዳ የመረጃ ማዕከል በማይገኝበት ጊዜ ከአገልጋዮቹ በአንዱ ላይ ያለው ዲስክ አልተሳካም ማለትም በካሳንድራ ክላስተር ውስጥ ካሉት ሶስት ቅጂዎች አንዱ ብቻ ተደራሽ ሆኖ የቀረው ለዚህ ነው 4,2% የሞባይል ስልክ። የመተግበሪያ ተጠቃሚዎች መግባት አልቻሉም። በተመሳሳይ ጊዜ, ቀድሞውኑ የተገናኙ ተጠቃሚዎች መስራታቸውን ቀጥለዋል. በአጠቃላይ በአደጋው ​​ምክንያት ከ 30 በላይ ችግሮች ተለይተዋል - ከባናል ትኋኖች እስከ የአገልግሎት አርክቴክቸር ጉድለቶች ድረስ።

ነገር ግን አሁን ባለው አደጋ እና በ 404 ኛው መካከል ያለው በጣም አስፈላጊው ልዩነት እሳቱ የሚያስከትለውን ውጤት እያስወገድን ሳለ ተጠቃሚዎች አሁንም የጽሑፍ መልእክት ይላኩ እና የቪዲዮ ጥሪዎችን ይያደርጉ ነበር ። በፍቃድ፣ ጨዋታዎችን ተጫውተዋል ፣ ሙዚቃ ያዳምጣሉ ፣ እርስ በእርስ ስጦታዎችን ሰጡ ፣ የተመለከቱ ቪዲዮዎች ፣ የቲቪ ተከታታይ እና የቲቪ ጣቢያዎች ውስጥ እሺ፣ እና ደግሞ በዥረት ገብቷል። እሺ በቀጥታ.

አደጋዎችዎ እንዴት ይሄዳሉ?

ምንጭ: hab.com

አስተያየት ያክሉ