ለምንድነው ሶፍትዌሩን በከፍተኛ ተገኝነት ማከማቻ ስርዓትዎ (99,9999%) ላይ መሞከር አስፈላጊ የሆነው

ለምንድነው ሶፍትዌሩን በከፍተኛ ተገኝነት ማከማቻ ስርዓትዎ (99,9999%) ላይ መሞከር አስፈላጊ የሆነው

የትኛው የጽኑ ትዕዛዝ ስሪት በጣም "ትክክለኛ" እና "የሚሰራ" ነው? የማከማቻ ስርዓት 99,9999% ስህተትን መቻቻል ካረጋገጠ ያለሶፍትዌር ዝማኔ እንኳን ሳይቋረጥ ይሰራል ማለት ነው? ወይም በተቃራኒው ከፍተኛውን የስህተት መቻቻል ለማግኘት ሁልጊዜ የቅርብ ጊዜውን firmware መጫን አለብዎት? ከልምዳችን በመነሳት እነዚህን ጥያቄዎች ለመመለስ እንሞክራለን።

አነስተኛ መግቢያ

ሁላችንም የምንገነዘበው እያንዳንዱ የሶፍትዌር ስሪት፣ ኦፐሬቲንግ ሲስተም ወይም የመሳሪያ ሾፌር፣ ብዙ ጊዜ ጉድለቶች/ሳንካዎችን እና ሌሎች የመሣሪያው የአገልግሎት ህይወት እስኪያበቃ ድረስ “ላይታዩ” ወይም “ክፍት” ሊሆኑ የሚችሉ ሌሎች “ባህሪዎች”ን እንደያዘ ሁላችንም እንረዳለን። በተወሰኑ ሁኔታዎች ውስጥ ብቻ. የእንደዚህ ዓይነቶቹ ጥቃቅን ነገሮች ብዛት እና ጠቀሜታ በሶፍትዌሩ ውስብስብነት (ተግባራዊነት) እና በእድገቱ ወቅት በሙከራ ጥራት ላይ የተመሰረተ ነው. 

ብዙውን ጊዜ ተጠቃሚዎች በ "firmware from factory" ላይ ይቆያሉ (ታዋቂው "ይሰራል, ስለዚህ ከእሱ ጋር አያበላሹት") ወይም ሁልጊዜ የቅርብ ጊዜውን ስሪት ይጫኑ (በእነሱ መረዳት, የቅርብ ጊዜው በጣም የሚሰራ ማለት ነው). የተለየ አቀራረብ እንጠቀማለን - ጥቅም ላይ የዋለውን ሁሉ የመልቀቂያ ማስታወሻዎችን እንመለከታለን በ mClouds ደመና ውስጥ መሳሪያዎች እና ለእያንዳንዱ መሳሪያ ተገቢውን firmware በጥንቃቄ ይምረጡ።

ወደዚህ መደምደሚያ ደርሰናል, እነሱ እንደሚሉት, በልምድ. የእኛን የአሠራር ምሳሌ በመጠቀም፣ የሶፍትዌር ማሻሻያዎችን እና መግለጫዎችን በፍጥነት ካልተከታተሉ ቃል የተገባው የ 99,9999% የማከማቻ ስርዓቶች አስተማማኝነት ለምን እንደሆነ እንነግርዎታለን። ተመሳሳይ ሁኔታ ከማንኛውም አምራች ሃርድዌር ጋር ሊከሰት ስለሚችል የእኛ መያዣ ከማንኛውም አቅራቢ ለሚመጡ የማከማቻ ስርዓቶች ተጠቃሚዎች ተስማሚ ነው።

አዲስ የማከማቻ ስርዓት መምረጥ

ባለፈው ዓመት መገባደጃ ላይ አንድ አስደሳች የመረጃ ማከማቻ ስርዓት ወደ መሠረተ ልማታችን ታክሏል-ጁኒየር ሞዴል ከ IBM FlashSystem 5000 መስመር, በግዢ ጊዜ ስቶርዊዝ V5010e ተብሎ ይጠራ ነበር. አሁን በ FlashSystem 5010 ስም ይሸጣል, ግን በእውነቱ በውስጡ ተመሳሳይ Spectrum Virtualize ያለው ተመሳሳይ የሃርድዌር መሰረት ነው. 

የተዋሃደ የአስተዳደር ስርዓት መኖሩ በነገራችን ላይ በ IBM FlashSystem መካከል ያለው ዋና ልዩነት ነው. ለወጣቶች ተከታታይ ሞዴሎች በተግባር የበለጠ ውጤታማ ከሆኑ ሞዴሎች የተለየ አይደለም ። አንድ የተወሰነ ሞዴል መምረጥ ተገቢውን የሃርድዌር መሰረትን ብቻ ያቀርባል, ባህሪያቶቹ አንድ ወይም ሌላ ተግባር ለመጠቀም ወይም ከፍተኛ የመለኪያ ደረጃን ለማቅረብ ያስችላሉ. ሶፍትዌሩ ሃርድዌርን ይለያል እና ለዚህ መድረክ አስፈላጊውን እና በቂ ተግባር ያቀርባል.

ለምንድነው ሶፍትዌሩን በከፍተኛ ተገኝነት ማከማቻ ስርዓትዎ (99,9999%) ላይ መሞከር አስፈላጊ የሆነውIBM FlashSystem 5010

በአጭሩ ስለ ሞዴላችን 5010. ይህ የመግቢያ ደረጃ ባለሁለት መቆጣጠሪያ የማገጃ ማከማቻ ስርዓት ነው። NLSASን፣ SASን፣ SSD ዲስኮችን ማስተናገድ ይችላል። ይህ የማከማቻ ሞዴል የNVMe አንጻፊዎችን አፈጻጸም የማይጠይቁ ችግሮችን ለመፍታት የተቀመጠ ስለሆነ የNVMe ምደባ በውስጡ አይገኝም።

የማከማቻ ስርዓቱ የተገዛው የማህደር መረጃን ወይም በተደጋጋሚ የማይደረስ መረጃን ለማስተናገድ ነው። ስለዚህ የተግባራዊነቱ መደበኛ ስብስብ በቂ ነበር፡ ደረጃ (ቀላል ደረጃ)፣ ቀጭን አቅርቦት። በNLSAS ዲስኮች በ1000-2000 IOPS ደረጃ ያለው አፈጻጸም ለእኛም አጥጋቢ ነበር።

የእኛ ተሞክሮ - firmwareን በሰዓቱ እንዴት እንዳላዘመንነው

አሁን ስለ ሶፍትዌሩ ማዘመን ራሱ። በግዢ ጊዜ ስርዓቱ ትንሽ ጊዜ ያለፈበት የ Spectrum Virtualize ሶፍትዌር ስሪት ነበረው ፣ ማለትም ፣ 8.2.1.3.

የጽኑ ትዕዛዝ መግለጫዎችን አጥንተናል እና ለማዘመን አቅደናል። 8.2.1.9. እኛ ትንሽ የበለጠ ቀልጣፋ ብንሆን ኖሮ ይህ ጽሑፍ አይኖርም ነበር - ስህተቱ በቅርብ ጊዜ በወጣው firmware ላይ አይከሰትም ነበር። ነገር ግን, በተወሰኑ ምክንያቶች, የዚህ ስርዓት ዝመና ለሌላ ጊዜ ተላልፏል.

በውጤቱም፣ ትንሽ የዝማኔ መዘግየት እጅግ በጣም ደስ የማይል ምስል አስከትሏል፣ በአገናኙ ላይ ባለው መግለጫ ላይ፡- https://www.ibm.com/support/pages/node/6172341

አዎ፣ በዚያ ስሪት firmware ውስጥ APAR (የተፈቀደለት የፕሮግራም ትንተና ዘገባ) ተብሎ የሚጠራው HU02104 ጠቃሚ ነበር። እንደሚከተለው ይታያል. በመጫን ጊዜ, በተወሰኑ ሁኔታዎች ውስጥ, መሸጎጫው ከመጠን በላይ መፍሰስ ይጀምራል, ከዚያም ስርዓቱ ወደ መከላከያ ሁነታ ይሄዳል, ይህም ለገንዳው I / Oን ያሰናክላል. በእኛ ሁኔታ, በ RAID 3 ሁነታ ውስጥ 6 ዲስክዎችን ለ RAID ቡድን የማቋረጥ ይመስላል.ግንኙነቱ ለ 6 ደቂቃዎች ነው የሚከሰተው. በመቀጠል፣ በገንዳው ውስጥ ያሉትን ጥራዞች ማግኘት ወደነበረበት ተመልሷል።

በ IBM Spectrum Virtualize አውድ ውስጥ የሎጂካዊ አካላትን አወቃቀሮች እና ስያሜ የማያውቅ ካለ አሁን በአጭሩ እገልጻለሁ።

ለምንድነው ሶፍትዌሩን በከፍተኛ ተገኝነት ማከማቻ ስርዓትዎ (99,9999%) ላይ መሞከር አስፈላጊ የሆነውየማከማቻ ስርዓት አመክንዮአዊ አካላት አወቃቀር

ዲስኮች ኤምዲስክ (የሚተዳደር ዲስክ) በሚባሉ ቡድኖች ይሰበሰባሉ. MDisk ክላሲክ RAID (0,1,10,5,6) ወይም ምናባዊ አንድ - DRAID (የተከፋፈለ RAID) ሊሆን ይችላል. DRAID ን መጠቀም የአደራደሩን አፈጻጸም እንዲጨምሩ ያስችልዎታል፣ ምክንያቱም... በቡድኑ ውስጥ ያሉት ሁሉም ዲስኮች ጥቅም ላይ ይውላሉ, እና የመልሶ ግንባታ ጊዜ ይቀንሳል, ምክንያቱም የተወሰኑ ብሎኮች ብቻ ወደነበሩበት መመለስ ስለሚኖርባቸው, እና ከተሳካው ዲስክ የተገኙ ሁሉም መረጃዎች አይደሉም.

ለምንድነው ሶፍትዌሩን በከፍተኛ ተገኝነት ማከማቻ ስርዓትዎ (99,9999%) ላይ መሞከር አስፈላጊ የሆነውየተከፋፈለ RAID (DRAID) በ RAID-5 ሁነታ ሲጠቀሙ በዲስኮች ላይ የውሂብ እገዳዎች ስርጭት።

እና ይህ ዲያግራም አንድ ዲስክ ውድቀት በሚኖርበት ጊዜ የ DRAID መልሶ መገንባት እንዴት እንደሚሰራ አመክንዮ ያሳያል።

ለምንድነው ሶፍትዌሩን በከፍተኛ ተገኝነት ማከማቻ ስርዓትዎ (99,9999%) ላይ መሞከር አስፈላጊ የሆነውአንድ ዲስክ ሲወድቅ የDRAID መልሶ ግንባታ አመክንዮ

በመቀጠል፣ አንድ ወይም ከዚያ በላይ Mdisks መዋኛ ተብሎ የሚጠራውን ይመሰርታሉ። በተመሳሳዩ ገንዳ ውስጥ, MDisk ከተለያዩ RAID/DRAID ደረጃዎች ጋር ተመሳሳይ በሆነ ዲስኮች ላይ መጠቀም አይመከርም. ወደዚህ በጥልቀት አንገባም ፣ ምክንያቱም… ይህንን ከሚከተሉት መጣጥፎች በአንዱ ለመሸፈን አቅደናል። ደህና፣ በእውነቱ፣ ገንዳ ወደ ጥራዞች የተከፋፈለ ሲሆን እነዚህም አንድ ወይም ሌላ የማገጃ ፕሮቶኮል ወደ አስተናጋጆች ይቀርባሉ።

ስለዚህ, እኛ, በተገለፀው ሁኔታ ምክንያት አፓአር HU02104, በሶስት ዲስኮች ምክንያታዊ ውድቀት ምክንያት, MDisk መሥራቱን አቁሟል, ይህም በተራው, የፑል እና ተዛማጅ ጥራዞች ውድቀትን አስከትሏል.

እነዚህ ሲስተሞች በጣም ብልጥ ስለሆኑ፣ ከ IBM Storage Insights ደመና-ተኮር የክትትል ስርዓት ጋር ሊገናኙ ይችላሉ፣ ይህም ችግር ከተፈጠረ በራስ ሰር የአገልግሎት ጥያቄን ለ IBM ድጋፍ ይልካል። አንድ መተግበሪያ ተፈጥሯል እና የ IBM ስፔሻሊስቶች በርቀት ምርመራ ያካሂዳሉ እና የስርዓቱን ተጠቃሚ ያነጋግሩ። 

ለዚህም ምስጋና ይግባውና ጉዳዩ በፍጥነት ተፈትቷል እና ስርዓታችንን ወደ ቀድሞው የተመረጠው firmware 8.2.1.9 ለማዘመን ከድጋፍ አገልግሎቱ አፋጣኝ ምክር ደረሰ ፣ በዚያን ጊዜ ቀድሞውኑ ተስተካክሏል። ያረጋግጣል ተዛማጅ የመልቀቂያ ማስታወሻ.

ውጤቶች እና ምክሮቻችን

“በጥሩ ሁኔታ ያበቃል” እንደተባለው። በ firmware ውስጥ ያለው ስህተት ከባድ ችግር አላመጣም - አገልጋዮቹ በተቻለ ፍጥነት እና ያለ የውሂብ መጥፋት ወደነበሩበት ተመልሰዋል። አንዳንድ ደንበኞች ቨርቹዋል ማሽኖችን እንደገና ማስጀመር ነበረባቸው፣ ነገር ግን በአጠቃላይ የሁሉም የመሠረተ ልማት አካላት እና የደንበኛ ማሽኖች ምትኬ ስለምንሰራ ለበለጠ አሉታዊ ውጤቶች ተዘጋጅተናል። 

99,9999% ቃል የተገባላቸው አስተማማኝ ስርዓቶች እንኳን ትኩረት እና ወቅታዊ ጥገና እንደሚያስፈልጋቸው ማረጋገጫ አግኝተናል። በሁኔታው ላይ በመመስረት ለራሳችን ብዙ መደምደሚያዎችን ወስደናል እና ምክሮቻችንን እንካፈላለን-

  • የዝማኔዎችን መለቀቅ መከታተል፣ ወሳኝ ሊሆኑ የሚችሉ ጉዳዮችን ለማስተካከል የመልቀቂያ ማስታወሻዎችን ማጥናት እና የታቀዱ ማሻሻያዎችን በወቅቱ ማከናወን አስፈላጊ ነው።

    ይህ ድርጅታዊ እና በጣም ግልጽ የሆነ ነጥብ ነው, እሱም, የሚመስለው, ትኩረት ሊሰጠው የማይገባ ነው. ሆኖም፣ በዚህ “ደረጃ መሬት” ላይ በቀላሉ መሰናከል ይችላሉ። በእውነቱ፣ ከላይ የተገለጹትን ችግሮች የጨመረው በዚህ ወቅት ነው። የዝማኔ ደንቦቹን በሚዘጋጁበት ጊዜ በጣም ይጠንቀቁ እና ከእነሱ ጋር መከበራቸውን በጥንቃቄ ይቆጣጠሩ። ይህ ነጥብ ከ "ተግሣጽ" ጽንሰ-ሐሳብ ጋር የበለጠ ይዛመዳል.

  • ስርዓቱን በአዲሱ የሶፍትዌር ስሪት ማቆየት ሁልጊዜ የተሻለ ነው። ከዚህም በላይ፣ አሁን ያለው ትልቅ የቁጥር ስያሜ ያለው ሳይሆን በኋላ የሚለቀቅበት ቀን ያለው ነው። 

    ለምሳሌ፣ IBM ቢያንስ ሁለት የሶፍትዌር ልቀቶችን ለማከማቻ ስርዓቶቹ ወቅታዊ ያደርገዋል። ይህ ጽሑፍ በሚጻፍበት ጊዜ, እነዚህ 8.2 እና 8.3 ናቸው. ለ 8.2 ዝማኔዎች ቀደም ብለው ይወጣሉ. ለ 8.3 ተመሳሳይ ዝመና ብዙውን ጊዜ በትንሽ መዘግየት ይለቀቃል።

    መልቀቂያ 8.3 በርካታ የተግባር ጥቅሞች አሉት, ለምሳሌ, MDisk (በ DRAID ሁነታ) አንድ ወይም ከዚያ በላይ አዲስ ዲስኮች በመጨመር (ይህ ባህሪ ከስሪት 8.3.1 ጀምሮ ታይቷል) የማስፋፋት ችሎታ. ይህ በትክክል መሰረታዊ ተግባር ነው, ግን በ 8.2, በሚያሳዝን ሁኔታ, እንደዚህ አይነት ባህሪ የለም.

  • በሆነ ምክንያት ማዘመን የማይቻል ከሆነ፣ ከስሪቱ 8.2.1.9 እና 8.3.1.0 (ከላይ የተገለጸው ስህተት አስፈላጊ በሆነበት) ለ Spectrum Virtualize ሶፍትዌር ስሪቶች የመከሰትን አደጋ ለመቀነስ፣ የ IBM ቴክኒካዊ ድጋፍ ይመክራል። ከታች ባለው ስእል ላይ እንደሚታየው የስርዓት አፈፃፀምን በመዋኛ ደረጃ መገደብ (ስዕሉ የተወሰደው በ GUI በሩሲፋይድ ስሪት ውስጥ ነው). የ 10000 IOPS ዋጋ እንደ ምሳሌ ይታያል እና በስርዓትዎ ባህሪያት መሰረት ይመረጣል.

ለምንድነው ሶፍትዌሩን በከፍተኛ ተገኝነት ማከማቻ ስርዓትዎ (99,9999%) ላይ መሞከር አስፈላጊ የሆነውየ IBM ማከማቻ አፈጻጸምን መገደብ

  • በማከማቻ ስርዓቶች ላይ ያለውን ጭነት በትክክል ማስላት እና ከመጠን በላይ መጫንን ማስወገድ ያስፈልጋል. ይህንን ለማድረግ የ IBM መጠንን (የእሱ መዳረሻ ካለዎት) ወይም የአጋሮችን እርዳታ ወይም የሶስተኛ ወገን ሀብቶችን መጠቀም ይችላሉ። በማከማቻ ስርዓቱ ላይ ያለውን የጭነት መገለጫ መረዳት በጣም አስፈላጊ ነው, ምክንያቱም በMB/s እና IOPS ውስጥ ያለው አፈጻጸም ቢያንስ በሚከተሉት መመዘኛዎች ላይ በመመስረት በእጅጉ ይለያያል።

    • የክወና ዓይነት: ማንበብ ወይም መጻፍ,

    • የክወና እገዳ መጠን,

    • በጠቅላላው የ I/O ዥረት ውስጥ የንባብ እና የመፃፍ ስራዎች መቶኛ።

    እንዲሁም የክዋኔዎች ፍጥነት የሚነካው የውሂብ ብሎኮች እንዴት እንደሚነበቡ ነው፡ በቅደም ተከተል ወይም በዘፈቀደ ቅደም ተከተል። በመተግበሪያው በኩል ብዙ የውሂብ መዳረሻ ስራዎችን ሲያከናውን, የጥገኛ ስራዎች ጽንሰ-ሀሳብ አለ. ይህንንም ግምት ውስጥ ማስገባት ተገቢ ነው. ይህ ሁሉ ከስርዓተ ክወናው የአፈፃፀም ቆጣሪዎች ፣ የማከማቻ ስርዓት ፣ አገልጋዮች / ሃይፐርቫይዘሮች እንዲሁም የመተግበሪያዎች ፣ የዲቢኤምኤስ እና የሌሎች የዲስክ ሀብቶች “ሸማቾች” የአሠራር ባህሪዎችን አጠቃላይ መረጃን ለማየት ይረዳል ።

  • እና በመጨረሻም፣ የዘመኑ እና የሚሰሩ ምትኬዎች እንዳሉዎት እርግጠኛ ይሁኑ። የመጠባበቂያ መርሃ ግብሩ ለንግድ ስራው ተቀባይነት ባለው የ RPO እሴቶች ላይ በመመስረት መዋቀር አለበት እና የመጠባበቂያ ቅጂዎች ወቅታዊ የፍተሻ ማረጋገጫዎች መረጋገጥ አለባቸው (በጣም ጥቂት የመጠባበቂያ ሶፍትዌር አቅራቢዎች በምርታቸው ውስጥ በራስ ሰር ማረጋገጫ ገብተዋል) ተቀባይነት ያለው RTO ዋጋን ለማረጋገጥ።

እስከ መጨረሻው ስላነበባችሁ እናመሰግናለን።
በአስተያየቶቹ ውስጥ የእርስዎን ጥያቄዎች እና አስተያየቶች ለመመለስ ዝግጁ ነን. እንዲሁም የቴሌግራም ቻናላችንን ሰብስክራይብ እንድታደርጉ እንጋብዛለን።መደበኛ ማስተዋወቂያዎችን የምንይዝበት (በ IaaS ላይ ቅናሾች እና ለማስታወቂያ ኮዶች እስከ 100% በ VPS ላይ ስጦታዎች) ፣ አስደሳች ዜናዎችን ይፃፉ እና በ Habr ብሎግ ላይ አዳዲስ መጣጥፎችን ያሳውቁ።

ምንጭ: hab.com

አስተያየት ያክሉ