የትኛው የጽኑ ትዕዛዝ ስሪት በጣም "ትክክለኛ" እና "የሚሰራ" ነው? የማከማቻ ስርዓት 99,9999% ስህተትን መቻቻል ካረጋገጠ ያለሶፍትዌር ዝማኔ እንኳን ሳይቋረጥ ይሰራል ማለት ነው? ወይም በተቃራኒው ከፍተኛውን የስህተት መቻቻል ለማግኘት ሁልጊዜ የቅርብ ጊዜውን firmware መጫን አለብዎት? ከልምዳችን በመነሳት እነዚህን ጥያቄዎች ለመመለስ እንሞክራለን።
አነስተኛ መግቢያ
ሁላችንም የምንገነዘበው እያንዳንዱ የሶፍትዌር ስሪት፣ ኦፐሬቲንግ ሲስተም ወይም የመሳሪያ ሾፌር፣ ብዙ ጊዜ ጉድለቶች/ሳንካዎችን እና ሌሎች የመሣሪያው የአገልግሎት ህይወት እስኪያበቃ ድረስ “ላይታዩ” ወይም “ክፍት” ሊሆኑ የሚችሉ ሌሎች “ባህሪዎች”ን እንደያዘ ሁላችንም እንረዳለን። በተወሰኑ ሁኔታዎች ውስጥ ብቻ. የእንደዚህ ዓይነቶቹ ጥቃቅን ነገሮች ብዛት እና ጠቀሜታ በሶፍትዌሩ ውስብስብነት (ተግባራዊነት) እና በእድገቱ ወቅት በሙከራ ጥራት ላይ የተመሰረተ ነው.
ብዙውን ጊዜ ተጠቃሚዎች በ "firmware from factory" ላይ ይቆያሉ (ታዋቂው "ይሰራል, ስለዚህ ከእሱ ጋር አያበላሹት") ወይም ሁልጊዜ የቅርብ ጊዜውን ስሪት ይጫኑ (በእነሱ መረዳት, የቅርብ ጊዜው በጣም የሚሰራ ማለት ነው). የተለየ አቀራረብ እንጠቀማለን - ጥቅም ላይ የዋለውን ሁሉ የመልቀቂያ ማስታወሻዎችን እንመለከታለን
ወደዚህ መደምደሚያ ደርሰናል, እነሱ እንደሚሉት, በልምድ. የእኛን የአሠራር ምሳሌ በመጠቀም፣ የሶፍትዌር ማሻሻያዎችን እና መግለጫዎችን በፍጥነት ካልተከታተሉ ቃል የተገባው የ 99,9999% የማከማቻ ስርዓቶች አስተማማኝነት ለምን እንደሆነ እንነግርዎታለን። ተመሳሳይ ሁኔታ ከማንኛውም አምራች ሃርድዌር ጋር ሊከሰት ስለሚችል የእኛ መያዣ ከማንኛውም አቅራቢ ለሚመጡ የማከማቻ ስርዓቶች ተጠቃሚዎች ተስማሚ ነው።
አዲስ የማከማቻ ስርዓት መምረጥ
ባለፈው ዓመት መገባደጃ ላይ አንድ አስደሳች የመረጃ ማከማቻ ስርዓት ወደ መሠረተ ልማታችን ታክሏል-ጁኒየር ሞዴል ከ IBM FlashSystem 5000 መስመር, በግዢ ጊዜ ስቶርዊዝ V5010e ተብሎ ይጠራ ነበር. አሁን በ FlashSystem 5010 ስም ይሸጣል, ግን በእውነቱ በውስጡ ተመሳሳይ Spectrum Virtualize ያለው ተመሳሳይ የሃርድዌር መሰረት ነው.
የተዋሃደ የአስተዳደር ስርዓት መኖሩ በነገራችን ላይ በ IBM FlashSystem መካከል ያለው ዋና ልዩነት ነው. ለወጣቶች ተከታታይ ሞዴሎች በተግባር የበለጠ ውጤታማ ከሆኑ ሞዴሎች የተለየ አይደለም ። አንድ የተወሰነ ሞዴል መምረጥ ተገቢውን የሃርድዌር መሰረትን ብቻ ያቀርባል, ባህሪያቶቹ አንድ ወይም ሌላ ተግባር ለመጠቀም ወይም ከፍተኛ የመለኪያ ደረጃን ለማቅረብ ያስችላሉ. ሶፍትዌሩ ሃርድዌርን ይለያል እና ለዚህ መድረክ አስፈላጊውን እና በቂ ተግባር ያቀርባል.
IBM FlashSystem 5010
በአጭሩ ስለ ሞዴላችን 5010. ይህ የመግቢያ ደረጃ ባለሁለት መቆጣጠሪያ የማገጃ ማከማቻ ስርዓት ነው። NLSASን፣ SASን፣ SSD ዲስኮችን ማስተናገድ ይችላል። ይህ የማከማቻ ሞዴል የNVMe አንጻፊዎችን አፈጻጸም የማይጠይቁ ችግሮችን ለመፍታት የተቀመጠ ስለሆነ የNVMe ምደባ በውስጡ አይገኝም።
የማከማቻ ስርዓቱ የተገዛው የማህደር መረጃን ወይም በተደጋጋሚ የማይደረስ መረጃን ለማስተናገድ ነው። ስለዚህ የተግባራዊነቱ መደበኛ ስብስብ በቂ ነበር፡ ደረጃ (ቀላል ደረጃ)፣ ቀጭን አቅርቦት። በNLSAS ዲስኮች በ1000-2000 IOPS ደረጃ ያለው አፈጻጸም ለእኛም አጥጋቢ ነበር።
የእኛ ተሞክሮ - firmwareን በሰዓቱ እንዴት እንዳላዘመንነው
አሁን ስለ ሶፍትዌሩ ማዘመን ራሱ። በግዢ ጊዜ ስርዓቱ ትንሽ ጊዜ ያለፈበት የ Spectrum Virtualize ሶፍትዌር ስሪት ነበረው ፣ ማለትም ፣ 8.2.1.3.
የጽኑ ትዕዛዝ መግለጫዎችን አጥንተናል እና ለማዘመን አቅደናል። 8.2.1.9. እኛ ትንሽ የበለጠ ቀልጣፋ ብንሆን ኖሮ ይህ ጽሑፍ አይኖርም ነበር - ስህተቱ በቅርብ ጊዜ በወጣው firmware ላይ አይከሰትም ነበር። ነገር ግን, በተወሰኑ ምክንያቶች, የዚህ ስርዓት ዝመና ለሌላ ጊዜ ተላልፏል.
በውጤቱም፣ ትንሽ የዝማኔ መዘግየት እጅግ በጣም ደስ የማይል ምስል አስከትሏል፣ በአገናኙ ላይ ባለው መግለጫ ላይ፡-
አዎ፣ በዚያ ስሪት firmware ውስጥ APAR (የተፈቀደለት የፕሮግራም ትንተና ዘገባ) ተብሎ የሚጠራው HU02104 ጠቃሚ ነበር። እንደሚከተለው ይታያል. በመጫን ጊዜ, በተወሰኑ ሁኔታዎች ውስጥ, መሸጎጫው ከመጠን በላይ መፍሰስ ይጀምራል, ከዚያም ስርዓቱ ወደ መከላከያ ሁነታ ይሄዳል, ይህም ለገንዳው I / Oን ያሰናክላል. በእኛ ሁኔታ, በ RAID 3 ሁነታ ውስጥ 6 ዲስክዎችን ለ RAID ቡድን የማቋረጥ ይመስላል.ግንኙነቱ ለ 6 ደቂቃዎች ነው የሚከሰተው. በመቀጠል፣ በገንዳው ውስጥ ያሉትን ጥራዞች ማግኘት ወደነበረበት ተመልሷል።
በ IBM Spectrum Virtualize አውድ ውስጥ የሎጂካዊ አካላትን አወቃቀሮች እና ስያሜ የማያውቅ ካለ አሁን በአጭሩ እገልጻለሁ።
የማከማቻ ስርዓት አመክንዮአዊ አካላት አወቃቀር
ዲስኮች ኤምዲስክ (የሚተዳደር ዲስክ) በሚባሉ ቡድኖች ይሰበሰባሉ. MDisk ክላሲክ RAID (0,1,10,5,6) ወይም ምናባዊ አንድ - DRAID (የተከፋፈለ RAID) ሊሆን ይችላል. DRAID ን መጠቀም የአደራደሩን አፈጻጸም እንዲጨምሩ ያስችልዎታል፣ ምክንያቱም... በቡድኑ ውስጥ ያሉት ሁሉም ዲስኮች ጥቅም ላይ ይውላሉ, እና የመልሶ ግንባታ ጊዜ ይቀንሳል, ምክንያቱም የተወሰኑ ብሎኮች ብቻ ወደነበሩበት መመለስ ስለሚኖርባቸው, እና ከተሳካው ዲስክ የተገኙ ሁሉም መረጃዎች አይደሉም.
የተከፋፈለ RAID (DRAID) በ RAID-5 ሁነታ ሲጠቀሙ በዲስኮች ላይ የውሂብ እገዳዎች ስርጭት።
እና ይህ ዲያግራም አንድ ዲስክ ውድቀት በሚኖርበት ጊዜ የ DRAID መልሶ መገንባት እንዴት እንደሚሰራ አመክንዮ ያሳያል።
አንድ ዲስክ ሲወድቅ የDRAID መልሶ ግንባታ አመክንዮ
በመቀጠል፣ አንድ ወይም ከዚያ በላይ Mdisks መዋኛ ተብሎ የሚጠራውን ይመሰርታሉ። በተመሳሳዩ ገንዳ ውስጥ, MDisk ከተለያዩ RAID/DRAID ደረጃዎች ጋር ተመሳሳይ በሆነ ዲስኮች ላይ መጠቀም አይመከርም. ወደዚህ በጥልቀት አንገባም ፣ ምክንያቱም… ይህንን ከሚከተሉት መጣጥፎች በአንዱ ለመሸፈን አቅደናል። ደህና፣ በእውነቱ፣ ገንዳ ወደ ጥራዞች የተከፋፈለ ሲሆን እነዚህም አንድ ወይም ሌላ የማገጃ ፕሮቶኮል ወደ አስተናጋጆች ይቀርባሉ።
ስለዚህ, እኛ, በተገለፀው ሁኔታ ምክንያት አፓአር HU02104, በሶስት ዲስኮች ምክንያታዊ ውድቀት ምክንያት, MDisk መሥራቱን አቁሟል, ይህም በተራው, የፑል እና ተዛማጅ ጥራዞች ውድቀትን አስከትሏል.
እነዚህ ሲስተሞች በጣም ብልጥ ስለሆኑ፣ ከ IBM Storage Insights ደመና-ተኮር የክትትል ስርዓት ጋር ሊገናኙ ይችላሉ፣ ይህም ችግር ከተፈጠረ በራስ ሰር የአገልግሎት ጥያቄን ለ IBM ድጋፍ ይልካል። አንድ መተግበሪያ ተፈጥሯል እና የ IBM ስፔሻሊስቶች በርቀት ምርመራ ያካሂዳሉ እና የስርዓቱን ተጠቃሚ ያነጋግሩ።
ለዚህም ምስጋና ይግባውና ጉዳዩ በፍጥነት ተፈትቷል እና ስርዓታችንን ወደ ቀድሞው የተመረጠው firmware 8.2.1.9 ለማዘመን ከድጋፍ አገልግሎቱ አፋጣኝ ምክር ደረሰ ፣ በዚያን ጊዜ ቀድሞውኑ ተስተካክሏል። ያረጋግጣል
ውጤቶች እና ምክሮቻችን
“በጥሩ ሁኔታ ያበቃል” እንደተባለው። በ firmware ውስጥ ያለው ስህተት ከባድ ችግር አላመጣም - አገልጋዮቹ በተቻለ ፍጥነት እና ያለ የውሂብ መጥፋት ወደነበሩበት ተመልሰዋል። አንዳንድ ደንበኞች ቨርቹዋል ማሽኖችን እንደገና ማስጀመር ነበረባቸው፣ ነገር ግን በአጠቃላይ የሁሉም የመሠረተ ልማት አካላት እና የደንበኛ ማሽኖች ምትኬ ስለምንሰራ ለበለጠ አሉታዊ ውጤቶች ተዘጋጅተናል።
99,9999% ቃል የተገባላቸው አስተማማኝ ስርዓቶች እንኳን ትኩረት እና ወቅታዊ ጥገና እንደሚያስፈልጋቸው ማረጋገጫ አግኝተናል። በሁኔታው ላይ በመመስረት ለራሳችን ብዙ መደምደሚያዎችን ወስደናል እና ምክሮቻችንን እንካፈላለን-
-
የዝማኔዎችን መለቀቅ መከታተል፣ ወሳኝ ሊሆኑ የሚችሉ ጉዳዮችን ለማስተካከል የመልቀቂያ ማስታወሻዎችን ማጥናት እና የታቀዱ ማሻሻያዎችን በወቅቱ ማከናወን አስፈላጊ ነው።
ይህ ድርጅታዊ እና በጣም ግልጽ የሆነ ነጥብ ነው, እሱም, የሚመስለው, ትኩረት ሊሰጠው የማይገባ ነው. ሆኖም፣ በዚህ “ደረጃ መሬት” ላይ በቀላሉ መሰናከል ይችላሉ። በእውነቱ፣ ከላይ የተገለጹትን ችግሮች የጨመረው በዚህ ወቅት ነው። የዝማኔ ደንቦቹን በሚዘጋጁበት ጊዜ በጣም ይጠንቀቁ እና ከእነሱ ጋር መከበራቸውን በጥንቃቄ ይቆጣጠሩ። ይህ ነጥብ ከ "ተግሣጽ" ጽንሰ-ሐሳብ ጋር የበለጠ ይዛመዳል.
-
ስርዓቱን በአዲሱ የሶፍትዌር ስሪት ማቆየት ሁልጊዜ የተሻለ ነው። ከዚህም በላይ፣ አሁን ያለው ትልቅ የቁጥር ስያሜ ያለው ሳይሆን በኋላ የሚለቀቅበት ቀን ያለው ነው።
ለምሳሌ፣ IBM ቢያንስ ሁለት የሶፍትዌር ልቀቶችን ለማከማቻ ስርዓቶቹ ወቅታዊ ያደርገዋል። ይህ ጽሑፍ በሚጻፍበት ጊዜ, እነዚህ 8.2 እና 8.3 ናቸው. ለ 8.2 ዝማኔዎች ቀደም ብለው ይወጣሉ. ለ 8.3 ተመሳሳይ ዝመና ብዙውን ጊዜ በትንሽ መዘግየት ይለቀቃል።
መልቀቂያ 8.3 በርካታ የተግባር ጥቅሞች አሉት, ለምሳሌ, MDisk (በ DRAID ሁነታ) አንድ ወይም ከዚያ በላይ አዲስ ዲስኮች በመጨመር (ይህ ባህሪ ከስሪት 8.3.1 ጀምሮ ታይቷል) የማስፋፋት ችሎታ. ይህ በትክክል መሰረታዊ ተግባር ነው, ግን በ 8.2, በሚያሳዝን ሁኔታ, እንደዚህ አይነት ባህሪ የለም.
-
በሆነ ምክንያት ማዘመን የማይቻል ከሆነ፣ ከስሪቱ 8.2.1.9 እና 8.3.1.0 (ከላይ የተገለጸው ስህተት አስፈላጊ በሆነበት) ለ Spectrum Virtualize ሶፍትዌር ስሪቶች የመከሰትን አደጋ ለመቀነስ፣ የ IBM ቴክኒካዊ ድጋፍ ይመክራል። ከታች ባለው ስእል ላይ እንደሚታየው የስርዓት አፈፃፀምን በመዋኛ ደረጃ መገደብ (ስዕሉ የተወሰደው በ GUI በሩሲፋይድ ስሪት ውስጥ ነው). የ 10000 IOPS ዋጋ እንደ ምሳሌ ይታያል እና በስርዓትዎ ባህሪያት መሰረት ይመረጣል.
የ IBM ማከማቻ አፈጻጸምን መገደብ
-
በማከማቻ ስርዓቶች ላይ ያለውን ጭነት በትክክል ማስላት እና ከመጠን በላይ መጫንን ማስወገድ ያስፈልጋል. ይህንን ለማድረግ የ IBM መጠንን (የእሱ መዳረሻ ካለዎት) ወይም የአጋሮችን እርዳታ ወይም የሶስተኛ ወገን ሀብቶችን መጠቀም ይችላሉ። በማከማቻ ስርዓቱ ላይ ያለውን የጭነት መገለጫ መረዳት በጣም አስፈላጊ ነው, ምክንያቱም በMB/s እና IOPS ውስጥ ያለው አፈጻጸም ቢያንስ በሚከተሉት መመዘኛዎች ላይ በመመስረት በእጅጉ ይለያያል።
-
የክወና ዓይነት: ማንበብ ወይም መጻፍ,
-
የክወና እገዳ መጠን,
-
በጠቅላላው የ I/O ዥረት ውስጥ የንባብ እና የመፃፍ ስራዎች መቶኛ።
እንዲሁም የክዋኔዎች ፍጥነት የሚነካው የውሂብ ብሎኮች እንዴት እንደሚነበቡ ነው፡ በቅደም ተከተል ወይም በዘፈቀደ ቅደም ተከተል። በመተግበሪያው በኩል ብዙ የውሂብ መዳረሻ ስራዎችን ሲያከናውን, የጥገኛ ስራዎች ጽንሰ-ሀሳብ አለ. ይህንንም ግምት ውስጥ ማስገባት ተገቢ ነው. ይህ ሁሉ ከስርዓተ ክወናው የአፈፃፀም ቆጣሪዎች ፣ የማከማቻ ስርዓት ፣ አገልጋዮች / ሃይፐርቫይዘሮች እንዲሁም የመተግበሪያዎች ፣ የዲቢኤምኤስ እና የሌሎች የዲስክ ሀብቶች “ሸማቾች” የአሠራር ባህሪዎችን አጠቃላይ መረጃን ለማየት ይረዳል ።
-
-
እና በመጨረሻም፣ የዘመኑ እና የሚሰሩ ምትኬዎች እንዳሉዎት እርግጠኛ ይሁኑ። የመጠባበቂያ መርሃ ግብሩ ለንግድ ስራው ተቀባይነት ባለው የ RPO እሴቶች ላይ በመመስረት መዋቀር አለበት እና የመጠባበቂያ ቅጂዎች ወቅታዊ የፍተሻ ማረጋገጫዎች መረጋገጥ አለባቸው (በጣም ጥቂት የመጠባበቂያ ሶፍትዌር አቅራቢዎች በምርታቸው ውስጥ በራስ ሰር ማረጋገጫ ገብተዋል) ተቀባይነት ያለው RTO ዋጋን ለማረጋገጥ።
እስከ መጨረሻው ስላነበባችሁ እናመሰግናለን።
በአስተያየቶቹ ውስጥ የእርስዎን ጥያቄዎች እና አስተያየቶች ለመመለስ ዝግጁ ነን. እንዲሁም
ምንጭ: hab.com