Kura programmaparatÅ«ras versija ir āpareizÄkÄā un āstrÄdÄjoÅ”ÄkÄā? Ja uzglabÄÅ”anas sistÄma garantÄ kļūdu toleranci 99,9999%, vai tas nozÄ«mÄ, ka tÄ darbosies bez pÄrtraukumiem pat bez programmatÅ«ras atjauninÄÅ”anas? Vai, gluži pretÄji, lai iegÅ«tu maksimÄlu kļūdu toleranci, vienmÄr jÄinstalÄ jaunÄkÄ programmaparatÅ«ra? MÄs centÄ«simies atbildÄt uz Å”iem jautÄjumiem, pamatojoties uz mÅ«su pieredzi.
Mazs ievads
MÄs visi saprotam, ka katra programmatÅ«ras versija, neatkarÄ«gi no tÄ, vai tÄ ir operÄtÄjsistÄma vai ierÄ«ces draiveris, bieži satur defektus/kļūdas un citas "funkcijas", kas var "neparÄdÄ«ties" lÄ«dz iekÄrtas kalpoÅ”anas laika beigÄm vai "atvÄrtas". tikai noteiktos apstÄkļos. Å Ädu nianÅ”u skaits un nozÄ«me ir atkarÄ«ga no programmatÅ«ras sarežģītÄ«bas (funkcionalitÄtes) un no testÄÅ”anas kvalitÄtes tÄs izstrÄdes laikÄ.
Bieži vien lietotÄji paliek pie ārÅ«pnÄ«cas programmaparatÅ«rasā (slavenais ātÄ darbojas, tÄpÄc nejaucieties ar toā) vai vienmÄr instalÄ jaunÄko versiju (pÄc viÅu izpratnes jaunÄkÄ nozÄ«mÄ visdarbÄ«gÄko). MÄs izmantojam citu pieeju - mÄs skatÄmies izlaiduma piezÄ«mes visam izmantotajam
Pie Å”Äda secinÄjuma, kÄ saka, nonÄcÄm ar pieredzi. Izmantojot mÅ«su darbÄ«bas piemÄru, mÄs jums pateiksim, kÄpÄc solÄ«tÄ 99,9999% uzglabÄÅ”anas sistÄmu uzticamÄ«ba neko nenozÄ«mÄ, ja jÅ«s nekavÄjoties neuzraugÄt programmatÅ«ras atjauninÄjumus un aprakstus. MÅ«su korpuss ir piemÄrots jebkura ražotÄja uzglabÄÅ”anas sistÄmu lietotÄjiem, jo āālÄ«dzÄ«ga situÄcija var notikt ar jebkura ražotÄja aparatÅ«ru.
Jaunas uzglabÄÅ”anas sistÄmas izvÄle
PagÄjuÅ”Ä gada beigÄs mÅ«su infrastruktÅ«rai tika pievienota interesanta datu uzglabÄÅ”anas sistÄma: IBM FlashSystem 5000 lÄ«nijas junioru modelis, kas iegÄdes brÄ«dÄ« saucÄs Storwize V5010e. Tagad tas tiek pÄrdots ar nosaukumu FlashSystem 5010, bet patiesÄ«bÄ tÄ ir tÄ pati aparatÅ«ras bÄze ar to paÅ”u Spectrum Virtualize iekÅ”pusÄ.
Starp citu, galvenÄ atŔķirÄ«ba starp IBM FlashSystem ir vienotas pÄrvaldÄ«bas sistÄmas klÄtbÅ«tne. JaunÄkÄs sÄrijas modeļiem tas praktiski neatŔķiras no produktÄ«vÄko modeļu modeļiem. IzvÄloties konkrÄtu modeli, tiek nodroÅ”inÄta tikai atbilstoÅ”a aparatÅ«ras bÄze, kuras Ä«paŔības ļauj izmantot vienu vai otru funkcionalitÄti vai nodroÅ”ina augstÄku mÄrogojamÄ«bas lÄ«meni. ProgrammatÅ«ra identificÄ aparatÅ«ru un nodroÅ”ina Å”ai platformai nepiecieÅ”amo un pietiekamo funkcionalitÄti.
IBM FlashSystem 5010
ÄŖsi par mÅ«su modeli 5010. Å Ä« ir sÄkuma lÄ«meÅa divu kontrolieru bloku uzglabÄÅ”anas sistÄma. Tas var uzÅemt NLSAS, SAS, SSD diskus. NVMe izvietojums tajÄ nav pieejams, jo Å”is krÄtuves modelis ir novietots tÄ, lai atrisinÄtu problÄmas, kurÄm nav nepiecieÅ”ama NVMe disku veiktspÄja.
UzglabÄÅ”anas sistÄma tika iegÄdÄta, lai tajÄ ievietotu arhÄ«va informÄciju vai datus, kuriem netiek bieži piekļūts. TÄpÄc mums pietika ar tÄ funkcionalitÄtes standarta komplektu: Tiering (Easy Tier), Thin Provision. ArÄ« veiktspÄja NLSAS diskos 1000-2000 IOPS lÄ«menÄ« mÅ«s bija diezgan apmierinoÅ”a.
MÅ«su pieredze - kÄ mÄs neatjauninÄjÄm programmaparatÅ«ru laikÄ
Tagad par paÅ”u programmatÅ«ras atjauninÄjumu. IegÄdes brÄ«dÄ« sistÄmai jau bija nedaudz novecojusi Spectrum Virtualize programmatÅ«ras versija, proti, 8.2.1.3.
MÄs pÄtÄ«jÄm programmaparatÅ«ras aprakstus un plÄnojÄm atjauninÄjumu 8.2.1.9. Ja mÄs bÅ«tu bijuÅ”i nedaudz efektÄ«vÄki, Ŕī raksta nebÅ«tu ā kļūda nebÅ«tu radusies jaunÄkÄ programmaparatÅ«rÄ. TomÄr noteiktu iemeslu dÄļ Ŕīs sistÄmas atjauninÄÅ”ana tika atlikta.
RezultÄtÄ neliela atjauninÄÅ”anas aizkave radÄ«ja ÄrkÄrtÄ«gi nepatÄ«kamu attÄlu, kÄ norÄdÄ«ts saites aprakstÄ:
JÄ, Ŕīs versijas programmaparatÅ«rÄ bija aktuÄls tÄ sauktais APAR (Authorized Program Analysis Report) HU02104. Tas parÄdÄs Å”Ädi. Slodzes laikÄ noteiktos apstÄkļos keÅ”atmiÅa sÄk pÄrpildÄ«t, pÄc tam sistÄma pÄriet aizsardzÄ«bas režīmÄ, kurÄ tÄ atspÄjo kopas I/O. MÅ«su gadÄ«jumÄ tas izskatÄ«jÄs pÄc 3 disku atvienoÅ”anas RAID grupai režīmÄ RAID 6. AtvienoÅ”ana notiek 6 minÅ«tes. PÄc tam tiek atjaunota piekļuve baseina sÄjumiem.
Ja kÄds nav pazÄ«stams ar loÄ£isko entÄ«tiju struktÅ«ru un nosaukumu pieŔķirÅ”anu IBM Spectrum Virtualize kontekstÄ, es tagad Ä«si paskaidroÅ”u.
KrÄtuves sistÄmas loÄ£isko elementu uzbÅ«ve
Diski tiek apkopoti grupÄs, ko sauc par MDisk (pÄrvaldÄ«ts disks). MDisk var bÅ«t klasisks RAID (0,1,10,5,6) vai virtualizÄts - DRAID (Distributed RAID). DRAID izmantoÅ”ana ļauj palielinÄt masÄ«va veiktspÄju, jo... Tiks izmantoti visi grupas diski, un atjaunoÅ”anas laiks tiks samazinÄts, jo bÅ«s jÄatjauno tikai daži bloki, nevis visi dati no neveiksmÄ«gÄ diska.
Datu bloku sadale pa diskiem, izmantojot Distributed RAID (DRAID) RAID-5 režīmÄ.
Un Ŕī diagramma parÄda loÄ£iku, kÄ DRAID pÄrbÅ«ve darbojas viena diska atteices gadÄ«jumÄ:
DRAID atjaunoŔanas loģika, ja viens disks neizdodas
TÄlÄk viens vai vairÄki MDiski veido tÄ saukto kopu. Viena pÅ«la ietvaros nav ieteicams izmantot MDisk ar dažÄdiem RAID/DRAID lÄ«meÅiem viena veida diskos. MÄs neiedziļinÄsimies Å”ajÄ jautÄjumÄ, jo... mÄs plÄnojam to aplÅ«kot vienÄ no Å”iem rakstiem. Nu, patiesÄ«bÄ, Pool ir sadalÄ«ts Volumes, kas tiek prezentÄti, izmantojot vienu vai otru bloka piekļuves protokolu saimniekiem.
TÄtad, mÄs, kÄ rezultÄtÄ aprakstÄ«tÄ situÄcija APAR HU02104, trÄ«s disku loÄ£iskÄs kļūmes dÄļ MDisk pÄrstÄja darboties, kas, savukÄrt, izraisÄ«ja pÅ«la un attiecÄ«go sÄjumu kļūmi.
TÄ kÄ Å”Ä«s sistÄmas ir diezgan gudras, tÄs var savienot ar IBM Storage Insights mÄkoÅa bÄzes uzraudzÄ«bas sistÄmu, kas, ja rodas problÄma, automÄtiski nosÅ«ta pakalpojuma pieprasÄ«jumu IBM atbalsta dienestam. Tiek izveidota aplikÄcija un IBM speciÄlisti attÄlinÄti veic diagnostiku un sazinÄs ar sistÄmas lietotÄju.
Pateicoties tam, problÄma tika atrisinÄta diezgan Ätri un tika saÅemts operatÄ«vs ieteikums no atbalsta dienesta atjauninÄt mÅ«su sistÄmu uz iepriekÅ” izvÄlÄto programmaparatÅ«ru 8.2.1.9, kas tobrÄ«d jau bija labota. Tas apstiprina
RezultÄti un mÅ«su ieteikumi
KÄ saka: "Kas labi beidzas, tas ir labi." ProgrammaparatÅ«ras kļūda neradÄ«ja nopietnas problÄmas - serveri tika atjaunoti pÄc iespÄjas ÄtrÄk un bez datu zuduma. Dažiem klientiem bija jÄrestartÄ virtuÄlÄs maŔīnas, taÄu kopumÄ bijÄm gatavi negatÄ«vÄkÄm sekÄm, jo āākatru dienu veicam visu infrastruktÅ«ras elementu un klientu maŔīnu dublÄjumus.
Esam saÅÄmuÅ”i apstiprinÄjumu, ka pat uzticamÄm sistÄmÄm ar 99,9999% solÄ«to pieejamÄ«bu ir nepiecieÅ”ama uzmanÄ«ba un savlaicÄ«ga apkope. Pamatojoties uz situÄciju, mÄs paÅ”i esam izdarÄ«juÅ”i vairÄkus secinÄjumus un dalÄmies savos ieteikumos:
-
Ir obligÄti jÄuzrauga atjauninÄjumu izlaiÅ”ana, jÄizpÄta piezÄ«mes par laidienu, lai novÄrstu potenciÄli kritiskas problÄmas, un savlaicÄ«gi jÄveic plÄnotie atjauninÄjumi.
Tas ir organizatorisks un pat diezgan acÄ«mredzams punkts, uz kuru, Ŕķiet, nav vÄrts pievÄrsties. TaÄu uz Ŕīs ālÄ«dzenÄs zemesā var diezgan viegli paklupt. PatiesÄ«bÄ tas bija Å”is brÄ«dis, kas pievienoja iepriekÅ” aprakstÄ«tÄs nepatikÅ”anas. Esiet ļoti uzmanÄ«gs, izstrÄdÄjot atjauninÄÅ”anas noteikumus, un ne mazÄk rÅ«pÄ«gi uzraugiet to ievÄroÅ”anu. Å is punkts vairÄk attiecas uz jÄdzienu ādisciplÄ«naā.
-
VienmÄr ir labÄk saglabÄt sistÄmu ar jaunÄko programmatÅ«ras versiju. TurklÄt paÅ”reizÄjais nav tas, kuram ir lielÄks skaitliskais apzÄ«mÄjums, bet gan tas, kuram ir vÄlÄks izlaiÅ”anas datums.
PiemÄram, IBM atjaunina vismaz divus programmatÅ«ras laidienus savÄm krÄtuves sistÄmÄm. Å Ä«s rakstÄ«Å”anas laikÄ tie ir 8.2 un 8.3. 8.2 atjauninÄjumi tiek publicÄti agrÄk. LÄ«dzÄ«gs atjauninÄjums versijai 8.3 parasti tiek izlaists ar nelielu kavÄÅ”anos.
Izlaidumam 8.3 ir vairÄkas funkcionÄlas priekÅ”rocÄ«bas, piemÄram, iespÄja paplaÅ”inÄt MDisk (DRAID režīmÄ), pievienojot vienu vai vairÄkus jaunus diskus (Ŕī funkcija ir parÄdÄ«jusies kopÅ” versijas 8.3.1). Å Ä« ir diezgan vienkÄrÅ”a funkcionalitÄte, taÄu 8.2 versijÄ diemžÄl Å”Ädas funkcijas nav.
-
Ja kÄda iemesla dÄļ nav iespÄjams atjauninÄt, tad Spectrum Virtualize programmatÅ«ras versijÄm, kas vecÄkas par 8.2.1.9 un 8.3.1.0 versijÄm (kur ir aktuÄla iepriekÅ” aprakstÄ«tÄ kļūda), lai samazinÄtu tÄs raÅ”anÄs risku, IBM tehniskais atbalsts iesaka ierobežojot sistÄmas veiktspÄju baseina lÄ«menÄ«, kÄ parÄdÄ«ts attÄlÄ zemÄk (attÄls tika uzÅemts GUI rusificÄtajÄ versijÄ). VÄrtÄ«ba 10000 IOPS ir parÄdÄ«ta kÄ piemÄrs un tiek izvÄlÄta atbilstoÅ”i jÅ«su sistÄmas Ä«paŔībÄm.
IBM krÄtuves veiktspÄjas ierobežoÅ”ana
-
Ir nepiecieÅ”ams pareizi aprÄÄ·inÄt uzglabÄÅ”anas sistÄmu slodzi un izvairÄ«ties no pÄrslodzes. Lai to izdarÄ«tu, varat izmantot vai nu IBM sizer (ja jums tam ir piekļuve), vai arÄ« partneru palÄ«dzÄ«bu vai treÅ”o puÅ”u resursus. Ir obligÄti jÄsaprot slodzes profils uzglabÄÅ”anas sistÄmÄ, jo VeiktspÄja MB/s un IOPS ievÄrojami atŔķiras atkarÄ«bÄ no vismaz Å”Ädiem parametriem:
-
darbības veids: lasīt vai rakstīt,
-
operÄciju bloka lielums,
-
lasÄ«Å”anas un rakstÄ«Å”anas operÄciju procentuÄlÄ daļa kopÄjÄ I/O straumÄ.
TÄpat darbÄ«bu Ätrumu ietekmÄ tas, kÄ tiek nolasÄ«ti datu bloki: secÄ«gi vai nejauÅ”Ä secÄ«bÄ. Veicot vairÄkas datu piekļuves darbÄ«bas lietojumprogrammas pusÄ, pastÄv atkarÄ«go darbÄ«bu jÄdziens. Ieteicams arÄ« to Åemt vÄrÄ. Tas viss var palÄ«dzÄt redzÄt OS veiktspÄjas skaitÄ«tÄju, uzglabÄÅ”anas sistÄmas, serveru/hipervizoru datu kopumu, kÄ arÄ« izpratni par lietojumprogrammu, DBVS un citu diska resursu āpatÄrÄtÄjuā darbÄ«bas funkcijÄm.
-
-
Visbeidzot, pÄrliecinieties, ka dublÄjumkopijas ir atjauninÄtas un darbojas. DublÄÅ”anas grafiks ir jÄkonfigurÄ, pamatojoties uz uzÅÄmumam pieÅemamÄm RPO vÄrtÄ«bÄm, un ir jÄpÄrbauda periodiskas dublÄjumu integritÄtes pÄrbaudes (daudzi dublÄjuma programmatÅ«ras pÄrdevÄji savos produktos ir ieviesuÅ”i automatizÄtu verifikÄciju), lai nodroÅ”inÄtu pieÅemamu RTO vÄrtÄ«bu.
Paldies, ka izlasÄ«jÄt lÄ«dz beigÄm.
MÄs esam gatavi komentÄros atbildÄt uz jÅ«su jautÄjumiem un komentÄriem. ArÄ«
Avots: www.habr.com