Ngano nga hinungdanon nga sulayan ang software sa imong taas nga magamit nga sistema sa pagtipig (99,9999%)

Ngano nga hinungdanon nga sulayan ang software sa imong taas nga magamit nga sistema sa pagtipig (99,9999%)

Unsa nga bersyon sa firmware ang labing "husto" ug "nagtrabaho"? Kung ang usa ka sistema sa pagtipig naggarantiya sa pagtugot sa sayup nga 99,9999%, nagpasabut ba kana nga kini molihok nga walay hunong bisan kung wala’y pag-update sa software? O, sa sukwahi, aron makuha ang labing taas nga pagtugot sa sayup, kinahanglan nimo kanunay nga i-install ang pinakabag-o nga firmware? Atong sulayan pagtubag kini nga mga pangutana base sa atong kasinatian.

Usa ka gamay nga pasiuna

Kitang tanan nakasabut nga ang matag bersyon sa software, kini usa ka operating system o usa ka drayber alang sa usa ka device, kasagaran adunay mga depekto/bugs ug uban pang mga "features" nga mahimong dili "mopakita" hangtud matapos ang serbisyo sa kagamitan, o "abli" lamang ubos sa pipila ka mga kondisyon. Ang gidaghanon ug kamahinungdanon sa ingon nga mga nuances nagdepende sa pagkakomplikado (functionality) sa software ug sa kalidad sa pagsulay sa panahon sa pag-uswag niini. 

Kasagaran, ang mga tiggamit magpabilin sa "firmware gikan sa pabrika" (ang bantog nga "kini nagtrabaho, busa ayaw pagsamok niini") o kanunay nga i-install ang pinakabag-o nga bersyon (sa ilang pagsabot, ang pinakabag-o nagpasabot nga labing nagtrabaho). Naggamit kami usa ka lahi nga pamaagi - among gitan-aw ang mga nota sa pagpagawas alang sa tanan nga gigamit sa panganod sa mClouds ekipo ug maampingong pilia ang angay nga firmware alang sa matag piraso sa kagamitan.

Nakaabot kami niini nga konklusyon, ingon sa ilang giingon, nga adunay kasinatian. Gamit ang among panig-ingnan sa operasyon, isulti namon kanimo kung ngano nga ang gisaad nga 99,9999% nga kasaligan sa mga sistema sa pagtipig wala’y hinungdan kung dili nimo mabantayan dayon ang mga pag-update sa software ug mga paghulagway. Ang among kaso angay alang sa mga tiggamit sa mga sistema sa pagtipig gikan sa bisan unsang vendor, tungod kay ang parehas nga kahimtang mahimo’g mahitabo sa hardware gikan sa bisan unsang tiggama.

Pagpili ug Bag-ong Sistema sa Pagtipig

Sa katapusan sa miaging tuig, usa ka makapaikag nga sistema sa pagtipig sa datos ang gidugang sa among imprastraktura: usa ka modelo sa junior gikan sa linya sa IBM FlashSystem 5000, nga sa panahon sa pagpalit gitawag nga Storwize V5010e. Karon kini gibaligya ubos sa ngalan nga FlashSystem 5010, apan sa pagkatinuod kini mao ang sama nga hardware base sa sama nga Spectrum Virtualize sulod. 

Ang presensya sa usa ka hiniusa nga sistema sa pagdumala mao, sa tinuud, ang panguna nga kalainan tali sa IBM FlashSystem. Alang sa mga modelo sa mga batan-on nga serye, halos wala’y kalainan sa mga modelo nga labi ka produktibo. Ang pagpili sa usa ka piho nga modelo naghatag lamang sa angay nga base sa hardware, ang mga kinaiya nga nagpaposible sa paggamit sa usa o lain nga gamit o paghatag og mas taas nga lebel sa scalability. Ang software nagpaila sa hardware ug naghatag sa gikinahanglan ug igo nga gamit alang niini nga plataporma.

Ngano nga hinungdanon nga sulayan ang software sa imong taas nga magamit nga sistema sa pagtipig (99,9999%)IBM FlashSystem 5010

Sa mubo bahin sa among modelo nga 5010. Kini usa ka entry-level nga dual-controller block storage system. Kini maka-accommodate NLSAS, SAS, SSD disks. Ang pagbutang sa NVMe dili magamit niini, tungod kay kini nga modelo sa pagtipig gipahimutang aron masulbad ang mga problema nga wala magkinahanglan sa paghimo sa mga NVMe drive.

Ang sistema sa pagtipig gipalit aron ma-accommodate ang impormasyon sa archival o data nga dili kanunay ma-access. Busa, ang standard set sa iyang functionality igo na alang kanamo: Tiering (Easy Tier), Thin Provision. Ang pasundayag sa mga disk sa NLSAS sa lebel sa 1000-2000 IOPS medyo makapatagbaw usab alang kanamo.

Ang among kasinatian - kung giunsa namon wala ma-update ang firmware sa oras

Karon bahin sa pag-update sa software mismo. Sa panahon sa pagpalit, ang sistema adunay usa ka gamay nga outdated nga bersyon sa Spectrum Virtualize software, nga mao, 8.2.1.3.

Among gitun-an ang mga deskripsyon sa firmware ug nagplano og update sa 8.2.1.9. Kung kami labi ka episyente, kini nga artikulo wala unta maglungtad - ang bug dili mahitabo sa usa ka bag-o nga firmware. Bisan pa, alang sa pipila nga mga hinungdan, ang pag-update sa kini nga sistema gi-post.

Ingon usa ka sangputanan, ang usa ka gamay nga paglangan sa pag-update nagdala sa usa ka labi ka dili maayo nga litrato, sama sa paghulagway sa link: https://www.ibm.com/support/pages/node/6172341

Oo, sa firmware sa kana nga bersyon ang gitawag nga APAR (Authorized Program Analysis Report) HU02104 may kalabutan. Kini makita sama sa mosunod. Ubos sa load, ubos sa pipila ka mga kahimtang, ang cache nagsugod sa pag-awas, unya ang sistema moadto sa protective mode, diin kini disables I/O alang sa pool. Sa among kaso, kini sama sa pagdiskonekta sa 3 nga mga disk alang sa usa ka grupo sa RAID sa mode nga RAID 6. Ang pagdiskonekta mahitabo sa 6 nga mga minuto. Sunod, ang pag-access sa Volumes sa Pool gipahiuli.

Kung adunay dili pamilyar sa istruktura ug pagngalan sa mga lohikal nga entidad sa konteksto sa IBM Spectrum Virtualize, ako karon ipasabut sa daklit.

Ngano nga hinungdanon nga sulayan ang software sa imong taas nga magamit nga sistema sa pagtipig (99,9999%)Ang istruktura sa sistema sa pagtipig lohikal nga mga elemento

Ang mga disk gikolekta sa mga grupo nga gitawag MDisk (Managed Disk). Ang MDisk mahimong usa ka klasiko nga RAID (0,1,10,5,6) o usa ka virtualized - DRAID (Distributed RAID). Ang paggamit sa DRAID nagtugot kanimo sa pagdugang sa performance sa array, tungod kay... Ang tanan nga mga disk sa grupo gamiton, ug ang oras sa pagtukod pag-usab maminusan, tungod sa kamatuoran nga pipila ra nga mga bloke ang kinahanglan nga ibalik, ug dili tanan nga datos gikan sa napakyas nga disk.

Ngano nga hinungdanon nga sulayan ang software sa imong taas nga magamit nga sistema sa pagtipig (99,9999%)Pag-apod-apod sa mga bloke sa datos sa mga disk kung gigamit ang Distributed RAID (DRAID) sa RAID-5 mode.

Ug kini nga diagram nagpakita sa lohika kung giunsa ang pagtukod pag-usab sa DRAID kung adunay usa ka pagkapakyas sa disk:

Ngano nga hinungdanon nga sulayan ang software sa imong taas nga magamit nga sistema sa pagtipig (99,9999%)Logic sa DRAID pagtukod pag-usab kung ang usa ka disk mapakyas

Sunod, usa o daghan pa nga MDisks nagporma usa ka gitawag nga Pool. Sulod sa parehas nga pool, dili girekomenda nga gamiton ang MDisk nga adunay lainlaing lebel sa RAID / DRAID sa mga disk nga parehas nga tipo. Dili nato kini hisgotan pag-ayo, tungod kay... plano namo nga hisgotan kini sa usa sa mosunod nga mga artikulo. Aw, sa tinuud, ang Pool gibahin sa Mga Volume, nga gipresentar gamit ang usa o lain nga block access protocol sa mga host.

Mao nga, kami, ingon usa ka sangputanan sa kahimtang nga gihulagway sa APAR HU02104, tungod sa lohikal nga kapakyasan sa tulo ka mga disk, ang MDisk wala na magamit, nga, sa baylo, miresulta sa pagkapakyas sa Pool ug sa katugbang nga mga Tomo.

Tungod kay kini nga mga sistema maayo kaayo, mahimo silang konektado sa IBM Storage Insights nga cloud-based nga monitoring system, nga awtomatiko nga nagpadala usa ka hangyo sa serbisyo sa suporta sa IBM kung adunay problema. Gihimo ang usa ka aplikasyon ug ang mga espesyalista sa IBM layo nga nagpahigayon mga diagnostic ug nakigkontak sa tiggamit sa sistema. 

Salamat niini, ang isyu dali nga nasulbad ug usa ka dali nga rekomendasyon ang nadawat gikan sa serbisyo sa suporta aron ma-update ang among sistema sa gipili kaniadto nga firmware 8.2.1.9, nga niadtong panahona naayo na. Kini nagpamatuod katugbang nga Release Note.

Resulta ug among mga rekomendasyon

Sama sa giingon sa panultihon: "all's well that ends well." Ang bug sa firmware wala magpahinabog seryoso nga mga problema - ang mga server gipahiuli sa labing madali nga panahon ug walay pagkawala sa datos. Ang ubang mga kliyente kinahanglan nga i-restart ang mga virtual machine, apan sa kinatibuk-an kami andam alang sa mas negatibo nga mga sangputanan, tungod kay naghimo kami adlaw-adlaw nga pag-backup sa tanan nga mga elemento sa imprastraktura ug mga makina sa kliyente. 

Nakadawat kami og kumpirmasyon nga bisan ang kasaligan nga mga sistema nga adunay 99,9999% nga gisaad nga pagkaanaa nanginahanglan pagtagad ug tukma sa panahon nga pagmentinar. Pinasukad sa sitwasyon, naghimo kami daghang mga konklusyon alang sa among kaugalingon ug gipaambit ang among mga rekomendasyon:

  • Kinahanglan nga bantayan ang pagpagawas sa mga update, tun-an ang Release Notes para sa pag-ayo sa posibleng kritikal nga mga isyu, ug ipatuman ang giplano nga mga update sa tukma sa panahon nga paagi.

    Kini usa ka organisasyonal ug bisan klaro nga punto, nga, ingon og, dili angay nga ipunting. Bisan pa, sa kini nga "patas nga yuta" dali ka nga mapandol. Sa tinuud, kini nga higayon nga nagdugang sa mga kasamok nga gihulagway sa ibabaw. Pag-amping pag-ayo sa paghimo sa mga regulasyon sa pag-update ug pag-monitor sa pagsunod niini nga dili kaayo maayo. Kini nga punto mas may kalabutan sa konsepto sa "disiplina".

  • Kanunay nga mas maayo nga tipigan ang sistema nga adunay pinakabag-o nga bersyon sa software. Dugang pa, ang kasamtangan dili ang usa nga adunay mas dako nga numerical designation, kondili ang usa nga adunay ulahi nga petsa sa pagpagawas. 

    Pananglitan, ang IBM nagpadayon sa labing menos duha ka software nga gipagawas nga labing bag-o alang sa mga sistema sa pagtipig niini. Sa panahon sa pagsulat niini, kini ang 8.2 ug 8.3. Ang mga update alang sa 8.2 migawas sa sayo pa. Ang susama nga pag-update alang sa 8.3 kasagarang gipagawas nga adunay gamay nga paglangan.

    Ang pagpagawas sa 8.3 adunay daghang mga bentaha nga magamit, pananglitan, ang abilidad sa pagpalapad sa MDisk (sa DRAID mode) pinaagi sa pagdugang usa o daghang bag-ong mga disk (kini nga bahin nagpakita sukad sa bersyon 8.3.1). Kini usa ka medyo sukaranan nga pagpaandar, apan sa 8.2, sa kasubo, wala’y ingon nga bahin.

  • Kung dili posible ang pag-update sa usa ka rason, nan alang sa mga bersyon sa Spectrum Virtualize software sa wala pa ang mga bersyon 8.2.1.9 ug 8.3.1.0 (diin ang bug nga gihulagway sa ibabaw may kalabutan), aron makunhuran ang risgo sa pagkahitabo niini, girekomenda sa teknikal nga suporta sa IBM paglimite sa performance sa sistema sa lebel sa pool, sama sa gipakita sa hulagway sa ubos (ang hulagway gikuha sa Russified nga bersyon sa GUI). Ang bili sa 10000 IOPS gipakita isip usa ka pananglitan ug gipili sumala sa mga kinaiya sa imong sistema.

Ngano nga hinungdanon nga sulayan ang software sa imong taas nga magamit nga sistema sa pagtipig (99,9999%)Paglimite sa performance sa storage sa IBM

  • Kinahanglan nga husto ang pagkalkulo sa pagkarga sa mga sistema sa pagtipig ug paglikay sa sobrang pagkarga. Aron mahimo kini, mahimo nimong gamiton ang IBM sizer (kung adunay ka access niini), o ang tabang sa mga kauban, o mga kapanguhaan sa ikatulo nga partido. Importante nga masabtan ang load profile sa storage system, tungod kay Ang performance sa MB/s ug IOPS magkalahi kaayo depende sa labing menos sa mosunod nga mga parameter:

    • matang sa operasyon: pagbasa o pagsulat,

    • gidak-on sa bloke sa operasyon,

    • porsyento sa pagbasa ug pagsulat nga mga operasyon sa kinatibuk-ang I/O stream.

    Usab, ang katulin sa mga operasyon maapektuhan kung giunsa ang pagbasa sa mga bloke sa datos: sunud-sunod o sa random nga pagkahan-ay. Kung nagpahigayon daghang mga operasyon sa pag-access sa datos sa bahin sa aplikasyon, adunay konsepto sa mga nagsalig nga operasyon. Gisugyot usab nga tagdon kini. Kining tanan makatabang sa pagtan-aw sa kinatibuk-an sa datos gikan sa performance counters sa OS, storage system, servers/hypervisors, ingon man ang pagsabot sa operating features sa mga aplikasyon, DBMS ug uban pang “consumers” sa disk resources.

  • Ug sa katapusan, siguruha nga adunay mga backup nga labing bag-o ug nagtrabaho. Ang iskedyul sa pag-backup kinahanglan nga ma-configure base sa madawat nga mga kantidad sa RPO alang sa negosyo, ug ang mga regular nga pagsusi sa integridad sa mga backup kinahanglan nga mapamatud-an (daghang mga backup nga software vendor ang adunay awtomatiko nga pag-verify nga gipatuman sa ilang mga produkto) aron masiguro ang usa ka madawat nga kantidad sa RTO.

Salamat sa pagbasa hangtod sa katapusan.
Andam kami sa pagtubag sa imong mga pangutana ug komento sa mga komento. Usab Gidapit ka namo nga mag-subscribe sa among telegram channel, diin kami adunay regular nga mga promosyon (mga diskwento sa IaaS ug mga giveaways alang sa mga code nga pang-promosyon hangtod sa 100% sa VPS), pagsulat sa makapaikag nga mga balita ug pagpahibalo sa mga bag-ong artikulo sa Habr blog.

Source: www.habr.com

Idugang sa usa ka comment