Carson a tha e cudromach bathar-bog a dhearbhadh air do stòradh àrd ri fhaighinn (99,9999%)

Carson a tha e cudromach bathar-bog a dhearbhadh air do stòradh àrd ri fhaighinn (99,9999%)

Dè an dreach firmware a tha nas “ceart” agus “ag obair”? Ma tha siostam stòraidh a’ gealltainn fulangas locht de 99,9999%, a bheil sin a’ ciallachadh gun obraich e gun bhriseadh eadhon às aonais ùrachadh bathar-bog? No, air an làimh eile, gus an ìre as àirde de fhulangas sgàinidh fhaighinn, bu chòir dhut an-còmhnaidh am firmware as ùire a stàladh? Feuchaidh sinn ris na ceistean sin a fhreagairt stèidhichte air ar n-eòlas.

Ro-ràdh beag

Tha sinn uile a’ tuigsinn gu bheil gach dreach de bhathar-bog, biodh e na shiostam obrachaidh no na dhràibhear airson inneal, gu tric a’ toirt a-steach uireasbhaidhean/bugs agus “feartan” eile a dh’ fhaodadh nach eil “a’ nochdadh ”gu deireadh beatha seirbheis an uidheim, no “fosgailte” a-mhàin fo chumhachan sònraichte. Tha àireamh agus cudromachd nan nuances sin an urra ri iom-fhillteachd (gnìomhachd) am bathar-bog agus air càileachd an deuchainn rè a leasachadh. 

Gu math tric, bidh luchd-cleachdaidh a 'fuireach air an "firmware bhon fhactaraidh" (an fheadhainn ainmeil "tha e ag obair, mar sin na dèan dragh air") no an-còmhnaidh cuir a-steach an dreach as ùire (nan tuigse, is e an rud as ùire an fheadhainn as motha a tha ag obair). Bidh sinn a’ cleachdadh dòigh-obrach eadar-dhealaichte - bidh sinn a’ coimhead air na notaichean fuasglaidh airson a h-uile rud a thathar a’ cleachdadh ann an sgòth mClouds uidheamachd agus tagh gu faiceallach am firmware iomchaidh airson gach pìos uidheamachd.

Thàinig sinn chun cho-dhùnadh seo, mar a chanas iad, le eòlas. A’ cleachdadh ar n-eisimpleir obrachaidh, innsidh sinn dhut carson a tha an 99,9999% earbsachd siostaman stòraidh a’ ciallachadh dad mura dèan thu sùil gu sgiobalta air ùrachaidhean is tuairisgeulan bathar-bog. Tha a’ chùis againn freagarrach airson luchd-cleachdaidh siostaman stòraidh bho reiceadair sam bith, oir faodaidh suidheachadh coltach ris tachairt le bathar-cruaidh bho neach-dèanamh sam bith.

A 'taghadh siostam stòraidh ùr

Aig deireadh na bliadhna an-uiridh, chaidh siostam stòraidh dàta inntinneach a chuir ris a ’bhun-structar againn: modail òg bho loidhne IBM FlashSystem 5000, ris an canar Storwize V5010e aig àm an ceannach. A-nis tha e air a reic fon ainm FlashSystem 5010, ach gu dearbh is e an aon bhunait bathar-cruaidh a th ’ann leis an aon Spectrum Virtualize a-staigh. 

Is e làthaireachd siostam riaghlaidh aonaichte, leis an t-slighe, am prìomh eadar-dhealachadh eadar IBM FlashSystem. Airson modalan den t-sreath as òige, cha mhòr nach eil e eadar-dhealaichte bho mhodailean nas cinneasaiche. Le bhith a’ taghadh modail sònraichte a-mhàin a’ toirt seachad am bunait bathar-cruaidh iomchaidh, agus tha na feartan aca ga dhèanamh comasach aon no fear eile a chleachdadh no ìre nas àirde de scalability a thoirt seachad. Bidh am bathar-bog a’ comharrachadh a’ bhathar-chruaidh agus a’ toirt seachad an comas-gnìomh a tha riatanach agus gu leòr airson an àrd-ùrlar seo.

Carson a tha e cudromach bathar-bog a dhearbhadh air do stòradh àrd ri fhaighinn (99,9999%)IBM Flash System 5010

Beagan mun mhodail againn 5010. Is e siostam stòraidh bloc dà-smachd aig ìre inntrigidh a tha seo. Gabhaidh e ri diosgan NLSAS, SAS, SSD. Chan eil suidheachadh NVMe ri fhaighinn ann, leis gu bheil am modail stòraidh seo air a shuidheachadh gus fuasgladh fhaighinn air duilgheadasan nach eil feumach air coileanadh dhràibhearan NVMe.

Chaidh an siostam stòraidh a cheannach gus gabhail ri fiosrachadh tasglainn no dàta nach fhaighear gu tric. Mar sin, bha an seata àbhaisteach de ghnìomhachd gu leòr dhuinn: Sreathan (Sreath furasta), Solarachadh tana. Bha coileanadh air diosgan NLSAS aig ìre 1000-2000 IOPS cuideachd gu math riarachail dhuinn.

Ar n-eòlas - mar nach do dh'ùraich sinn am firmware ann an àm

A-nis mun ùrachadh bathar-bog fhèin. Aig àm an ceannach, bha dreach beagan seann-fhasanta aig an t-siostam de bhathar-bog Spectrum Virtualize, is e sin, 8.2.1.3.

Rinn sinn sgrùdadh air na tuairisgeulan firmware agus dhealbhaich sinn ùrachadh gu 8.2.1.9. Nam biodh sinn air a bhith beagan nas èifeachdaiche, cha bhiodh an artaigil seo air a bhith ann - cha bhiodh am biast air tachairt air firmware nas ùire. Ach, airson adhbharan sònraichte, chaidh ùrachadh an t-siostam seo a chuir dheth.

Mar thoradh air an sin, dh'adhbhraich beagan dàil ùrachaidh dealbh air leth mì-thlachdmhor, mar a tha san tuairisgeul aig a’ cheangal: https://www.ibm.com/support/pages/node/6172341

Bha, ann am firmware an tionndaidh sin bha an t-ainm ris an canar APAR (Aithisg Mion-sgrùdadh Prògram Ùghdarraichte) HU02104 buntainneach. Tha e a 'nochdadh mar a leanas. Fo luchd, ann an suidheachaidhean sònraichte, bidh an tasgadan a ’tòiseachadh a’ cur thairis, agus an uairsin bidh an siostam a ’dol a-steach don mhodh dìon, anns am bi e a’ cuir à comas I / O airson an amar. Anns a 'chùis againn, bha e coltach ri bhith a' dì-cheangal diosgan 3 airson buidheann RAID ann am modh RAID 6. Bidh an dì-cheangal a 'tachairt airson 6 mionaidean. An ath rud, thèid ruigsinneachd gu na Volumes in the Pool ath-nuadhachadh.

Mura h-eil duine eòlach air structar agus ainmeachadh bhuidhnean loidsigeach ann an co-theacsa IBM Spectrum Virtualize, bheir mi mìneachadh goirid a-nis.

Carson a tha e cudromach bathar-bog a dhearbhadh air do stòradh àrd ri fhaighinn (99,9999%)Structar siostam stòraidh eileamaidean loidsigeach

Bithear a’ cruinneachadh diosgan ann am buidhnean ris an canar MDisk (Managed Disk). Faodaidh MDisk a bhith na RAID clasaigeach (0,1,10,5,6) no fear brìgheil - DRAID (RAID Sgaoilte). Le bhith a’ cleachdadh DRAID leigidh sin leat coileanadh an t-sreath a mheudachadh, leis gu bheil ... Thèid a h-uile diosc sa bhuidheann a chleachdadh, agus thèid an ùine ath-thogail a lughdachadh, leis nach fheum ach cuid de bhlocaichean ath-nuadhachadh, agus chan eil a h-uile dàta bhon diosc a dh’ fhàillig.

Carson a tha e cudromach bathar-bog a dhearbhadh air do stòradh àrd ri fhaighinn (99,9999%)Cuairteachadh bhlocaichean dàta thairis air diosgan nuair a bhios tu a’ cleachdadh Distributed RAID (DRAID) ann am modh RAID-5.

Agus tha an diagram seo a’ sealltainn loidsig mar a bhios ath-thogail DRAID ag obair ma dh’ fhàillig aon diosc:

Carson a tha e cudromach bathar-bog a dhearbhadh air do stòradh àrd ri fhaighinn (99,9999%)Loidsig ath-thogail DRAID nuair a dh’ fhailicheas aon diosc

An ath rud, bidh aon no barrachd MDisks a’ cruthachadh Pool ris an canar. Taobh a-staigh an aon amar, chan eilear a’ moladh MDisk a chleachdadh le diofar ìrean RAID/DRAID air diosgan den aon sheòrsa. Cha tèid sinn a-steach don seo ro dhomhainn, oir... tha sinn an dùil seo a chòmhdach ann an aon de na h-artaigilean a leanas. Uill, gu dearbh, tha Pool air a roinn ann an Volumes, a tha air an taisbeanadh le bhith a ’cleachdadh aon no fear eile de phròtacal ruigsinneachd bloc dha na h-aoighean.

Mar sin, tha sinn, mar thoradh air an t-suidheachadh a chaidh a mhìneachadh ann an APAR HU02104, air sgàth fàilligeadh loidsigeach trì diosgan, sguir MDisk a bhith obrachail, agus mar thoradh air sin dh'fhàillig an amar agus na h-àireamhan co-fhreagarrach.

Leis gu bheil na siostaman sin gu math sgiobalta, faodaidh iad a bhith ceangailte ri siostam sgrùdaidh sgòthan IBM Storage Insights, a bhios gu fèin-ghluasadach a’ cur iarrtas seirbheis gu taic IBM ma thachras duilgheadas. Tha tagradh air a chruthachadh agus bidh eòlaichean IBM a’ dèanamh breithneachadh air astar agus a’ cur fios gu neach-cleachdaidh an t-siostaim. 

Taing dha seo, chaidh a’ chùis fhuasgladh gu math luath agus fhuaireadh moladh sgiobalta bhon t-seirbheis taice gus an siostam againn ùrachadh chun firmware 8.2.1.9 a chaidh a thaghadh roimhe, a bha aig an àm sin air a bhith air a shocrachadh mu thràth. Tha e a 'dearbhadh Nota foillseachaidh co-fhreagarrach.

Toraidhean agus na molaidhean againn

Mar a tha an abairt ag ràdh: "Tha a h-uile dad gu math a thig gu crìch gu math." Cha do dh'adhbhraich am bug anns a 'firmware droch dhuilgheadasan - chaidh na frithealaichean ath-nuadhachadh cho luath' s as urrainn agus gun call dàta. Bha aig cuid de luchd-dèiligidh ri innealan brìgheil ath-thòiseachadh, ach san fharsaingeachd bha sinn deiseil airson builean nas àicheil, leis gu bheil sinn a’ dèanamh cùl-taic làitheil de gach eileamaid bun-structair agus inneal teachdaiche. 

Tha sinn air dearbhadh fhaighinn gu bheil eadhon siostaman earbsach le 99,9999% rim faighinn a’ feumachdainn aire agus cumail suas ann an deagh àm. Stèidhichte air an t-suidheachadh, tha sinn air grunn cho-dhùnaidhean a tharraing dhuinn fhìn agus air na molaidhean againn a cho-roinn:

  • Tha e deatamach sùil a chumail air sgaoileadh ùrachaidhean, sgrùdadh a dhèanamh air Notaichean Foillseachaidh airson ceartachadh air cùisean a dh’ fhaodadh a bhith èiginneach, agus ùrachaidhean dealbhaichte a dhèanamh ann an deagh àm.

    Is e puing eagrachaidh a tha seo agus eadhon gu math follaiseach, agus, tha e coltach, nach fhiach fòcas a chuir air. Ach, air an “talamh còmhnard” seo faodaidh tu tuiteam gu math furasta. Gu fìrinneach, b’ e an àm seo a chuir ris na duilgheadasan a chaidh a mhìneachadh gu h-àrd. Bi air leth faiceallach nuair a bhios tu a’ dealbhadh nan riaghailtean ùrachaidh agus cùm sùil air gèilleadh riutha gun a bhith cho faiceallach. Tha a’ phuing seo nas co-cheangailte ris a’ bhun-bheachd air “smachd”.

  • Tha e an-còmhnaidh nas fheàrr an siostam a chumail leis an dreach bathar-bog as ùire. A bharrachd air an sin, chan e am fear a th’ ann an-dràsta am fear aig a bheil sònrachadh àireamhach nas motha, ach am fear le ceann-latha fuasglaidh nas fhaide air adhart. 

    Mar eisimpleir, bidh IBM a’ cumail co-dhiù dà fhoillseachadh bathar-bog ùraichte airson na siostaman stòraidh aige. Aig àm an sgrìobhaidh seo, is iad sin 8.2 agus 8.3. Thig ùrachaidhean airson 8.2 a-mach nas tràithe. Mar as trice bidh ùrachadh coltach ris airson 8.3 air a leigeil ma sgaoil le beagan dàil.

    Tha grunn bhuannachdan gnìomh aig sgaoileadh 8.3, mar eisimpleir, an comas MDisk a leudachadh (ann am modh DRAID) le bhith a’ cur aon diosc ùr no barrachd ris (tha am feart seo air nochdadh bho dhreach 8.3.1). Is e gnìomh gu math bunaiteach a tha seo, ach ann an 8.2, gu mì-fhortanach, chan eil feart mar sin ann.

  • Mura h-eil e comasach ùrachadh airson adhbhar air choireigin, an uairsin airson dreachan de bhathar-bog Spectrum Virtualize ro dhreach 8.2.1.9 agus 8.3.1.0 (far a bheil am biast a tha air a mhìneachadh gu h-àrd buntainneach), gus an cunnart gun tachair e a lughdachadh, tha taic theicnigeach IBM a’ moladh a 'cuingealachadh coileanadh siostam aig ìre an amar, mar a chithear san fhigear gu h-ìosal (chaidh an dealbh a thogail anns an dreach Russified den GUI). Tha luach 10000 IOPS air a shealltainn mar eisimpleir agus air a thaghadh a rèir feartan an t-siostaim agad.

Carson a tha e cudromach bathar-bog a dhearbhadh air do stòradh àrd ri fhaighinn (99,9999%)A’ cuingealachadh coileanadh stòraidh IBM

  • Feumar obrachadh a-mach an luchd air siostaman stòraidh gu ceart agus cus luchdachadh a sheachnadh. Gus seo a dhèanamh, faodaidh tu an dàrna cuid an IBM sizer a chleachdadh (ma tha cothrom agad air), no cuideachadh bho chom-pàirtichean, no goireasan treas-phàrtaidh. Tha e deatamach tuigsinn ìomhaigh luchdan air an t-siostam stòraidh, oir Bidh coileanadh ann am MB / s agus IOPS ag atharrachadh gu mòr a rèir co-dhiù na paramadairean a leanas:

    • seòrsa obrachaidh: leugh no sgrìobh,

    • meud bloc obrachaidh,

    • àireamh sa cheud de ghnìomhachd leughaidh is sgrìobhaidh anns an t-sruth iomlan I/O.

    Cuideachd, tha buaidh aig astar gnìomhachd air mar a thèid blocaichean dàta a leughadh: ann an òrdugh no ann an òrdugh air thuaiream. Nuair a bhios tu a’ coileanadh iomadh obair ruigsinneachd dàta air taobh an tagraidh, tha bun-bheachd gnìomhachd eisimeileach ann. Thathas cuideachd a’ moladh seo a thoirt fa-near. Faodaidh seo uile cuideachadh le bhith a’ faicinn iomlanachd an dàta bho chunntair coileanaidh an OS, siostam stòraidh, frithealaichean / hypervisors, a bharrachd air tuigse air feartan obrachaidh thagraidhean, DBMSs agus “luchd-cleachdaidh” eile de ghoireasan diosc.

  • Agus mu dheireadh, dèan cinnteach gu bheil cùl-taic agad ùraichte agus ag obair. Bu chòir an clàr cùl-taic a bhith air a rèiteachadh stèidhichte air luachan RPO iomchaidh airson a’ ghnìomhachais, agus bu chòir sgrùdaidhean ionracas bho àm gu àm air na cùl-taic a dhearbhadh (tha grunn luchd-reic bathar-bog cùl-taic air dearbhadh fèin-ghluasadach a chuir an gnìomh anns na toraidhean aca) gus dèanamh cinnteach à luach RTO iomchaidh.

Tapadh leibh airson an leughadh gu deireadh.
Tha sinn deiseil airson do cheistean agus do bheachdan a fhreagairt anns na beachdan. Cuideachd Tha sinn a’ toirt cuireadh dhut fo-sgrìobhadh don t-sianal teileagram againn, anns am bi sinn a’ cumail sanasachd cunbhalach (lasachaidhean air IaaS agus toirt seachad airson còdan adhartachaidh suas gu 100% air VPS), a’ sgrìobhadh naidheachdan inntinneach agus ag ainmeachadh artaigilean ùra air blog Habr.

Source: www.habr.com

Cuir beachd ann