Hvernig á að velja geymslu án þess að skjóta sig í fótinn

Inngangur

Það er kominn tími til að kaupa geymslu. Hvern á að taka, á hvern á að hlusta? Seljandi A talar um seljanda B og svo er það samþættingaraðili C, sem segir hið gagnstæða og ráðleggur seljanda D. Í slíkum aðstæðum mun jafnvel haus reyndra geymsluarkitekta snúast, sérstaklega með öllum nýju söluaðilum og SDS og ofursamruna sem eru í tísku í dag.

Svo, hvernig finnurðu þetta allt út og endar ekki með því að vera fífl? Við (AntonVirtual Anton Zhbankov og Corp Evgeniy Elizarov) við skulum reyna að tala um þetta á venjulegri rússnesku.
Greinin á margt líkt og er í raun framlenging á „Sýndarvædd hönnun gagnavera“ hvað varðar val á geymslukerfi og endurskoðun geymslutækni. Við munum í stuttu máli skoða almennu kenninguna en við mælum með að þú lesir þessa grein líka.

Hvað fyrir

Þú getur oft séð aðstæður þar sem nýr einstaklingur kemur á spjallborð eða sérhæft spjall, eins og geymsluumræður, og spyr spurningarinnar: „hér bjóða þeir mér tvo geymslumöguleika - ABC SuperStorage S600 og XYZ HyperOcean 666v4, með hverju mælið þið ?”

Og ruglið byrjar um hver hefur hvaða eiginleika útfærslu á hræðilegum og óskiljanlegum eiginleikum, sem fyrir óundirbúinn mann eru algjörlega kínverskir.

Svo, lykillinn og fyrsta spurningin sem þú þarft að spyrja sjálfan þig löngu áður en þú berð saman forskriftir í viðskiptatillögum er AFHVERJU? Af hverju þarf þetta geymslukerfi?

Hvernig á að velja geymslu án þess að skjóta sig í fótinn

Svarið verður óvænt, og mjög Tony Robbins stíl - að geyma gögn. Þakka þér fyrir, skipstjóri! Og samt, stundum erum við svo djúpt í því að bera saman smáatriði að við gleymum hvers vegna við erum að gera allt þetta í fyrsta lagi.

Svo, verkefni gagnageymslukerfis er að geyma og veita aðgang að DATA með tiltekinni frammistöðu. Við byrjum á gögnum.

Gögn

Gagnategund

Hvers konar gögn ætlum við að geyma? Mjög mikilvæg spurning sem getur útrýmt mörgum geymslukerfum frá jafnvel íhugun. Til dæmis ætlarðu að geyma myndbönd og myndir. Þú getur strax strikað út kerfi sem eru hönnuð fyrir handahófskenndan aðgang í litlum blokkum, eða kerfi með séreiginleika í þjöppun / aftvíföldun. Þetta geta einfaldlega verið frábær kerfi, við viljum ekki segja neitt slæmt. En í þessu tilviki verða styrkleikar þeirra annað hvort veikir (myndband og myndir eru ekki þjappaðar) eða einfaldlega auka verulega kostnað kerfisins.

Aftur á móti, ef fyrirhuguð notkun er upptekið viðskiptakerfi DBMS, þá verða framúrskarandi margmiðlunarstraumkerfi sem geta skilað gígabætum á sekúndu lélegur kostur.

Gagnamagn

Hversu mikið af gögnum ætlum við að geyma? Magn þróast alltaf í gæði; þessu má aldrei gleyma, sérstaklega á tímum okkar þar sem gagnamagn stækkar veldishraða. Petabæta-flokkakerfi eru ekki lengur óalgeng, en því stærri sem petabætagetan er, því sértækara sem kerfið verður, því minna aðgengilegt verður venjuleg virkni lítilla og meðalstórra handahófskenndra aðgangskerfa. Það er léttvægt vegna þess að blokkaðgangstölfræðitöflurnar einar og sér verða stærri en tiltækt magn af vinnsluminni á stýringum. Svo ekki sé minnst á þjöppun/stigaskiptingu. Segjum að við viljum skipta þjöppunaralgríminu yfir í öflugra og þjappa 20 petabætum af gögnum. Hversu langan tíma mun það taka: sex mánuðir, ár?

Á hinn bóginn, hvers vegna að nenna því ef þú þarft að geyma og vinna úr 500 GB af gögnum? Aðeins 500. SSD diskar til heimilisnota (með lágu DWPD) af þessari stærð kosta ekkert. Af hverju að byggja Fibre Channel verksmiðju og kaupa hágæða ytri geymslukerfi sem kosta jafnvirði steypujárnsbrúar?

Hversu hátt hlutfall af heildinni eru heit gögn? Hversu ójafnt er álagið miðað við gagnamagn? Þetta er þar sem þrepaskipt geymslutækni eða Flash Cache getur verið mjög gagnlegt ef magn heitra gagna er lítið miðað við heildina. Eða öfugt, með samræmdu álagi um allt magnið, sem oft er að finna í streymiskerfum (myndbandseftirlit, sum greiningarkerfi), mun slík tækni ekki veita neitt og mun aðeins auka kostnað/flókið kerfisins.

ИС

Hin hliðin á gögnunum er upplýsingakerfið sem notar gögnin. IS hefur sett af kröfum sem erfa gögn. Nánari upplýsingar um IS er að finna í „Virtualized Data Center Design“.

Seiglu/framboðskröfur

Kröfur um bilunarþol / gagnaframboð eru erft frá IS sem notar þær og eru gefnar upp í þremur tölustöfum - RPO, RTO, framboð.

Framboð — hlutdeild fyrir tiltekið tímabil sem gögn eru tiltæk til að vinna með þeim. Venjulega gefið upp sem talan 9. Til dæmis þýðir tvær níur á ári að framboð er 99%, eða annars eru 95 klukkustundir af ótilboði á ári leyfðar. Þrjár níur - 9,5 klukkustundir á ári.

RPO / RTO eru ekki heildarvísar, heldur fyrir hvert atvik (slys), öfugt við framboð.

RPO — magn gagna sem tapast við slys (í klukkustundum). Til dæmis, ef afrit eiga sér stað einu sinni á dag, þá er RPO = 24 klst. Þeir. Ef hörmung verður og algjörlega tap á geymslukerfinu geta gögn tapast í allt að 24 klukkustundir (frá því að öryggisafritið er tekið). Byggt á RPO sem tilgreint er fyrir IS, til dæmis, eru öryggisreglur skrifaðar. Einnig, byggt á RPO, geturðu skilið hversu mikið þarf samstillt/ósamstillt gagnaafritun.

RTO — tími til að endurheimta þjónustu (gagnaaðgang) eftir hamfarir. Byggt á uppgefnu RTO gildi getum við skilið hvort þörf er á Metro þyrping, eða hvort einátta afritun sé nægjanleg. Þarftu hágæða geymslukerfi fyrir fjölstýringu?

Hvernig á að velja geymslu án þess að skjóta sig í fótinn

Frammistöðukröfur

Þó að þetta sé mjög augljós spurning, þá er það þar sem erfiðleikarnir koma upp. Það fer eftir því hvort þú ert nú þegar með einhvers konar innviði eða ekki, leiðir til að safna nauðsynlegri tölfræði verða byggðar upp.

Þú ert nú þegar með geymslukerfi og ert að leita að staðgengill eða vilt kaupa annað til stækkunar. Hér er allt einfalt. Þú skilur hvaða þjónustu þú hefur nú þegar og hverja þú ætlar að innleiða í náinni framtíð. Byggt á núverandi þjónustu hefur þú tækifæri til að safna frammistöðutölfræði. Ákveðið núverandi fjölda IOPS og núverandi leynd - hverjir eru þessir vísbendingar og duga þeir fyrir verkefnin þín? Þetta er hægt að gera bæði á gagnageymslukerfinu sjálfu og frá hýslum sem eru tengdir því.

Þar að auki þarftu að líta ekki bara á núverandi álag heldur yfir ákveðið tímabil (helst mánuð). Sjáðu hverjir eru hámarkstoppar yfir daginn, hvaða álag afritið skapar o.s.frv. Ef geymslukerfið þitt eða hugbúnaður þess veitir þér ekki heildarsett af þessum gögnum geturðu notað ókeypis RRDtool, sem getur unnið með flestum vinsælustu geymslukerfum og rofum og getur veitt þér nákvæma tölfræði um frammistöðu. Það er líka þess virði að skoða álagið á vélunum sem vinna með þessu geymslukerfi, fyrir tilteknar sýndarvélar, eða hvað nákvæmlega er í gangi á þessum hýsil.

Hvernig á að velja geymslu án þess að skjóta sig í fótinn

Það er athyglisvert sérstaklega að ef tafir á hljóðstyrknum og gagnageymslunni sem er staðsett á þessu bindi eru mjög mismunandi, ættir þú að fylgjast með SAN netkerfinu þínu, það eru miklar líkur á að það séu vandamál með það og áður en þú kaupir nýtt kerfi, það er þess virði að skoða þetta mál, vegna þess að það eru mjög miklar líkur á að auka afköst núverandi kerfis.

Þú ert að byggja upp innviði frá grunni, eða kaupa kerfi fyrir einhverja nýja þjónustu, sem þú ert ekki meðvitaður um. Það eru nokkrir möguleikar: hafðu samband við samstarfsmenn um sérhæfð úrræði til að reyna að finna út og spá fyrir um álagið, hafðu samband við samþættingaraðila sem hefur reynslu af innleiðingu svipaðrar þjónustu og getur reiknað út álagið fyrir þig. Og þriðji kosturinn (venjulega erfiðastur, sérstaklega ef það varðar heimaskrifuð eða sjaldgæf forrit) er að reyna að komast að frammistöðukröfum frá kerfisframleiðendum.

Og, vinsamlegast athugið, réttasti kosturinn frá sjónarhóli hagnýtrar notkunar er tilraunaverkefni á núverandi búnaði, eða búnaður sem seljandi/samþættari gefur til að prófa.

Sérkröfur

Sérkröfur eru allt sem fellur ekki undir kröfur um frammistöðu, bilanaþol og virkni fyrir beina vinnslu og afhendingu gagna.

Ein af einföldustu sérkröfunum fyrir gagnageymslukerfi er hægt að kalla „fjarlægan geymslumiðil. Og það verður strax ljóst að þetta gagnageymslukerfi verður að innihalda segulbandasafn eða einfaldlega segulbandsdrif sem öryggisafritinu er varpað á. Að því loknu áritar sérþjálfaður einstaklingur límbandið og ber það stoltur í sérstakan öryggisskáp.
Annað dæmi um sérstaka kröfu er varin höggheld hönnun.

Hvar

Annar aðalþátturinn við val á tilteknu geymslukerfi er upplýsingar um HVAR þetta geymslukerfi verður staðsett. Byrjað er á landafræði eða veðurfari og endar með starfsfólki.

Viðskiptavinur

Fyrir hvern er þetta geymslukerfi fyrirhugað? Spurningin hefur eftirfarandi ástæður:

Ríkisviðskiptavinur/auglýsing.
Viðskiptavinurinn hefur engar takmarkanir og er ekki einu sinni skyldugur til að halda útboð, nema í samræmi við eigin innri reglur.

Öðru máli gegnir um ríkisviðskiptavin. 44 Alríkislög og önnur gleði með tilboðum og tækniforskriftum sem hægt er að mótmæla.

Viðskiptavinurinn er undir viðurlögum
Jæja, spurningin hér er mjög einföld - valið takmarkast aðeins af tilboðum sem eru í boði fyrir tiltekinn viðskiptavin.

Heimilt er að kaupa innri reglur / söluaðilar / gerðir
Spurningin er líka afskaplega einföld, en þú þarft að muna hana.

Hvar líkamlega

Í þessum hluta skoðum við öll mál varðandi landafræði, boðleiðir og örloftslag í gistirýminu.

starfsfólk

Hver mun vinna með þetta geymslukerfi? Þetta er ekki síður mikilvægt en það sem geymslukerfið sjálft getur gert.
Sama hversu efnilegt, flott og dásamlegt geymslukerfið frá seljanda A er, þá er sennilega lítill tilgangur að setja það upp ef starfsfólkið kann bara að vinna með seljanda B og engin áform eru um frekari kaup og áframhaldandi samstarf við A.

Og auðvitað er hin hliðin á spurningunni hversu tiltækt þjálfað starfsfólk er á tilteknum landfræðilegum stað beint í fyrirtækinu og hugsanlega á vinnumarkaði. Fyrir svæði getur það verið mjög skynsamlegt að velja geymslukerfi með einföldum viðmótum eða getu til að miðstýra fjarstýringu. Annars getur það á einhverjum tímapunkti orðið óskaplega sársaukafullt. Netið er fullt af sögum um hvernig nýr starfsmaður sem kom, nemandi gærdagsins, stillti þannig upp að öll skrifstofan eyðilagðist.

Hvernig á að velja geymslu án þess að skjóta sig í fótinn

Umhverfið

Og auðvitað er mikilvæg spurning í hvaða umhverfi þetta geymslukerfi mun starfa.

  • Hvað með aflgjafa/kælingu?
  • Hvaða tenging
  • Hvar verður það sett upp?
  • O.s.frv.

Oft eru þessar spurningar sjálfsagðar og ekki sérstaklega ígrundaðar, en stundum eru þær þær sem geta snúið öllu við.

Það

Seljandi

Frá og með deginum í dag (miðjan 2019) má skipta rússneska geymslumarkaðinum í 5 flokka:

  1. Hæsta deildin eru rótgróin fyrirtæki með fjölbreytt úrval af diskahillum frá einföldustu til háþróaðra (HPE, DellEMC, Hitachi, NetApp, IBM / Lenovo)
  2. Önnur deild - fyrirtæki með takmarkaða línu, sess leikmenn, alvarlegir SDS söluaðilar eða vaxandi nýliðar (Fujitsu, Datacore, Infinidat, Huawei, Pure, osfrv.)
  3. Þriðja deild - sesslausnir í lágflokki, ódýr SDS, háþróaðar vörur byggðar á ceph og öðrum opnum verkefnum (Infortrend, Starwind, osfrv.)
  4. SOHO hluti - lítil og ofurlítil geymslukerfi á heimili/litlu skrifstofustigi (Synology, QNAP, osfrv.)
  5. Innflutningsskipt geymslukerfi - þetta felur í sér bæði vélbúnað í fyrstu deild með endurmerktum merkimiðum og sjaldgæfa fulltrúa þeirrar (RAIDIX, við gefum þeim þá seinni fyrirfram), en aðallega er þetta þriðja deildin (Aerodisk, Baum, Depo, osfrv.)

Skiptingin er alveg handahófskennd og þýðir alls ekki að þriðji hluti eða SOHO hluti sé slæmur og ekki hægt að nota. Í tilteknum verkefnum með skýrt skilgreint gagnasafn og álagssnið geta þau virkað mjög vel, langt umfram fyrstu deild hvað varðar verð/gæðahlutfall. Það er mikilvægt að ákveða fyrst markmið þín, vaxtarhorfur og nauðsynlega virkni - og þá mun Synology þjóna þér af trúmennsku og hárið þitt verður mjúkt og silkimjúkt.

Einn af mikilvægustu þáttunum þegar þú velur söluaðila er núverandi umhverfi. Hversu mörg geymslukerfi þú hefur nú þegar og hvaða geymslukerfi verkfræðingar þínir geta unnið með. Þarftu annan söluaðila, annan tengilið, muntu smám saman flytja allt álagið frá seljanda A til seljanda B?

Maður ætti ekki að framleiða einingar umfram það sem nauðsynlegt er.

iSCSI/FC/Skrá

Engin samstaða er meðal verkfræðinga um aðgangsreglur og umræðan líkist frekar guðfræðilegri umræðu en verkfræði. En almennt má benda á eftirfarandi atriði:

FCoE meira dauður en lifandi.

FC gegn iSCSI. Einn af helstu kostum FC árið 2019 umfram IP geymslu, sérstakt verksmiðju fyrir gagnaaðgang, er á móti sérstakt IP netkerfi. FC hefur enga alþjóðlega kosti umfram IP net og IP er hægt að nota til að byggja upp geymslukerfi af hvaða álagsstigi sem er, allt að kerfi fyrir þungt DBMS fyrir kjarna bankakerfi stórs banka. Á hinn bóginn hefur dauða FC verið spáð í nokkur ár núna, en eitthvað kemur stöðugt í veg fyrir það. Í dag, til dæmis, eru sumir leikmenn á geymslumarkaði virkir að þróa NVMEoF staðalinn. Hvort hann muni deila örlögum FCoE - tíminn mun leiða í ljós.

Aðgangur að skrám er heldur ekki eitthvað óverðugt athygli. NFS/CIFS skilar sér vel í framleiðniumhverfi og, ef hann er rétt hannað, hefur ekki fleiri kvartanir en blokkarsamskiptareglur.

Hybrid / All Flash Array

Klassísk geymslukerfi koma í 2 gerðum:

  1. AFA (All Flash Array) - kerfi fínstillt fyrir SSD notkun.
  2. Hybrid - gerir þér kleift að nota bæði HDD og SSD eða blöndu af þeim.

Helsti munurinn þeirra er studd geymslunýtnitækni og hámarks afköst (mikil IOPS og lítil leynd). Bæði kerfin (í flestum gerðum þeirra, að lágmarkshlutanum er ekki talið með) geta starfað bæði sem blokk- og skráartæki. Virkni sem studd er fer eftir stigi kerfisins og fyrir yngri gerðir er hún oftast lækkuð í lágmarksstig. Þetta er þess virði að borga eftirtekt til þegar þú ert að rannsaka eiginleika tiltekins líkans, en ekki bara getu allrar línunnar í heild. Einnig eru tæknilegir eiginleikar þess, eins og örgjörvi, minnismagn, skyndiminni, fjöldi og gerðir tengi o.s.frv., einnig háð stigi kerfisins. Frá sjónarhóli stjórnunar eru AFA aðeins frábrugðnir blendingum (diskur) kerfum í útfærslu aðferða til að vinna með SSD drif, og jafnvel þó þú notir SSD í blendingskerfi þýðir þetta alls ekki að þú getir til að ná frammistöðustigi á stigi AFA kerfis. Einnig, í flestum tilfellum, eru skilvirkar innbyggðar geymsluaðferðir óvirkar á tvinnkerfum og innlimun þeirra leiðir til taps á afköstum.

Sérstök geymslukerfi

Auk almennra geymslukerfa, sem einbeita sér fyrst og fremst að rekstrargagnavinnslu, eru sérstök geymslukerfi með lykilreglur sem eru í grundvallaratriðum frábrugðin þeim venjulegu (lág leynd, mikil IOPS):

Fjölmiðlar.

Þessi kerfi eru hönnuð til að geyma og vinna úr stórum miðlunarskrám. Viðskrh. seinkunin verður nánast óveruleg og hæfileikinn til að senda og taka á móti gögnum á breiðu bandi í mörgum samhliða straumum kemur til sögunnar.

Afrita geymslukerfi fyrir afrit.

Þar sem öryggisafrit eru aðgreind með líkindi sín á milli, sem er sjaldgæft við venjulegar aðstæður (meðalafritið er frábrugðið afritinu í gær um 1-2%), þá pakkar þessi flokkur kerfa gögnunum sem skráð eru á þau á afar skilvirkan hátt í tiltölulega litlu fjölda efnislegra miðla. Til dæmis, í sumum tilfellum, geta gagnaþjöppunarhlutföll náð 200 til 1.

Hlutageymslukerfi.

Þessi geymslukerfi eru ekki með hefðbundið bindi og skráarhluti, og mest af öllu líkjast þau risastórum gagnagrunni. Aðgangur að hlut sem geymdur er í slíku kerfi fer fram með einkvæmu auðkenni eða með lýsigögnum (til dæmis allir hlutir á JPEG sniði með stofnunardagsetningu á milli XX-XX-XXXX og YY-YY-YYYY).

Fylgnikerfi.

Þeir eru ekki svo algengir í Rússlandi í dag, en þeir eru þess virði að minnast á. Tilgangur slíkra geymslukerfa er tryggð gagnageymslu til að uppfylla öryggisstefnur eða reglugerðarkröfur. Sum kerfi (til dæmis EMC Centera) hafa innleitt aðgerð til að banna eyðingu gagna - um leið og lyklinum er snúið og kerfið fer í þennan ham getur hvorki stjórnandinn né nokkur annar líkamlega eytt gögnum sem þegar hafa verið skráð.

Sértækni

Flash skyndiminni

Flash Cache er algengt heiti á allri sértækni til að nota flassminni sem annars stigs skyndiminni. Þegar flash skyndiminni er notað er geymslukerfið venjulega reiknað út til að veita stöðugt álag frá seguldiskum, á meðan toppurinn er þjónað af skyndiminni.

Í þessu tilviki er nauðsynlegt að skilja hleðslusniðið og hversu staðbundin aðgangur að geymslumöppum er. Flash skyndiminni er tækni fyrir vinnuálag með mjög staðfærðum fyrirspurnum og er nánast óviðeigandi fyrir jafnt hlaðið magn (eins og fyrir greiningarkerfi).

Það eru tvær útfærslur á flash skyndiminni í boði á markaðnum:

  • Lesið aðeins. Í þessu tilviki eru aðeins lesgögn í skyndiminni og skrif fara beint á diskana. Sumir framleiðendur, eins og NetApp, telja að ritun í geymslukerfi þeirra sé nú þegar ákjósanleg og skyndiminni mun alls ekki hjálpa.
  • Lesa skrifa. Ekki aðeins lestur, heldur einnig ritun er í skyndiminni, sem gerir þér kleift að biðjast fyrir straumnum og draga úr áhrifum RAID Penalty, og þar af leiðandi auka heildarafköst fyrir geymslukerfi með minna ákjósanlegri skrifkerfi.

Niðurstöður

Fjölþrepa geymsla (þreytandi) er tækni til að sameina stig með mismunandi afköstum, eins og SSD og HDD, í einn diskapott. Ef um er að ræða áberandi ójafnvægi í aðgangi að gagnablokkum mun kerfið geta sjálfkrafa jafnvægi gagnablokka, fært hlaðna á afkastamikið stigi og kalt, þvert á móti, í hægara.

Hybrid kerfi lægri og millistéttar nota fjölþrepa geymslu með gögnum sem flytjast á milli stiga samkvæmt áætlun. Á sama tíma er stærð fjölþrepa geymslublokkarinnar fyrir bestu gerðirnar 256 MB. Þessir eiginleikar leyfa okkur ekki að líta svo á að geymslutækni í flokki sé tækni til að auka framleiðni, eins og margir telja ranglega. Fjölþrepa geymsla í lág- og millistéttarkerfum er tækni til að hámarka geymslukostnað fyrir kerfi með áberandi ójafnvægi á álagi.

Snapshot

Sama hversu mikið við tölum um áreiðanleika geymslukerfa, þá eru mörg tækifæri til að tapa gögnum sem eru ekki háð vélbúnaðarvandamálum. Þetta gæti verið vírusar, tölvuþrjótar eða önnur óviljandi eyðing/spilling gagna. Af þessum sökum er öryggisafrit af framleiðslugögnum óaðskiljanlegur hluti af starfi verkfræðings.

Skyndimynd er skyndimynd af bindi á einhverjum tímapunkti. Þegar unnið er með flest kerfi, svo sem sýndarvæðingu, gagnagrunna o.s.frv. við þurfum að taka slíka skyndimynd þar sem við munum afrita gögnin í öryggisafrit, en IS okkar mun örugglega geta haldið áfram að vinna með þetta bindi. En það er þess virði að muna að ekki eru allar skyndimyndir jafn gagnlegar. Mismunandi söluaðilar hafa mismunandi aðferðir við að búa til skyndimyndir sem tengjast arkitektúr þeirra.

CoW (Copy-On-Write). Þegar þú reynir að skrifa gagnablokk er upprunalega innihald hans afritað á sérstakt svæði, eftir það heldur ritunin eðlilega áfram. Þetta kemur í veg fyrir gagnaspillingu inni í skyndimyndinni. Auðvitað valda allar þessar „sníkjudýra“ gagnasnúningur auknu álagi á geymslukerfið og af þessum sökum mæla söluaðilar með svipaðar útfærslur ekki með því að nota meira en tugi skyndimynda og alls ekki nota þær á mikið hlaðið magn.

RoW (Redirect-on-Write). Í þessu tilviki frýs upprunalega bindið náttúrulega og þegar reynt er að skrifa gagnablokk skrifar geymslukerfið gögn á sérstakt svæði í lausu plássi og breytir staðsetningu þessarar blokkar í lýsigagnatöflunni. Þetta gerir þér kleift að fækka umritunaraðgerðum, sem á endanum útilokar lækkun á frammistöðu og fjarlægir takmarkanir á skyndimyndum og fjölda þeirra.

Skyndimyndir eru einnig tvenns konar í tengslum við forrit:

Samræmi í umsókn. Á því augnabliki sem skyndimynd er búin til, dregur geymslukerfið til sín umboðsmann í stýrikerfi neytenda, sem tæmir diskageymslur með valdi úr minni yfir á disk og neyðir forritið til að gera þetta. Í þessu tilviki, þegar endurheimt er úr skyndimynd, verða gögnin í samræmi.

Hrun í samræmi. Í þessu tilviki gerist ekkert slíkt og skyndimyndin er búin til eins og hún er. Ef um er að ræða endurheimt frá slíkri skyndimynd er myndin eins og myndi gerast ef rafmagnið væri skyndilega slökkt og eitthvað tap á gögnum er mögulegt, föst í skyndiminni og ná aldrei disknum. Slíkar skyndimyndir eru auðveldari í framkvæmd og valda ekki skerðingu á frammistöðu í forritum, en eru síður áreiðanlegar.

Hvers vegna þarf skyndimyndir á geymslukerfi?

  • Umboðslaus öryggisafrit beint úr geymslukerfinu
  • Búðu til prófunarumhverfi byggt á raunverulegum gögnum
  • Þegar um er að ræða skráageymslukerfi er hægt að nota það til að búa til VDI umhverfi með því að nota skyndimyndir af geymslukerfi í stað yfirsýnar
  • Tryggðu lágt RPO með því að búa til tímasettar skyndimyndir á tíðni sem er verulega hærri en öryggisafritunartíðnin

Cloning

Rúmmálsklónun - virkar á svipaðan hátt og skyndimyndir, en er ekki bara notað til að lesa gögn heldur til að vinna með þau að fullu. Við getum fengið nákvæma afrit af bindi okkar, með öllum gögnum á því, án þess að gera líkamlegt afrit, sem sparar pláss. Venjulega er hljóðstyrksklónun notuð annað hvort í Test&Dev eða ef þú vilt athuga virkni sumra uppfærslur á IS þínum. Klónun mun leyfa þér að gera þetta eins fljótt og hagkvæmt og mögulegt er hvað varðar diskaauðlindir, vegna þess Aðeins breyttar gagnablokkir verða skrifaðar.

Afritun / Dagbókun

Afritun er vélbúnaður til að búa til afrit af gögnum á öðru líkamlegu geymslukerfi. Venjulega hefur hver söluaðili sértækni sem virkar aðeins innan eigin línu. En það eru líka til lausnir frá þriðja aðila, þar á meðal þær sem virka á hypervisor stigi, eins og VMware vSphere Replication.

Virkni sértækninnar og auðveld notkun þeirra er yfirleitt miklu betri en alhliða, en hún reynist óviðeigandi þegar til dæmis þarf að gera eftirlíkingu frá NetApp til HP MSA.

Afritun er skipt í tvær undirgerðir:

Samstilltur. Ef um samstillta afritun er að ræða er skrifaðgerðin send strax í annað geymslukerfið og framkvæmdin er ekki staðfest fyrr en fjargeymslukerfið hefur staðfest. Af þessum sökum eykst aðgangstöf, en við erum með nákvæma spegilmynd af gögnunum. Þeir. RPO = 0 ef aðalgeymslukerfi tapast.

ósamstilltur. Skrifunaraðgerðir eru aðeins framkvæmdar á aðalgeymslukerfinu og eru staðfestar strax, á sama tíma og þær safnast saman í biðminni fyrir lotusendingar til fjargeymslukerfisins. Þessi tegund af afritun er viðeigandi fyrir minna verðmæt gögn, eða fyrir rásir með litla bandbreidd eða mikla leynd (dæmigert fyrir vegalengdir yfir 100 km). Í samræmi við það, RPO = pakkasendingartíðni.

Oft, ásamt afritun, er vélbúnaður skógarhögg diskaaðgerðir. Í þessu tilviki er sérstakt svæði úthlutað fyrir skógarhögg og skráningaraðgerðir af ákveðnu dýpi í tíma, eða takmarkað af rúmmáli logsins, eru geymdar. Fyrir ákveðna sértækni, eins og EMC RecoverPoint, er samþætting við kerfishugbúnað sem gerir þér kleift að tengja ákveðin bókamerki við ákveðna annálsfærslu. Þökk sé þessu er hægt að snúa til baka ástand bindis (eða búa til klón) ekki bara í 23. apríl, 11 klukkustundir 59 sekúndur og 13 millisekúndur, heldur til augnabliksins á undan „DROP ALL TABLES; SKOÐA."

Metro þyrping

Metro cluster er tækni sem gerir þér kleift að búa til tvíátta samstillta afritun milli tveggja geymslukerfa á þann hátt að utan frá lítur þetta par út eins og eitt geymslukerfi. Það er notað til að búa til þyrpingar með landfræðilega aðskilda arma í neðanjarðarlest (minna en 100 km).

Byggt á dæmi um notkun í sýndarvæðingarumhverfi, gerir Metrocluster þér kleift að búa til gagnageymslu með sýndarvélum, aðgengilegar til upptöku frá tveimur gagnaverum í einu. Í þessu tilviki er þyrping búin til á hypervisor stigi, sem samanstendur af vélum í mismunandi líkamlegum gagnaverum, tengdum þessari gagnageymslu. Sem gerir þér kleift að gera eftirfarandi:

  • Full sjálfvirkni í bataferlinu eftir dauða eins gagnaveranna. Án viðbótarfjármuna verða allir VMs sem keyra í látna gagnaverinu sjálfkrafa endurræstir í þeirri sem eftir er. RTO = hár framboð cluster timeout (15 sekúndur fyrir VMware) + tími til að hlaða stýrikerfinu og hefja þjónustu.
  • Forðast hamfarir eða, á rússnesku, forðast hamfarir. Ef aflgjafavinna er fyrirhuguð í gagnaveri 1, þá höfum við tækifæri til að flytja allt mikilvæga álagið í gagnaver 2 stanslaust fyrirfram, áður en vinnan hefst.

Sýndarvæðing

Sýndarvæðing geymslu er tæknilega séð að nota bindi frá öðru geymslukerfi sem diska. Geymsluvirtarari getur einfaldlega flutt hljóðstyrk einhvers annars til neytenda sem sitt eigið, speglað það samtímis í annað geymslukerfi, eða jafnvel búið til RAID úr utanaðkomandi bindi.
Klassískir fulltrúar í sýndarvæðingarflokki geymslu eru EMC VPLEX og IBM SVC. Og auðvitað geymslukerfi með sýndarvæðingarvirkni - NetApp, Hitachi, IBM / Lenovo Storwize.

Hvers vegna gæti verið þörf á því?

  • Offramboð á geymslukerfisstigi. Spegill er búinn til á milli bindanna og annar helmingurinn getur verið á HP 3Par og hinn á NetApp. Og virtualizer er frá EMC.
  • Færðu gögn með lágmarks niður í miðbæ milli geymslukerfa frá mismunandi framleiðendum. Gerum ráð fyrir að flytja þurfi gögn úr gamla 3Par, sem verður afskrifað, yfir í nýja Dell. Í þessu tilviki eru neytendur aftengdir 3Par, magnið er flutt undir VPLEX og kynnt neytendum aftur. Þar sem lítið hefur breyst á hljóðstyrknum heldur vinnan áfram. Ferlið við að spegla hljóðstyrkinn í nýja Dell byrjar í bakgrunni og þegar því er lokið er spegillinn bilaður og 3Par óvirkt.
  • Skipulag stórþyrpinga.

Þjöppun/afþjöppun

Þjöppun og deduplication er tækni sem gerir þér kleift að spara pláss á geymslukerfinu þínu. Það er rétt að minnast strax á að ekki eru öll gögn háð þjöppun og/eða aftvíföldun í grundvallaratriðum, á meðan sumar tegundir gagna eru þjappaðar og aftvífölduð betur, og önnur - öfugt.

Það eru 2 gerðir af þjöppun og deduplication:

Í línu — þjöppun og aftvíföldun gagnablokka á sér stað áður en þessi gögn eru skrifuð á diskinn. Þannig reiknar kerfið aðeins kjötkássa kubbsins og ber það saman í töflunni við þá sem fyrir eru. Í fyrsta lagi er það hraðari en bara að skrifa á disk og í öðru lagi sóum við ekki auka plássi.

Post - þegar þessar aðgerðir eru gerðar á þegar skráðum gögnum sem eru staðsett á diskum. Í samræmi við það eru gögnin fyrst skrifuð á diskinn og aðeins þá er hassið reiknað út og óþarfa kubbum er eytt og diskaauðlindir losaðar.

Það er þess virði að taka fram að flestir seljendur nota báðar tegundir, sem gerir þeim kleift að hagræða þessum ferlum og auka þar með skilvirkni þeirra. Flestir geymsluframleiðendur eru með tól sem gera þér kleift að greina gagnasöfnin þín. Þessar veitur vinna eftir sömu rökfræði og innleidd er í geymslukerfinu, þannig að áætluð hagkvæmni verður sú sama. Hafðu einnig í huga að margir söluaðilar eru með frammistöðuábyrgðarforrit sem lofa að minnsta kosti jafn góðum árangri fyrir ákveðnar (eða allar) gagnategundir. Og þú ættir ekki að vanrækja þetta forrit, því með því að reikna út kerfið fyrir verkefni þín, að teknu tilliti til skilvirknistuðuls tiltekins kerfis, geturðu sparað magn. Það er líka þess virði að hafa í huga að þessi forrit eru hönnuð fyrir AFA kerfi, en þökk sé kaupum á minna magni af SSD en HDD í klassískum kerfum mun þetta draga úr kostnaði þeirra, og ef ekki jafn kostnaði við diskakerfi, þá komast nokkuð nálægt því.

Model

Og hér komum við að réttu spurningunni.

„Þeir bjóða mér upp á tvo geymsluvalkosti - ABC SuperStorage S600 og XYZ HyperOcean 666v4, með hverju mælið þið?

Breytist í „Hér bjóða þeir mér tvo geymsluvalkosti - ABC SuperStorage S600 og XYZ HyperOcean 666v4, með hverju mælið þið?

Markálagið er blandaðar VMware sýndarvélar með framleiðslu-/prófunar-/þróunarlykkjum. Próf = afkastamikill. 150 TB hver með hámarksafköstum upp á 80 IOPS 000kb blokk 8% handahófsaðgangur 50/80 lestur-skrifa. 20 TB fyrir þróun, 300 IOPS er nóg, 50 af handahófi, 000 skrifa.

Framleiðni væntanlega í metróþyrpingunni RPO = 15 mínútur RTO = 1 klukkustund, þróun í ósamstilltri afritun RPO = 3 klukkustundir, próf á einum stað.

Það verður 50TB DBMS, skógarhögg væri gott fyrir þá.

Við erum með Dell netþjóna alls staðar, gömul Hitachi geymslukerfi, þau ráða varla við, við ætlum að auka álagið um 50% hvað varðar magn og afköst.“

Eins og þeir segja, inniheldur rétt útfærð spurning 80% af svarinu.

viðbótarupplýsingar

Það sem þú ættir að lesa til viðbótar samkvæmt höfundum

Книги

  • Olifer og Olifer „Tölvukerfi“. Bókin mun hjálpa til við að skipuleggja og kannski skilja betur hvernig gagnaflutningsmiðill fyrir IP / Ethernet geymslukerfi virkar
  • "EMC upplýsingageymsla og stjórnun." Frábær bók um grunnatriði geymslukerfa, hvers vegna, hvernig og hvers vegna.

Málþing og spjall

Almennar tillögur

Verð

Nú, eins og fyrir verð - almennt, ef það eru verð fyrir geymslukerfi, eru þau venjulega Listaverð, sem hver viðskiptavinur fær einstaklingsafslátt af. Stærð afsláttarins samanstendur af miklum fjölda breytum, svo það er einfaldlega ómögulegt að spá fyrir um hvaða lokaverð fyrirtæki þitt mun fá án þess að spyrja dreifingaraðilann. En á sama tíma hafa nýlega lágar módel farið að birtast í venjulegum tölvuverslunum eins og t.d. nix.ru eða xcom-shop.ru. Hér getur þú strax keypt kerfið sem þú hefur áhuga á á föstu verði, eins og hvaða tölvuíhluti sem er.

En ég vil taka það strax fram að beinn samanburður með TB/$ er ekki réttur. Ef við nálgumst það frá þessu sjónarhorni, þá verður ódýrasta lausnin einfaldur JBOD + netþjónn, sem mun hvorki veita þann sveigjanleika né áreiðanleika sem fullbúið geymslukerfi með tvístýringu veitir. Þetta þýðir alls ekki að JBOD sé ógeðslegt og viðbjóðslegt óhreint bragð, þú þarft bara aftur að skilja mjög greinilega hvernig og í hvaða tilgangi þú munt nota þessa lausn. Oft heyrist að það sé ekkert að brjóta í JBOD, það er bara ein bakplan. Hins vegar bila bakplan líka stundum. Allt brotnar fyrr eða síðar.

Alls

Það er nauðsynlegt að bera saman kerfi sín á milli, ekki aðeins eftir verði, eða ekki aðeins eftir frammistöðu, heldur eftir heildarvísum.

Kauptu HDD aðeins ef þú ert viss um að þú þurfir HDD. Fyrir lítið álag og óþjappaðar gagnategundir, annars er þess virði að snúa sér að SSD geymsluábyrgðarábyrgðarforritum, sem flestir söluaðilar hafa núna (og þeir virka í raun, jafnvel í Rússlandi), en það veltur allt á forritunum og gögnunum sem verða staðsett. á þessu geymslukerfi.

Ekki fara í ódýrt. Stundum fela þetta mikið af óþægilegum augnablikum, einni sem Evgeniy Elizarov lýsti í greinum sínum um Infortrend. Og að, á endanum, getur þessi ódýrleiki komið í bakið á þér. Ekki gleyma - "geggjaður borgar tvisvar."

Heimild: www.habr.com

Bæta við athugasemd