Hoe kinne jo opslach kieze sûnder josels yn 'e foet te sjitten

Ynlieding

It is tiid om opslach te keapjen. Hokker te nimmen, nei wa te harkjen? Ferkeaper A hat it oer ferkeaper B, en dan is der yntegrator C, dy't it tsjinoerstelde fertelt en ferkeaper D advisearret. Yn sa'n situaasje sil sels in betûfte opslacharsjitekt de holle draaie, benammen mei alle nije ferkeapers en SDS en hyperkonverginsje dy't moade binne hjoed.

Dus, hoe kinne jo it allegear útfine en net einigje as in gek? wy (AntonVirtual Anton Zhbankov en corp Evgeniy Elizarov) litte wy besykje oer dit yn gewoan Russysk te praten.
It artikel hat in protte oerienkomsten en is eins in útwreiding fan "Virtualisearre datacenterûntwerp” yn termen fan it kiezen fan opslachsystemen en it besjen fan opslachtechnologyen. Wy sille koart sjen nei de algemiene teory, mar wy riede oan dat jo ek lêze dit artikel.

Wat foar

Jo kinne faaks in situaasje sjen wêr't in nije persoan nei in foarum of in spesjalisearre petear komt, lykas Storage Discussions, en stelt de fraach: "hjir biede se my twa opslachopsjes - ABC SuperStorage S600 en XYZ HyperOcean 666v4, wat advisearje jo ?"

En de betizing begjint oer wa hat hokker skaaimerken fan 'e útfiering fan' e skriklike en ûnbegryplike funksjes, dy't foar in net taret persoan folslein Sineesk binne.

Dat, de kaai en de alderearste fraach dy't jo josels lang moatte stelle foardat jo spesifikaasjes fergelykje yn kommersjele útstellen is WAAROM? Wêrom is dit opslachsysteem nedich?

Hoe kinne jo opslach kieze sûnder josels yn 'e foet te sjitten

It antwurd sil ûnferwachts wêze, en heul Tony Robbins-styl - om gegevens op te slaan. Tankewol, kaptein! En dochs, soms komme wy sa djip yn it fergelykjen fan details dat wy ferjitte wêrom't wy dit alles op it earste plak dogge.

Dat, de taak fan in gegevensopslachsysteem is om DATA op te slaan en tagong te jaan ta in bepaalde prestaasje. Wy sille begjinne mei gegevens.

data

Soart data

Hokker soarte fan gegevens wolle wy opslaan? In heul wichtige fraach dy't in protte opslachsystemen kin eliminearje fan sels konsideraasje. Jo binne bygelyks fan plan om fideo's en foto's op te slaan. Jo kinne systemen fuortendaliks trochstreare foar willekeurige tagong yn lytse blokken, as systemen mei proprietêre funksjes yn kompresje / deduplikaasje. Dit kinne gewoan poerbêste systemen wêze, wy wolle neat min sizze. Mar yn dit gefal sille har sterke punten swak wurde (fideo en foto's wurde net komprimearre) of gewoan de kosten fan it systeem signifikant ferheegje.

Oarsom, as it bedoelde gebrûk in drokke transaksje-DBMS is, dan sille poerbêste multimedia-streamingsystemen dy't gigabytes per sekonde leverje kinne in minne kar wêze.

Data folume

Hoefolle gegevens wolle wy opslaan? Kwantiteit ûntwikkelet altyd ta kwaliteit; dit moat nea ferjitten wurde, foaral yn ús tiid fan eksponinsjele groei yn it folume fan gegevens. Petabyte-klasse systemen binne net mear ûngewoan, mar de grutter de petabyte kapasiteit, hoe spesifiker it systeem wurdt, de minder tagonklik de gewoane funksjonaliteit fan lytse en middelgrutte willekeurige tagong systemen sil wêze. It is triviaal omdat de blok tagong statistiken tabellen allinnich wurden grutter as de beskikbere bedrach fan RAM op de controllers. Net te hawwen oer kompresje / tiering. Litte wy sizze dat wy it kompresjealgoritme wolle oerskeakelje nei in machtiger en 20 petabytes oan gegevens komprimearje. Hoe lang sil it duorje: seis moanne, in jier?

Oan 'e oare kant, wêrom lestich falle as jo 500 GB oan gegevens moatte opslaan en ferwurkje? Allinne 500. Household SSDs (mei lege DWPD) fan dizze grutte kostet neat. Wêrom bouwe in Fibre Channel fabryk en keapje hege-ein eksterne opslach systemen dy't kostje it ekwivalint fan in getten izeren brêge?

Hokker persintaazje fan it totaal is hot gegevens? Hoe ûngelyk is de lading yn termen fan gegevensvolumint? Dit is wêr't tiered opslachtechnology as Flash Cache heul nuttich kin wêze as de hoemannichte heule gegevens lyts is yn ferliking mei it totaal. Of oarsom, mei in unifoarme lading troch it heule folume, dy't faak fûn wurdt yn streamingsystemen (fideo-tafersjoch, guon analytyske systemen), sille sokke technologyen neat leverje en sille allinich de kosten / kompleksiteit fan it systeem ferheegje.

IP

De oare kant fan 'e gegevens is it ynformaasjesysteem dat de gegevens brûkt. In IS hat in set fan easken dy't gegevens erven. Foar mear ynformaasje oer de IS, sjoch "Virtualisearre datasintrumûntwerp."

Resiliency / Beskikberens easken

Easken foar fouttolerânsje / beskikberens fan gegevens wurde erfd fan 'e IS dy't se brûke en wurde útdrukt yn trije sifers - RPO, OTR, beskikberens.

Fergees - it oandiel foar in bepaalde perioade wêryn't gegevens beskikber binne om mei har te wurkjen. Meastentiids útdrukt as in oantal 9. Bygelyks, twa njoggen yn 't jier betsjut dat de beskikberens is 99%, of oars 95 oeren fan net beskikber yn it jier binne tastien. Trije njoggen - 9,5 oeren yn 't jier.

RPO / RTO binne gjin totale yndikatoaren, mar foar elk ynsidint (ûngelok), yn tsjinstelling ta beskikberens.

RPO - de hoemannichte gegevens ferlern by in ûngelok (yn oeren). Bygelyks, as backups ien kear deis foarkomme, dan is RPO = 24 oeren. Dy. Yn it gefal fan in ûngelok en folslein ferlies fan it opslachsysteem kinne gegevens oant 24 oeren ferlern gean (fan it momint fan de reservekopy). Op grûn fan de foar de IS spesifisearre RPO wurde bygelyks backupregels skreaun. Ek, basearre op RPO, kinne jo begripe hoefolle syngroane / asynchrone gegevensreplikaasje nedich is.

OTR - tiid om tsjinst te herstellen (gegevens tagong) nei in ramp. Op grûn fan de opjûne RTO-wearde kinne wy ​​begripe oft in metrokluster nedich is, of oft unidirectional replikaasje genôch is. Binne jo in hi-end-klasse multi-controller opslachsysteem nedich?

Hoe kinne jo opslach kieze sûnder josels yn 'e foet te sjitten

Prestaasje easken

Hoewol dit in heul dúdlike fraach is, is it wêr't de measte swierrichheden ûntsteane. Ofhinklik fan oft jo al in soarte fan ynfrastruktuer hawwe of net, sille manieren wurde boud om de nedige statistiken te sammeljen.

Jo hawwe al in opslachsysteem en sykje in ferfanger of wolle in oare keapje foar útwreiding. Alles is hjir ienfâldich. Jo begripe hokker tsjinsten jo al hawwe en wat jo fan plan binne yn 'e heine takomst te ymplementearjen. Op grûn fan aktuele tsjinsten hawwe jo de kâns om prestaasjesstatistiken te sammeljen. Beslute oer it aktuele oantal IOPS en aktuele latency - wat binne dizze yndikatoaren en binne se genôch foar jo taken? Dit kin dien wurde sawol op it gegevensopslachsysteem sels as fan 'e hosts dy't dêrmei ferbûn binne.

Boppedat moatte jo net allinich nei de hjoeddeistige lading sjen, mar oer in bepaalde perioade (leafst in moanne). Sjoch wat de maksimale pieken oerdeis binne, hokker lading de reservekopy makket, ensfh. As jo ​​opslachsysteem of har software jo net in folsleine set fan dizze gegevens leveret, kinne jo it fergese RRD-tool brûke, dat kin wurkje mei de measte populêre opslachsystemen en skeakels en kinne jo detaillearre prestaasjesstatistiken leverje. It is ek wurdich te sjen nei de lading op 'e hosts dy't wurkje mei dit opslachsysteem, foar spesifike firtuele masines, of wat krekt op dizze host rint.

Hoe kinne jo opslach kieze sûnder josels yn 'e foet te sjitten

It is de muoite wurdich op te merken dat as de fertragingen op it folume en de datastore dy't op dit folume leit frij signifikant ferskille, moatte jo omtinken jaan oan jo SAN-netwurk, d'r is in hege kâns dat d'r problemen binne en foardat jo in nije keapje systeem, it is de muoite wurdich om nei dit probleem te sjen, om't d'r in heul hege kâns is om de prestaasjes fan it hjoeddeistige systeem te ferheegjen.

Jo bouwe in ynfrastruktuer fanôf it begjin, of keapje in systeem foar wat nije tsjinst, de loads wêrfan jo net bewust binne. D'r binne ferskate opsjes: kommunisearje mei kollega's oer spesjalisearre middels om te besykjen de lading út te finen en te foarsizzen, nim kontakt op mei in yntegrator dy't ûnderfining hat yn it útfieren fan ferlykbere tsjinsten en wa't de lading foar jo kin berekkenje. En de tredde opsje (meastentiids de dreechste, benammen as it giet om thússkreaune of seldsume applikaasjes) is om te besykjen om de prestaasjeseasken út te finen fan de systeemûntwikkelders.

En, asjebleaft, de meast korrekte opsje út it eachpunt fan praktyske tapassing is in pilot op aktuele apparatuer, as apparatuer levere foar testen troch in ferkeaper / yntegrator.

Spesjale easken

Spesjale easken binne alles wat net falt ûnder de easken foar prestaasjes, fouttolerânsje en funksjonaliteit foar de direkte ferwurking en it leverjen fan gegevens.

Ien fan 'e ienfâldichste spesjale easken foar in gegevensopslachsysteem kin "ferfrjemde opslachmedia" wurde neamd. En it wurdt daliks dúdlik dat dit systeem foar gegevensopslach in tapebibleteek moat befetsje of gewoan in tapedrive wêrop de reservekopy wurdt dumpt. Dêrnei tekenet in spesjaal oplaat persoan de tape en fiert it grutsk nei in spesjale feilich.
In oar foarbyld fan in spesjale eask is in beskerme shockproof ûntwerp.

Wêr

De twadde haadkomponint by it kiezen fan in bepaald opslachsysteem is ynformaasje oer Wêr dit opslachsysteem sil lizze. Begjinnend fan geografy of klimatyske omstannichheden, en einigje mei personiel.

Klant

Foar wa is dit opslachsysteem pland? De fraach hat de folgjende redenen:

Government klant / kommersjeel.
De kommersjele klant hat gjin beheiningen en is net iens ferplichte om oanbestegingen te hâlden, útsein yn oerienstimming mei syn eigen ynterne regeljouwing.

In oerheidsklant is in oare saak. 44 Federale wet en oare wille mei oanbestegingen en technyske spesifikaasjes dy't kinne wurde útdage.

De klant is ûnder sanksjes
No, de fraach hjir is heul ienfâldich - de kar wurdt allinich beheind troch de oanbiedingen dy't beskikber binne foar in bepaalde klant.

Ynterne regeljouwing / leveransiers / modellen tastien foar oankeap
De fraach is ek ekstreem ienfâldich, mar jo moatte it ûnthâlde.

Wêr fysyk

Yn dit diel beskôgje wy alle problemen mei geografy, kommunikaasjekanalen en mikroklimaat yn 'e akkommodaasjes.

It personiel

Wa sil wurkje mei dit opslachsysteem? Dit is net minder wichtich as wat it opslachsysteem sels kin dwaan.
Nettsjinsteande hoe kânsryk, cool en prachtich it opslachsysteem fan ferkeaper A is, d'r is wierskynlik net folle nut om it te ynstallearjen as it personiel allinich wit hoe't se mei ferkeaper B wurkje, en der binne gjin plannen foar fierdere oankeapen en trochgeande gearwurking mei A.

En fansels is de oare kant fan 'e fraach hoe beskikber oplaat personiel is op in bepaalde geografyske lokaasje direkt yn it bedriuw en mooglik op 'e arbeidsmerk. Foar regio's kin it kiezen fan opslachsystemen mei ienfâldige ynterfaces of de mooglikheid om behear op ôfstân sintralisearje in soad sin meitsje. Oars, op in stuit kin it wêze excruciatingly pynlik. It ynternet stiet fol mei ferhalen oer hoe't in nije meiwurker dy't oankaam, de studint fan juster, soks konfigurearre dat it hiele kantoar fernield waard.

Hoe kinne jo opslach kieze sûnder josels yn 'e foet te sjitten

Miljeu

En fansels is in wichtige fraach yn hokker omjouwing dit opslachsysteem sil operearje.

  • Hoe sit it mei stroomfoarsjenning / koeling?
  • Wat ferbining
  • Wêr sil it ynstalleare wurde?
  • ensfh.

Faak wurde dizze fragen fanselssprekkend en net spesjaal beskôge, mar soms binne it dejingen dy't alles omkeare kinne.

Wat

Ferkeaper

Fanôf hjoed (midden 2019) kin de Russyske opslachmerk wurde ferdield yn 5 kategoryen:

  1. De heechste divyzje is goed fêstige bedriuwen mei in breed oanbod fan skiifplanken fan it ienfâldichste oant hi-end (HPE, DellEMC, Hitachi, NetApp, IBM / Lenovo)
  2. Twadde divyzje - bedriuwen mei in beheinde line, nichespilers, serieuze SDS-ferkeapers of opkommende nijkommers (Fujitsu, Datacore, Infinidat, Huawei, Pure, ensfh.)
  3. Tredde divyzje - niche-oplossingen yn 'e leechste rang, goedkeap SDS, avansearre produkten basearre op ceph en oare iepen projekten (Infortrend, Starwind, ensfh.)
  4. SOHO-segmint - lytse en ultra-lytse opslachsystemen fan thús / lyts kantoarnivo (Synology, QNAP, ensfh.)
  5. Ymport-substituearre opslachsystemen - dit omfettet sawol hardware fan 'e earste divyzje mei opnij labele labels, as seldsume fertsjintwurdigers fan' e twadde (RAIDIX, wy sille se de twadde yn 't foar jaan), mar benammen dit is de tredde divyzje (Aerodisk, Baum, Depo, ensfh.)

De ferdieling is frij willekeurich, en betsjut hielendal net dat de tredde of SOHO segment is min en kin net brûkt wurde. Yn spesifike projekten mei in dúdlik definiearre dataset en load profyl, se kinne wurkje hiel goed, fier boppe de earste divyzje yn termen fan priis / kwaliteit ferhâlding. It is wichtich om earst te besluten oer jo doelen, groeiperspektyf en fereaske funksjonaliteit - en dan sil Synology jo trou tsjinje, en jo hier sil sêft en zijdeachtig wurde.

Ien fan 'e wichtige faktoaren by it kiezen fan in ferkeaper is de hjoeddeistige omjouwing. Hoefolle opslachsystemen hawwe jo al en mei hokker opslachsystemen jo yngenieurs kinne wurkje. Binne jo in oare ferkeaper nedich, in oar kontaktpunt, sille jo de hiele lading stadichoan migrearje fan ferkeaper A nei ferkeaper B?

Men moat gjin entiteiten produsearje boppe wat nedich is.

iSCSI/FC/Triem

D'r is gjin konsensus ûnder yngenieurs oer de kwestje fan tagongsprotokollen, en it debat liket mear teologyske diskusjes dan op engineering. Mar yn 't algemien kinne de folgjende punten wurde opmurken:

FCoE mear dea as libben.

FC vs iSCSI. Ien fan 'e wichtichste foardielen fan FC yn 2019 boppe IP-opslach, in tawijd fabryk foar tagong ta gegevens, wurdt kompensearre troch in tawijd IP-netwurk. FC hat gjin globale foardielen boppe IP netwurken, en IP kin brûkt wurde om te bouwen opslach systemen fan alle lading nivo, oant systemen foar swiere DBMS foar de kearn banking systeem fan in grutte bank. Oan de oare kant wurdt de dea fan FC al in pear jier profetearre, mar der komt hieltyd wat foar. Hjoed, bygelyks, guon spilers yn de opslach merk aktyf ûntwikkeljen de NVMEoF standert. Oft hy it lot fan FCoE diele sil - de tiid sil leare.

Triem tagong is ek net wat net wurdich omtinken. NFS / CIFS docht goed yn produktiviteit omjouwings en, as ûntwurpen goed, hat net mear klachten as blok protokollen.

Hybride / All Flash Array

Klassike opslachsystemen komme yn 2 soarten:

  1. AFA (All Flash Array) - systemen optimalisearre foar SSD gebrûk.
  2. Hybrid - wêrtroch jo sawol HDD as SSD kinne brûke as in kombinaasje dêrfan.

Har wichtichste ferskil is de stipe technologyen foar opslach effisjinsje en it maksimale nivo fan prestaasjes (hege IOPS en lege latency). Beide systemen (yn 'e measte fan har modellen, it leechste segment net telle) kinne operearje as sawol blok- as bestânapparaten. De stipe funksjonaliteit hinget ôf fan it nivo fan it systeem, en foar jongere modellen wurdt it meastentiids ferlege nei in minimumnivo. Dit is it wurdich omtinken te jaan as jo de skaaimerken fan in bepaald model studearje, en net allinich de mooglikheden fan 'e hiele line as gehiel. Ek, fansels, syn technyske skaaimerken, lykas prosessor, hoemannichte ûnthâld, cache, oantal en soarten fan havens, ensfh Ek hinget ôf fan it nivo fan it systeem. Ut in behear eachpunt, AFAs ferskille fan hybride (skiif) systemen allinnich yn de útfiering fan meganismen foar in wurk mei SSD driuwfearren, en sels as jo brûke in SSD yn in hybride systeem, dit betsjut net hielendal dat jo sille wêze kinne om it nivo fan prestaasjes te berikken op it nivo fan in AFA-systeem. Ek yn 'e measte gefallen binne ynline effisjinte opslachmeganismen útskeakele op hybride systemen, en har opnimmen liedt ta in ferlies yn prestaasjes.

Spesjale opslach systemen

Neist algemiene opslachsystemen, benammen rjochte op operasjonele gegevensferwurking, binne d'r spesjale opslachsystemen mei wichtige prinsipes dy't prinsipieel ferskille fan 'e gewoane (lege latency, hege IOPS):

Media.

Dizze systemen binne ûntworpen foar it opslaan en ferwurkjen fan grutte mediabestannen. Resp. de fertraging wurdt praktysk ûnbelangryk, en de mooglikheid om te ferstjoeren en ûntfange gegevens yn in brede band yn in protte parallelle streamen komt nei foaren.

Deduplicate opslachsystemen foar backups.

Sûnt reservekopyen wurde ûnderskieden troch harren oerienkomst mei elkoar, wat seldsum is ûnder normale omstannichheden (de gemiddelde reservekopy ferskilt fan juster syn kopy mei 1-2%), dizze klasse fan systemen ekstreem effisjint pakket de gegevens opnommen op harren binnen in frij lyts oantal fysike media. Bygelyks, yn guon gefallen kinne gegevenskompresjeferhâldingen 200 oant 1 berikke.

Objekt opslach systemen.

Dizze opslachsystemen hawwe net de gewoane blok-tagongsvoluminten en bestândielen, en it meast lykje se op in enoarme database. Tagong ta in objekt opslein yn sa'n systeem wurdt útfierd troch in unike identifier of troch metadata (bygelyks alle JPEG-formaat objekten mei in skepping datum tusken XX-XX-XXXX en YY-YY-YYYY).

Compliance systeem.

Se binne net sa gewoan yn Ruslân hjoed, mar se binne it neamen wurdich. It doel fan sokke opslachsystemen is garandearre gegevensopslach om te foldwaan oan feiligensbelied of regeljouwingseasken. Guon systemen (bygelyks EMC Centera) hawwe in funksje ymplementearre om it wiskjen fan gegevens te ferbieden - sa gau as de kaai wurdt draaid en it systeem yn dizze modus komt, kin noch de behearder noch in oar gegevens fysyk wiskje dy't al opnommen binne.

Proprietêre technologyen

Flash cache

Flash Cache is in mienskiplike namme foar alle proprietêre technologyen foar it brûken fan flash-ûnthâld as in twadde-nivo-cache. By it brûken fan in flash-cache wurdt it opslachsysteem normaal berekkene om in fêste lading te leverjen fan magnetyske skiven, wylst de peak wurdt betsjinne troch de cache.

Yn dit gefal is it nedich om it loadprofyl en de mjitte fan lokalisaasje fan tagong ta blokken fan opslachvoluminten te begripen. Flash-cache is in technology foar wurkloads mei heul lokale fragen, en is praktysk net fan tapassing foar unifoarm laden folumes (lykas foar analytyske systemen).

D'r binne twa flash-cache-ymplementaasjes te krijen op 'e merke:

  • Allinnich lêze. Yn dit gefal, allinnich lêzen gegevens wurdt cache, en skriuwen giet direkt nei de skiven. Guon fabrikanten, lykas NetApp, leauwe dat skriuwen nei har opslachsystemen al optimaal is, en de cache sil hielendal net helpe.
  • Lêze skriuwe. Net allinnich lêzen, mar ek skriuwen wurdt cached, dat kinne jo buffer de stream en ferminderjen de ynfloed fan RAID Penalty, en as gefolch tanimme de totale prestaasjes foar opslach systemen mei in minder optimale skriuwen meganisme.

Tiering

Opslach op meardere nivo's (fermoeiend) is in technology foar it kombinearjen fan nivo's mei ferskate prestaasjesnivo's, lykas SSD en HDD, yn in inkele skiifpool. Yn gefal fan útsprutsen unevenness fan tagong ta gegevens blokken, it systeem sil by steat wêze om automatysk lykwicht gegevens blokken, ferpleatse laden nei in hege-prestaasje nivo, en kâld, krekt oarsom, nei in stadiger.

Hybride systemen fan 'e legere en middenklassen brûke opslach op meardere nivo's mei gegevens dy't tusken nivo's ferpleatse op in skema. Tagelyk is de grutte fan it multi-level opslachblok foar de bêste modellen 256 MB. Dizze funksjes tastean ús net te beskôgje tiered opslach technology in technology foar it fergrutsjen fan de produktiviteit, sa't in protte minsken fersin leauwe. Opslach op meardere nivo's yn systemen mei leech- en middenklasse is in technology foar it optimalisearjen fan opslachkosten foar systemen mei útsprutsen load-unevenness.

Snapshot

Nettsjinsteande hoefolle wy prate oer de betrouberens fan opslachsystemen, binne d'r in protte kânsen om gegevens te ferliezen dy't net ôfhinklik binne fan hardwareproblemen. Dit kin firussen, hackers of in oar ûnbedoeld wiskjen / korrupsje fan gegevens wêze. Om dizze reden is reservekopy fan produksjegegevens in yntegraal ûnderdiel fan 'e baan fan in yngenieur.

In momintopname is in momintopname fan in folume op in stuit yn 'e tiid. By it wurkjen mei de measte systemen, lykas virtualisaasje, databases, ensfh. wy moatte sa'n momintopname nimme wêrfan wy de gegevens kopiearje nei in reservekopy, wylst ús IS feilich trochgean mei wurkjen mei dit folume. Mar it is it wurdich te betinken dat net alle snapshots like brûkber binne. Ferskillende leveransiers hawwe ferskillende oanpak foar it meitsjen fan snapshots relatearre oan har arsjitektuer.

CoW (Copy-On-Write). As jo ​​besykje in gegevensblok te skriuwen, wurdt de oarspronklike ynhâld kopiearre nei in spesjaal gebiet, wêrnei't it skriuwen normaal trochgiet. Dit foarkomt gegevenskorrupsje binnen de snapshot. Natuerlik feroarsaakje al dizze "parasitêre" gegevensmanipulaasjes ekstra lêst op it opslachsysteem en om dizze reden riede leveransiers mei ferlykbere ymplemintaasjes net oan om mear as in tsiental snapshots te brûken, en se hielendal net te brûken op heul laden folumes.

RoW (Redirect-on-Write). Yn dit gefal befriest it orizjinele folume natuerlik, en as jo besykje in gegevensblok te skriuwen, skriuwt it opslachsysteem gegevens nei in spesjaal gebiet yn frije romte, en feroaret de lokaasje fan dit blok yn 'e metadatatabel. Hjirmei kinne jo it oantal opnij skriuwe operaasjes ferminderje, wat úteinlik de drop yn prestaasjes elimineert en beheiningen op snapshots en har oantal ferwiderje.

Snapshots binne ek fan twa soarten yn relaasje ta applikaasjes:

Applikaasje konsistinsje. Op it momint fan it meitsjen fan in momintopname lûkt it opslachsysteem in agint yn it bestjoeringssysteem fan 'e konsumint, dy't skiifcaches mei geweld fan ûnthâld nei skiif spoelt en de applikaasje twingt om dit te dwaan. Yn dit gefal, by it weromsetten fan in momintopname, sille de gegevens konsekwint wêze.

Crash konsekwint. Yn dit gefal bart neat as dat en wurdt de momintopname makke sa't it is. Yn it gefal fan herstel fan sa'n momintopname is de foto identyk oan wat der barre soe as de macht ynienen útskeakele waard en wat ferlies fan gegevens mooglik is, fêst yn caches en nea de skiif berikke. Sokke snapshots binne makliker te ymplementearjen en feroarsaakje gjin prestaasjesdegradaasje yn applikaasjes, mar binne minder betrouber.

Wêrom binne snapshots nedich op opslachsystemen?

  • Agentless backup direkt fan it opslachsysteem
  • Meitsje testomjouwings basearre op echte gegevens
  • Yn it gefal fan systemen foar opslach fan bestân kin it brûkt wurde om VDI-omjouwings te meitsjen troch it brûken fan snapshots fan opslachsysteem ynstee fan in hypervisor
  • Soargje foar lege RPO's troch plande snapshots te meitsjen op in frekwinsje dy't signifikant heger is as de reservekopyfrekwinsje

Klonjen

Folume cloning - wurket op in fergelykber prinsipe as snapshots, mar wurdt brûkt net allinnich foar it lêzen fan gegevens, mar foar folslein wurkjen mei it. Wy kinne in krekte kopy fan ús folume krije, mei alle gegevens derop, sûnder in fysike kopy te meitsjen, wat romte sil besparje. Typysk wurdt folumekloning brûkt yn Test&Dev of as jo de funksjonaliteit fan guon updates op jo IS wolle kontrolearje. Klonen sil tastean jo te dwaan dit sa fluch en ekonomysk mooglik yn termen fan skiif boarnen, omdat Allinnich feroare gegevensblokken wurde skreaun.

Replikaasje / Journaling

Replikaasje is in meganisme foar it meitsjen fan in kopy fan gegevens op in oar fysyk opslachsysteem. Typysk hat elke ferkeaper in proprietêre technology dy't allinich binnen syn eigen line wurket. Mar d'r binne ek oplossingen fan tredden, ynklusyf dyjingen dy't wurkje op it hypervisornivo, lykas VMware vSphere Replication.

De funksjonaliteit fan proprietêre technologyen en it gemak fan gebrûk dêrfan binne meastentiids folle superieur oan universele, mar se blike net tapasber te wêzen as it bygelyks nedich is om in replika te meitsjen fan NetApp nei HP MSA.

Replikaasje is ferdield yn twa subtypen:

Syngroane. Yn it gefal fan syngroane replikaasje wurdt de skriuwoperaasje fuortendaliks nei it twadde opslachsysteem stjoerd en de útfiering wurdt net befêstige oant it opslachsysteem op ôfstân befêstiget. Hjirtroch nimt de tagongsfertraging ta, mar wy hawwe in krekte spegelkopy fan de gegevens. Dy. RPO = 0 yn gefal fan ferlies fan it haad opslachsysteem.

asynchronous. Skriuwoperaasjes wurde allinich útfierd op it haadopslachsysteem en wurde fuortendaliks befêstige, wylst se tagelyk sammelje yn in buffer foar batch-oerdracht nei it opslachsysteem op ôfstân. Dit type replikaasje is relevant foar minder weardefolle gegevens, of foar kanalen mei lege bânbreedte of hege latency (typysk foar ôfstannen oer 100 km). Dêrnjonken is RPO = pakketferstjoerfrekwinsje.

Faak, tegearre mei replikaasje, is der in meganisme logging skiif operaasjes. Yn dit gefal wurdt in spesjaal gebiet tawiisd foar logging en opname operaasjes fan in bepaalde djipte yn 'e tiid, of beheind troch it folume fan' e log, wurde opslein. Foar bepaalde proprietêre technologyen, lykas EMC RecoverPoint, is d'r yntegraasje mei systeemsoftware wêrmei jo bepaalde blêdwizers kinne keppelje oan in spesifike yngong yn it log. Hjirmei is it mooglik om de steat fan in folume werom te rôljen (of meitsje in kloon) net allinich nei 23 april, 11 oeren 59 sekonden 13 millisekonden, mar nei it momint foar "ALLE TABLES DROPPE; BEDRIUWE."

Metro kluster

Metro kluster is in technology wêrmei jo te meitsjen bidirectionele syngroane replikaasje tusken twa opslach systemen op sa'n manier dat fan bûten dit pear liket op ien opslach systeem. It wurdt brûkt om klusters te meitsjen mei geografysk skieden earms op metroôfstannen (minder dan 100 km).

Op grûn fan it foarbyld fan gebrûk yn in virtualisaasjeomjouwing lit it metrocluster jo in datastore meitsje mei firtuele masines, tagonklik foar opname fan twa datasintra tagelyk. Yn dit gefal wurdt in kluster makke op it hypervisornivo, besteande út hosts yn ferskate fysike datasintra, ferbûn mei dizze datastore. Hokker kinne jo it folgjende dwaan:

  • Folsleine automatisearring fan it herstelproses nei de dea fan ien fan 'e datasintra. Sûnder ekstra fûnsen sille alle VM's dy't rinne yn it ferstoarne datasintrum automatysk opnij starte yn 'e oerbleaune. RTO = hege beskikberens kluster timeout (15 sekonden foar VMware) + tiid om it bestjoeringssysteem te laden en tsjinsten te begjinnen.
  • Disaster mijen of, yn it Russysk, it foarkommen fan rampen. As stroomfoarsjenning wurk is pland yn data sintrum 1, dan hawwe wy de kâns om te migrearje de hiele wichtige lading nei data sintrum 2 non-stop foarôf, foardat it wurk begjint.

Virtualisaasje

Storage-virtualisaasje is technysk it gebrûk fan folumes fan in oar opslachsysteem as skiven. In opslachvirtualizer kin it folume fan in oar gewoan oerdrage oan 'e konsumint as syn eigen, tagelyk spegelje nei in oar opslachsysteem, of sels in RAID meitsje fan eksterne folumes.
Klassike fertsjintwurdigers yn 'e opslachvirtualisaasjeklasse binne EMC VPLEX en IBM SVC. En fansels, opslachsystemen mei virtualisaasjefunksjonaliteit - NetApp, Hitachi, IBM / Lenovo Storwize.

Wêrom kin it nedich wêze?

  • Redundânsje op it nivo fan opslachsysteem. In spegel wurdt makke tusken de folumes, en de iene helte kin wêze op HP 3Par, en de oare op NetApp. En de virtualizer is fan EMC.
  • Ferpleats gegevens mei minimale downtime tusken opslachsystemen fan ferskate fabrikanten. Litte wy oannimme dat gegevens moatte wurde migrearre fan 'e âlde 3Par, dy't sil wurde ôfskreaun, nei de nije Dell. Yn dit gefal wurde konsuminten loskeppele fan 3Par, de folumes wurde oerdroegen ûnder VPLEX en wurde wer presintearre oan konsuminten. Sûnt net in bytsje is feroare oan it folume, wurk giet troch. It proses fan it spegeljen fan it folume nei de nije Dell begjint op 'e eftergrûn, en nei it foltôgjen is de spegel brutsen en 3Par is útskeakele.
  • Organisaasje fan metroclusters.

Kompresje / deduplikaasje

Kompresje en deduplikaasje binne technologyen wêrmei jo skiifromte kinne besparje op jo opslachsysteem. It is de muoite wurdich om fuortdaliks te neamen dat net alle gegevens yn prinsipe ûnderwurpen binne oan kompresje en/of deduplikaasje, wylst guon soarten gegevens better komprimearre en deduplisearre wurde, en guon - oarsom.

D'r binne 2 soarten kompresje en deduplikaasje:

Ynline - kompresje en deduplikaasje fan gegevensblokken bart foardat dizze gegevens op skiif skriuwe. Sa berekkenet it systeem allinich de hash fan it blok en fergeliket it yn 'e tabel mei de besteande. As earste is it rapper dan gewoan op skiif skriuwen, en twadde, wy fergrieme gjin ekstra skiifromte.

Peal - as dizze operaasjes wurde útfierd op al opnommen gegevens op skiven. Dêrtroch wurde de gegevens earst op skiif skreaun, en pas dan wurdt de hash berekkene en wurde ûnnedige blokken wiske en skiifboarnen wurde frijmakke.

It is it wurdich te sizzen dat de measte ferkeapers beide soarten brûke, wêrtroch se dizze prosessen kinne optimalisearje en dêrmei har effisjinsje ferheegje. De measte opslachleveransiers hawwe nutsbedriuwen wêrmei jo jo datasets kinne analysearje. Dizze nutsbedriuwen wurkje neffens deselde logika dy't wurdt ymplementearre yn it opslachsysteem, dus it rûsde nivo fan effisjinsje sil itselde wêze. Hâld der ek rekken mei dat in protte leveransiers programma's foar prestaasjesgarantie hawwe dy't op syn minst like goede prestaasjes belibje foar bepaalde (of alle) gegevenstypen. En jo moatte dit programma net negearje, om't troch it systeem foar jo taken te berekkenjen, rekken hâldend mei de effisjinsjekoëffisjint fan in bepaald systeem, kinne jo besparje op folume. It is ek de muoite wurdich om te beskôgje dat dizze programma binne ûntwurpen foar AFA systemen, mar tank oan de oankeap fan in lytser folume fan SSDs as HDDs yn klassike systemen, dit sil ferminderje harren kosten, en as net gelyk oan de kosten fan in skiif systeem, dan komme der aardich ticht by.

It model

En hjir komme wy by de goede fraach.

"Se biede my twa opslachopsjes - ABC SuperStorage S600 en XYZ HyperOcean 666v4, wat advisearje jo?"

Feroaret yn "Hjir biede se my twa opslachopsjes - ABC SuperStorage S600 en XYZ HyperOcean 666v4, wat advisearje jo?

De doellading is mingde VMware firtuele masines mei produksje / test / ûntwikkeling loops. Test = produktyf. 150 TB elk mei in peak prestaasjes fan 80 IOPS 000kb blok 8% willekeurige tagong 50/80 lêzen-skriuwen. 20 TB foar ûntwikkeling, 300 IOPS is genôch, 50 willekeurich, 000 skriuwe.

Produktiviteit nei alle gedachten yn de metrocluster RPO = 15 minuten RTO = 1 oere, ûntwikkeling yn asynchronous replikaasje RPO = 3 oeren, test op ien side.

D'r sil in 50TB DBMS wêze, logging soe moai wêze foar har.

Wy hawwe oeral Dell-servers, âlde Hitachi-opslachsystemen, se kinne amper omgean, wy binne fan plan de lading mei 50% te ferheegjen yn termen fan folume en prestaasjes.

Sa't se sizze, in goed formulearre fraach befettet 80% fan it antwurd.

oanfoljende ynformaasje

Wat jo neffens de skriuwers ekstra lêze moatte

Boeken

  • Olifer en Olifer "Computer netwurken". It boek sil helpe om te systematisearjen en miskien better te begripen hoe't it gegevensferfiermedium foar IP / Ethernet-opslachsystemen wurket
  • "EMC Information Storage and Management." In poerbêst boek oer de basis fan opslachsystemen, it wêrom, hoe en wêrom.

Foarums en petearen

Algemiene oanbefellings

Priislist

No, as foar prizen - yn 't algemien, as d'r prizen binne foar opslachsystemen, binne se meastentiids Listprizen, wêrfan elke klant in yndividuele koarting krijt. De grutte fan 'e koarting bestiet út in grut oantal parameters, dus it is gewoan ûnmooglik om te foarsizzen hokker definitive priis jo bedriuw sil krije sûnder de distributeur te freegjen. Mar tagelyk binne koartlyn leechsteande modellen begon te ferskinen yn gewoane kompjûterwinkels, lykas bgl. nix.ru of xcom-shop.ru. Hjir kinne jo fuortendaliks keapje it systeem wêryn jo ynteressearre binne oan in fêste priis, lykas alle kompjûter komponinten.

Mar ik soe graach opmerke wolle dat in direkte ferliking troch TB/$ net goed is. As wy it út dit eachpunt benaderje, dan sil de goedkeapste oplossing in ienfâldige JBOD + tsjinner wêze, dy't net de fleksibiliteit of betrouberens sil leverje dy't in folweardich opslachsysteem mei dûbele kontrôler leveret. Dit betsjut hielendal net dat JBOD walgelijk is en in ferfelende smoarge trúk, jo moatte gewoan wer heul dúdlik begripe hoe en foar hokker doelen jo dizze oplossing sille brûke. Jo kinne faak hearre dat der neat te brekken yn JBOD, der is mar ien backplane. Backplanes falle lykwols soms ek mis. Alles brekt ier of let.

Totaal

It is needsaaklik om systemen mei elkoar te fergelykjen net allinich troch priis, of net allinich troch prestaasjes, mar troch it totaal fan alle yndikatoaren.

Keapje HDD allinich as jo wis binne dat jo HDD nedich binne. Foar lege loads en ynkompressibele gegevenstypen, oars, is it de muoite wurdich om te gean nei programma's foar garânsje foar SSD-opslach effisjinsje, dy't de measte leveransiers no hawwe (en se wurkje echt, sels yn Ruslân), mar it hinget allegear ôf fan 'e applikaasjes en gegevens dy't sille wurde pleatst op dizze opslach systeem.

Gean net foar goedkeap. Soms ferbergje dizze in protte ûnnoflike mominten, ien wêrfan Evgeniy Elizarov beskreaun yn syn artikels oer Infortrend. En dat, op 't lêst, dizze goedkeapheid op jo weromkomme kin. Ferjit net - "de gierige betellet twa kear."

Boarne: www.habr.com

Add a comment