Nola aukeratu biltegiratzea oinetan tiro egin gabe

Sarrera

Biltegiratzea erosteko garaia da. Zein hartu, nori entzun? A saltzaileak B saltzaileari buruz hitz egiten du, eta gero C integratzailea dago, kontrakoa esaten duena eta D saltzaileari aholkatzen diona. Egoera horretan, biltegiratze arkitekto esperientziadun baten buruak ere bira egingo du, batez ere modan dauden saltzaile eta SDS eta hiperkonbergentzia berri guztiekin. gaur.

Orduan, nola asmatu dena eta ez bukatzeko tontoa izaten? Gu (AntonVirtuala Anton Zhbankov eta korp Evgeniy Elizarov) saia gaitezen honi buruz errusiera hutsez hitz egiten.
Artikuluak antzekotasun asko ditu eta, egia esan, luzapena da "Datu-zentro birtualizatuaren diseinua” biltegiratze sistemak aukeratzeari eta biltegiratze teknologiak berrikusteari dagokionez. Teoria orokorrari labur-labur aztertuko dugu, baina artikulu hau ere irakurtzea gomendatzen dizugu.

Zertarako

Askotan ikus daiteke pertsona berri bat foro batera edo txat espezializatu batera etortzen den egoera bat, hala nola Biltegiratze-eztabaidak, eta galdera hau egiten duen: "Hemen bi biltegiratze aukera eskaintzen dizkidate - ABC SuperStorage S600 eta XYZ HyperOcean 666v4, zer gomendatzen duzu. ?”

Eta nahasmena hasten da nork dituen ezaugarri izugarriak eta ulergaitzak ezartzeko ezaugarriak, prestatu gabeko pertsona batentzat guztiz txinatarrak direnak.

Beraz, proposamen komertzialetan zehaztapenak alderatu baino lehen zure buruari egin behar diozun gakoa eta lehen galdera ZERGATIK da? Zergatik behar da biltegiratze sistema hau?

Nola aukeratu biltegiratzea oinetan tiro egin gabe

Erantzuna ustekabekoa izango da, eta oso Tony Robbins estiloa - datuak gordetzeko. Eskerrik asko, kapitaina! Eta, hala ere, batzuetan hain sakontzen gara xehetasunak alderatzen, non ahaztu egiten zaigun hori guztia zergatik egiten dugun lehenik.

Beraz, datu biltegiratze sistema baten zeregina DATUAK gordetzea eta sarbidea ematea da errendimendu jakin batekin. Datuekin hasiko gara.

Datu

Datu mota

Nolako datuak gordetzeko asmoa dugu? Biltegiratze sistema asko kontuan hartu gabe ezaba ditzakeen galdera oso garrantzitsua. Adibidez, bideoak eta argazkiak gordetzeko asmoa duzu. Berehala ezaba ditzakezu bloke txikietan ausazko sarbiderako diseinatutako sistemak edo konpresio/desduplicazioan ezaugarri jabedunak dituzten sistemak. Hauek sistema bikainak izan daitezke, ez dugu ezer txarrik esan nahi. Baina kasu honetan, haien indarrak ahuldu egingo dira (bideoa eta argazkiak ez dira konprimitzen) edo sistemaren kostua nabarmen handituko dute.

Aitzitik, aurreikusitako erabilera DBMS transakzional okupatua bada, orduan gigabyte segundoko emateko gai diren multimedia streaming sistema bikainak aukera txarra izango dira.

Datuen bolumena

Zenbat datu gordetzeko asmoa dugu? Kantitatea beti kalitate bihurtzen da; hori ez da inoiz ahaztu behar, batez ere datu-bolumenaren hazkunde esponentzialaren garaian. Petabyte-mailako sistemak jada ez dira arraroak, baina zenbat eta petabyte-ko edukiera handiagoa izan, orduan eta zehatzagoa izango da sistema, orduan eta erabilerrazagoa izango da tamaina txikiko eta ertaineko sistema ausazkoen ohiko funtzionaltasuna. Huskeria da bloke-sarbideen estatistiken taulak bakarrik kontrolagailuetan eskuragarri dagoen RAM kopurua baino handiagoak bihurtzen direlako. Zer esanik ez konpresioa/tiering. Demagun konpresio algoritmoa indartsuago batera aldatu eta 20 petabyte datu konprimitu nahi ditugula. Zenbat denbora beharko da: sei hilabete, urtebete?

Bestalde, zergatik kezkatu 500 GB datuak gorde eta prozesatu behar badituzu? 500 bakarrik. Etxeko SSDek (DWPD baxuarekin) ez dute ezer balio. Zergatik eraiki Fibre Channel fabrika bat eta erosi burdinurtuzko zubi baten baliokidea balio duten goi-mailako kanpoko biltegiratze sistemak?

Guztiaren zein ehuneko da datu beroak? Zenbaterainokoa da karga datu-bolumenari dagokionez? Hemen mailakako biltegiratze teknologia edo Flash Cache oso lagungarriak izan daitezke datu beroen kopurua txikia bada guztizkoarekin alderatuta. Edo alderantziz, bolumen osoan zehar karga uniformea ​​izanik, askotan streaming sistemetan (bideozaintza, analisi-sistema batzuk) aurkitu ohi dena, horrelako teknologiek ez dute ezer emango eta sistemaren kostua/konplexutasuna areagotu baino ez dute egingo.

IP

Datuen beste aldea datuak erabiltzen dituen informazio sistema da. IS batek datuak heredatzen dituen baldintza multzo bat du. IS-ari buruzko informazio gehiago lortzeko, ikus "Datu-zentro birtualizatuaren diseinua".

Erresilientzia/Eskuragarritasun-baldintzak

Akatsen tolerantziarako / datuen erabilgarritasunerako eskakizunak IS-tik heredatzen dira haiek erabiliz eta hiru zenbakitan adierazten dira - RPO, OTR, erabilgarritasuna.

erabilgarritasuna — haiekin lan egiteko datuak eskuragarri dauden denbora-tarte jakin bateko kuota. Normalean 9 zenbaki gisa adierazten da. Adibidez, urtean bi bederatzik esan nahi du erabilgarritasuna % 99koa dela, edo, bestela, urtean 95 ordu erabilgarri ez egotea onartzen da. Hiru bederatzi - 9,5 ordu urtean.

RPO / RTO ez dira guztizko adierazleak, gertakari bakoitzeko (istripua) baizik, erabilgarritasunaren aldean.

RPO — istripu batean galdutako datu kopurua (ordutan). Adibidez, babeskopiak egunean behin egiten badira, RPO = 24 ordu. Horiek. Hondamendiren bat gertatuz gero eta biltegiratze-sistema erabat galduz gero, 24 ordura arteko datuak gal daitezke (kopia egiteko unetik). ISrako zehaztutako RPOan oinarrituta, adibidez, segurtasun-araudiak idazten dira. Gainera, RPOn oinarrituta, datu sinkrono/asinkronoen erreplikazioa zenbat behar den uler dezakezu.

OTR — Hondamendi baten ondoren zerbitzua (datu sarbidea) berrezartzeko ordua. Emandako RTO balioaren arabera, metro kluster bat behar den ala ez norabide bakarreko erreplikazioa nahikoa den uler dezakegu. Goi-end klase-kontrolagailu anitzeko biltegiratze-sistema behar al duzu?

Nola aukeratu biltegiratzea oinetan tiro egin gabe

Errendimendu-baldintzak

Galdera oso agerikoa den arren, hor sortzen dira zailtasun gehienak. Dagoeneko nolabaiteko azpiegitura duzun ala ez, beharrezko estatistikak biltzeko bideak eraikiko dira.

Dagoeneko biltegiratze sistema bat duzu eta ordezko bat bilatzen ari zara edo beste bat erosi nahi duzu zabaltzeko. Hemen dena sinplea da. Dagoeneko zein zerbitzu dituzun eta etorkizun hurbilean ezartzeko asmoa duzun ulertzen duzu. Egungo zerbitzuetan oinarrituta, errendimendu-estatistikak biltzeko aukera duzu. Zehaztu uneko IOPS kopurua eta uneko latentzia - zein dira adierazle hauek eta nahikoak al dira zure zereginetarako? Hori bai datuak biltegiratzeko sisteman bertan eta harekin konektatuta dauden ostalarietatik egin daiteke.

Gainera, uneko karga ez ezik, epe jakin batean (ahal bada, hilabete batean) begiratu behar duzu. Ikusi zein diren egunean zehar gehienezko gailurrak, zer karga sortzen duen babeskopiak, etab. Zure biltegiratze-sistemak edo haren softwareak ez badizu datu horien multzo osoa ematen, doako RRDtool erabil dezakezu, biltegiratze-sistema eta etengailu ezagunenetako gehienekin funtziona dezakeena eta errendimendu-estatistika zehatzak eskain diezazkizuke. Merezi du biltegiratze sistema honekin lan egiten duten ostalarien karga, makina birtual espezifikoetarako, edo ostalari honetan zehazki exekutatzen dena aztertzea.

Nola aukeratu biltegiratzea oinetan tiro egin gabe

Bereiz nabarmentzea komeni da bolumenaren atzerapenak eta bolumen honetan dagoen datu-biltegia nabarmen desberdinak badira, zure SAN sareari erreparatu behar diozula, probabilitate handia dago horrekin arazoak izateko eta berri bat erosi aurretik. sistema, merezi du gai hau aztertzea, egungo sistemaren errendimendua handitzeko probabilitate oso handia baitago.

Hutsetik azpiegitura bat eraikitzen ari zara edo zerbitzu berri baterako sistema bat erosten ari zara, zeinen zamak ezagutzen ez dituzun. Hainbat aukera daude: baliabide espezializatuekin lankideekin komunikatzea karga jakin eta aurreikusten saiatzeko, antzeko zerbitzuak ezartzeko esperientzia duen eta zuretzako karga kalkula dezakeen integratzaile batekin harremanetan jarri. Eta hirugarren aukera (normalean zailena, batez ere etxean idatzitako aplikazioei edo arraroei dagokienez) sistemaren garatzaileen errendimendu-eskakizunak jakiten saiatzea da.

Eta, kontuan izan, aplikazio praktikoaren ikuspuntutik aukerarik zuzenena egungo ekipoen pilotua da, edo hornitzaile/integratzaile batek probatzeko emandako ekipoa.

Baldintza bereziak

Baldintza bereziak errendimenduaren, akatsen tolerantziaren eta datuak zuzenean prozesatzeko eta hornitzeko funtzionaltasunen barruan sartzen ez den guztia dira.

Datuak biltegiratzeko sistema baten eskakizun berezi errazenetako bat "biltegiratze-euskarri alienagarriak" dei daiteke. Eta berehala argi geratzen da datuen biltegiratze sistema honek zinta liburutegi bat edo, besterik gabe, segurtasun kopia iraultzen den zinta-unitate bat izan behar duela. Horren ondoren, bereziki prestatutako pertsona batek zinta sinatzen du eta harro eramaten du seguru berezi batera.
Baldintza berezi baten beste adibide bat babestutako kolpeen aurkako diseinua da.

non

Biltegiratze sistema jakin bat aukeratzeko bigarren osagai nagusia biltegiratze sistema hau NON kokatuko den informazioa da. Geografia edo baldintza klimatikoetatik hasi, eta langileekin amaitu.

bezero

Norentzat da biltegiratze sistema hau aurreikusita? Galderak arrazoi hauek ditu:

Gobernuko bezeroa/merkataritza.
Merkataritza-bezeroak ez du inolako murrizketarik eta ez dago lizitazioetara derrigortuta ere, bere barne araudiaren arabera izan ezik.

Gobernuko bezero bat beste kontu bat da. 44 Zuzenbide Federala eta aurkatu daitezkeen eskaintza eta zehaztapen teknikoekin beste gozamen batzuk.

Bezeroa zigorpean dago
Beno, hemen galdera oso erraza da - aukera bezero jakin baten eskura dauden eskaintzek soilik mugatzen dute.

Barne araudiak / saltzaileak / ereduak erosteko baimenduta
Galdera ere oso erraza da, baina gogoratu behar duzu.

Non fisikoki

Zati honetan ostatu-lokaletako geografia, komunikazio-kanalak eta mikroklimaren inguruko gai guztiak kontuan hartzen ditugu.

Персонал

Nork lan egingo du biltegiratze sistema honekin? Hau ez da biltegiratze sistemak berak egin dezakeena baino garrantzitsuagoa.
A saltzailearen biltegiratze-sistema zein itxaropentsua, polita eta zoragarria den, ziurrenik ez du ezertarako balio berau instalatzeak langileek B hornitzailearekin lan egiten badakite eta ez dago A-rekin erosketa gehiago egiteko eta etengabeko lankidetzarako planik.

Eta, jakina, galderaren beste aldea da kokapen geografiko jakin batean zein eskuragarri dauden langile prestatuak zuzenean enpresan eta potentzialki lan-merkatuan. Eskualdeetarako, interfaze sinpleak dituzten biltegiratze sistemak edo kudeaketa urrunetik zentralizatzeko gaitasuna aukeratzeak zentzu handia izan dezake. Bestela, uneren batean izugarri mingarria izan daiteke. Internet istorioz beteta dago nola iritsi zen langile berri batek, atzoko ikaslea, bulego osoa hil zela konfiguratu zuen.

Nola aukeratu biltegiratzea oinetan tiro egin gabe

Ingurumena

Eta, jakina, galdera garrantzitsu bat da biltegiratze sistema honek zein ingurunetan funtzionatuko duen.

  • Zer gertatzen da elikadura hornidura/hoztearekin?
  • Zer lotura
  • Non instalatuko da?
  • Etab.

Askotan galdera hauek berebizikotzat hartzen dira eta ez dira bereziki kontuan hartzen, baina batzuetan dena irauli dezaketenak dira.

That

Saltzailea

Gaurtik aurrera (2019 erdialdera), Errusiako biltegiratze merkatua 5 kategoriatan bana daiteke:

  1. Dibisio gorena ondo finkatutako enpresak dira, errazenetik goi-end-era bitarteko disko-apal sorta zabala dutenak (HPE, DellEMC, Hitachi, NetApp, IBM / Lenovo)
  2. Bigarren dibisioa: lerro mugatua duten enpresak, nitxoko jokalariak, SDS saltzaile serioak edo goranzko berriak (Fujitsu, Datacore, Infinidat, Huawei, Pure, etab.)
  3. Hirugarren dibisioa - maila baxuko soluzio nitxoak, SDS merkeak, ceph eta beste proiektu irekietan oinarritutako produktu aurreratuak (Infortrend, Starwind, etab.)
  4. SOHO segmentua - etxeko/bulego txikiko biltegiratze sistema txikiak eta ultra txikiak (Synology, QNAP, etab.)
  5. Inportazioz ordezkaturiko biltegiratze-sistemak: lehen dibisioko hardwarea eta etiketa berrituekin eta bigarrenaren ordezkari arraroak (RAIDIX, bigarrena emango diegu aldez aurretik), baina batez ere hirugarren dibisioa da (Aerodisk, Baum, Depo, etab.)

Zatiketa nahiko arbitrarioa da, eta ez du esan nahi hirugarren edo SOHO segmentua txarra denik eta ezin denik erabili. Datu-multzo eta karga-profil argi eta garbi definituta dituzten proiektu zehatzetan, oso ondo funtziona dezakete, prezio/kalitate erlazioari dagokionez lehen dibisioa askoz ere gaindituz. Garrantzitsua da lehenik eta behin zure helburuak, hazkunde-aukerak eta beharrezko funtzionaltasuna erabakitzea, eta gero Synologyk zintzo balioko dizu eta zure ilea leun eta zetatsu bihurtuko da.

Hornitzaile bat aukeratzerakoan faktore garrantzitsuenetako bat egungo ingurunea da. Zenbat biltegiratze-sistema dituzun dagoeneko eta zure ingeniariek zein biltegiratze-sistemekin lan egin dezaketen. Beste saltzaile bat behar al duzu, beste harreman-puntu bat, pixkanaka-pixkanaka migratuko al duzu karga osoa A saltzailetik B saltzailera?

Ez da beharrezkoa denetik haratago entitaterik sortu behar.

iSCSI/FC/Fitxategia

Ingeniarien artean ez dago adostasunik sarbide-protokoloen gaian, eta eztabaidak eztabaida teologikoen antza handiagoa du ingeniaritzakoak baino. Baina, oro har, puntu hauek nabarmen daitezke:

FCoE hilik bizi baino gehiago.

FC vs iSCSI. 2019an FC-ren abantail nagusietako bat IP biltegian, datuetara sartzeko fabrika dedikatua, IP sare dedikatu batek konpentsatzen du. FC-k ez du abantaila globalik IP sareekiko, eta IP edozein karga-mailatako biltegiratze-sistemak eraikitzeko erabil daiteke, banku handi baten oinarrizko banku-sistemarako DBMS astunetarako sistemetaraino. Bestalde, FCren heriotza iragarrita dago orain dela hainbat urte, baina zerbaitek etengabe eragozten du. Gaur egun, adibidez, biltegiratze-merkatuko zenbait eragile aktiboki garatzen ari dira NVMEoF estandarra. FCoEren patua partekatuko duen ala ez - denborak esango du.

Fitxategirako sarbidea ere ez da arreta merezi ez duen zerbait. NFS/CIFS-k ondo funtzionatzen du produktibitate-inguruneetan eta, behar bezala diseinatuz gero, ez du blokeatu protokoloak baino kexa gehiagorik.

Flash array hibridoa/guztia

Biltegiratze sistema klasikoak 2 motatan daude:

  1. AFA (All Flash Array) - SSD erabiltzeko optimizatutako sistemak.
  2. Hibridoa - HDD eta SSD edo horien konbinazioa erabiltzeko aukera ematen dizu.

Haien desberdintasun nagusia biltegiratze-eraginkortasunaren teknologiak eta errendimendu-maila maximoa (IOPS handia eta latentzia txikia) dira. Bi sistemak (bere modelo gehienetan, behe-segmentua kontatu gabe) bloke eta fitxategi gailu gisa funtziona dezakete. Onartutako funtzionaltasuna sistemaren mailaren araberakoa da, eta eredu gazteenentzat gehienetan gutxieneko maila batera murrizten da. Merezi du arreta jartzea eredu jakin baten ezaugarriak aztertzen ari zarenean, eta ez bakarrik lerro osoaren gaitasunak. Gainera, jakina, bere ezaugarri teknikoak, hala nola, prozesadorea, memoria kopurua, cachea, ataka kopurua eta motak, etab., sistemaren mailaren araberakoak dira. Kudeaketa ikuspegitik, AFAk (disko) sistema hibridoetatik bereizten dira SSD unitateekin lan egiteko mekanismoak ezartzean soilik, eta SSD bat sistema hibrido batean erabiltzen baduzu ere, horrek ez du esan nahi gai izango zarenik. AFA sistema baten errendimendu maila lortzeko . Gainera, kasu gehienetan, lineako biltegiratze mekanismo eraginkorrak desgaituta daude sistema hibridoetan, eta horiek sartzeak errendimendua galtzea dakar.

Biltegiratze sistema bereziak

Erabilera orokorreko biltegiratze-sistemez gain, batez ere datu operatiboak prozesatzeari ardaztutakoak, ohikoak ez diren funtsezko printzipioak dituzten biltegiratze-sistema bereziak daude (latentzia txikia, IOPS handia):

Komunikabideak.

Sistema hauek multimedia fitxategi handiak gordetzeko eta prozesatzeko diseinatuta daude. Erantzun. atzerapena ia garrantzirik gabea bihurtzen da, eta korronte paralelo askotan datuak banda zabalean bidaltzeko eta jasotzeko gaitasuna nabarmentzen da.

Backupetarako biltegiratze-sistemak desbikoiztea.

Segurtasun-kopiak elkarren artean duten antzekotasunagatik bereizten direnez, eta hori oso arraroa da baldintza normaletan (batez besteko kopia atzoko kopiatik %1-2 desberdina da, sistema-klase honek oso modu eraginkorrean biltzen ditu haietan grabatutako datuak nahiko txiki batean. euskarri fisikoen kopurua. Adibidez, kasu batzuetan, datuen konpresio-ratioak 200 eta 1era irits daitezke.

Objektuak biltegiratzeko sistemak.

Biltegiratze sistema hauek ez dituzte ohiko bloke-sarbide-bolumenak eta fitxategi-partekatzeak, eta, batez ere, datu-base erraldoi baten antza dute. Sistema horretan gordetako objektu baterako sarbidea identifikatzaile esklusibo baten bidez edo metadatuen bidez egiten da (adibidez, XX-XX-XXXX eta YY-YY-YYYY arteko sorrera-data duten JPEG formatuko objektu guztiak).

Betetzeko sistema.

Gaur egun Errusian ez dira hain ohikoak, baina aipatzekoak dira. Biltegiratze sistemen helburua datuen biltegiratzea bermatzea da, segurtasun politikak edo arauzko eskakizunak betetzeko. Sistema batzuek (adibidez, EMC Centera) funtzio bat ezarri dute datuak ezabatzea debekatzeko: tekla piztu eta sistema modu honetan sartzen den bezain laster, ez administratzaileak ez beste inork ezin ditu fisikoki ezabatu dagoeneko grabatuta dauden datuak.

Teknologia jabedunak

Flash cachea

Flash Cachea flash memoria bigarren mailako cache gisa erabiltzeko jabedun teknologia guztien izen arrunta da. Flash cachea erabiltzean, biltegiratze-sistema disko magnetikoetatik karga egonkorra eskaintzeko kalkulatzen da normalean, eta gailurra cacheak zerbitzatzen duen bitartean.

Kasu honetan, beharrezkoa da karga-profila eta biltegiratze-bolumen blokeetarako sarbidearen lokalizazio-maila ulertzea. Flash cachea oso lokalizatutako kontsultak dituzten lan-kargarentzako teknologia da, eta ia ez da aplikatzen uniformeki kargatutako bolumenetarako (analitika-sistemetarako, esaterako).

Bi flash cache inplementazio daude eskuragarri merkatuan:

  • Irakurtzeko soilik. Kasu honetan, irakurritako datuak soilik gordetzen dira cachean, eta idazketa zuzenean diskoetara doa. Fabrikatzaile batzuek, NetApp adibidez, beren biltegiratze sistemetan idaztea ezin hobea dela uste dute, eta cacheak ez duela batere lagunduko.
  • Irakurri/Idatzi. Irakurketa ez ezik, idazketa ere cachean gordetzen da, eta horri esker, korrontea buffer dezakezu eta RAID Penalty-ren eragina murrizteko, eta, ondorioz, idazketa-mekanismo ez hain optimoa duten biltegiratze-sistemetarako errendimendu orokorra handitzeko.

Mailaketa

Maila anitzeko biltegiratzea (nekagarria) errendimendu-maila desberdinak dituzten mailak, hala nola SSD eta HDD, disko bakarrean konbinatzeko teknologia da. Datu-blokeetarako sarbidearen desberdintasun nabarmena izanez gero, sistemak automatikoki orekatu ahal izango ditu datu-blokeak, kargatutakoak errendimendu handiko mailara eramanez, eta hotzak, aitzitik, motelago batera.

Klase baxuko eta ertaineko sistema hibridoek maila anitzeko biltegiratzea erabiltzen dute, datuak mailaz ordutegi batean mugitzen direlarik. Aldi berean, eredu onenentzako maila anitzeko biltegiratze blokearen tamaina 256 MB da. Ezaugarri hauek ez digute uzten mailakako biltegiratze teknologia produktibitatea areagotzeko teknologiatzat har, jende askok oker uste baitu. Maila anitzeko biltegiratzea klase baxuko eta ertaineko sistemetan biltegiratze-kostuak optimizatzeko teknologia da karga-desberdintasun nabarmena duten sistemetan.

Snapshot

Biltegiratze sistemen fidagarritasunaz zenbat hitz egiten dugun ere, hardware arazoen menpe ez dauden datuak galtzeko aukera asko daude. Hau birusak, hackerrak edo nahigabeko datuak ezabatzea/hondatzea izan daiteke. Hori dela eta, ekoizpen-datuen babeskopiak egitea ingeniari baten lanaren zati bat da.

Argazkia bolumen baten argazkia da uneren batean. Sistema gehienekin lan egitean, hala nola birtualizazioa, datu-baseak, etab. horrelako argazki bat hartu behar dugu, eta bertatik datuak kopiatuko ditugu segurtasun kopia batera, gure IS bitartean bolumen honekin lan egiten jarraitu ahal izango du. Baina komeni da gogoratzea argazki guztiak ez direla berdin erabilgarriak. Saltzaile ezberdinek ikuspegi desberdinak dituzte beren arkitekturarekin lotutako argazkiak sortzeko.

Behia (Kopiatu-Idazketa). Datu-bloke bat idazten saiatzen zarenean, bere jatorrizko edukia eremu berezi batera kopiatzen da, eta ondoren idazketa normal egiten da. Honek argazkiaren barruan datuak hondatzea saihesten du. Jakina, datuen manipulazio "parasitario" guzti hauek karga gehigarria eragiten dute biltegiratze sisteman eta horregatik, antzeko ezarpenak dituzten saltzaileek ez dute gomendatzen dozena bat argazki baino gehiago erabiltzea, eta oso kargatutako bolumenetan ez erabiltzea.

RoW (birbideratzean-idazketan). Kasu honetan, jatorrizko bolumena berez izoztu egiten da, eta datu-bloke bat idazten saiatzean, biltegiratze-sistemak datuak eremu berezi batean idazten ditu espazio librean, bloke honen kokapena metadatuen taulan aldatuz. Horrek berridazketa-eragiketen kopurua murrizteko aukera ematen du, eta horrek, azken finean, errendimenduaren jaitsiera ezabatzen du eta argazkien eta haien kopuruaren murrizketak kentzen ditu.

Aplikazioei dagokienez, bi motatako argazkiak ere badaude:

Aplikazioaren koherentzia. Argazki bat sortzeko momentuan, biltegiratze-sistemak kontsumitzailearen sistema eragilean agente bat ateratzen du, eta horrek indarrez garbitzen ditu disko-katxeak memoriatik diskora eta aplikazioa horretara behartzen du. Kasu honetan, argazki batetik berrezartzean, datuak koherenteak izango dira.

Crash koherentea. Kasu honetan, ez da horrelakorik gertatzen eta argazkia dagoen bezala sortzen da. Horrelako argazki baten berreskurapenean, argazkia bat-batean itzali eta datu-galera bat posible bada, cacheetan itsatsita eta diskora inoiz ez iritsiko balitz gertatuko litzatekeenaren berdina da. Horrelako argazkiak errazago inplementatzen dira eta ez dute aplikazioetan errendimendua hondatzen, baina ez dira hain fidagarriak.

Zergatik behar dira argazkiak biltegiratze sistemetan?

  • Agenterik gabeko babeskopia biltegiratze sistematik zuzenean
  • Sortu proba-inguruneak datu errealetan oinarrituta
  • Fitxategiak biltegiratzeko sistemen kasuan, VDI inguruneak sortzeko erabil daiteke biltegiratze sistemaren argazkien bidez hipervisor baten ordez.
  • Ziurtatu RPO baxuak babeskopien maiztasuna baino nabarmen altuagoko maiztasunarekin programatutako argazkiak sortuz

Klonatzea

Bolumen-klonazioa - argazkien antzeko printzipioan funtzionatzen du, baina datuak irakurtzeko ez ezik, guztiz lan egiteko erabiltzen da. Gure bolumenaren kopia zehatza lortzeko gai gara, bertan dauden datu guztiekin, kopia fisikorik egin gabe, eta horrek lekua aurreztuko du. Normalean, bolumen-klonazioa Test&Dev-en erabiltzen da edo zure IS-eko eguneratze batzuen funtzionaltasuna egiaztatu nahi baduzu. Klonazioak disko-baliabideei dagokienez ahalik eta azkarren eta ekonomikoki egiteko aukera emango dizu, zeren Aldatutako datu-blokeak bakarrik idatziko dira.

Erreplikazioa / Egunkaria

Erreplikatzea beste biltegiratze sistema fisiko batean datuen kopia bat sortzeko mekanismo bat da. Normalean, saltzaile bakoitzak bere linearen barruan bakarrik funtzionatzen duen teknologia jabeduna du. Baina hirugarrenen irtenbideak ere badaude, hipervisore mailan lan egiten dutenak barne, hala nola VMware vSphere Replication.

Jabedun teknologien funtzionaltasuna eta hauen erabilera erraztasuna unibertsalak baino askoz handiagoak izan ohi dira, baina ez dira aplikagarriak izaten, adibidez, NetApp-etik HP MSAra erreplika bat egin behar denean.

Erreplikazioa bi azpimotatan banatzen da:

Sinkronikoa. Erreplikazio sinkronoaren kasuan, idazketa-eragiketa bigarren biltegiratze-sistemara bidaltzen da berehala eta exekuzioa ez da berresten urruneko biltegiratze-sistemak baieztatzen duen arte. Hori dela eta, sarbide-atzerapena handitzen da, baina datuen ispilu kopia zehatza dugu. Horiek. RPO = 0 biltegiratze-sistema nagusia galduz gero.

asinkronoa. Idazketa-eragiketak biltegiratze-sistema nagusian bakarrik exekutatzen dira eta berehala berresten dira, eta aldi berean buffer batean pilatzen dira urruneko biltegiratze sistemara loteka bidaltzeko. Erreplikazio-mota hau garrantzitsua da balio gutxiagoko datuetarako, edo banda-zabalera txikia edo latentzia handia duten kanaletarako (normala 100 km-tik gorako distantzietarako). Horren arabera, RPO = paketeak bidaltzeko maiztasuna.

Askotan, erreplikazioarekin batera, mekanismo bat dago erregistroa disko-eragiketak. Kasu honetan, eremu berezi bat esleitzen da eta denboran sakonera jakin bateko eragiketak erregistratzeko edo erregistroaren bolumenak mugatuta gordetzen dira. Zenbait jabedun teknologiarentzat, hala nola EMC RecoverPoint-entzat, sistema-softwarearekin integratuta dago, laster-marka batzuk erregistro-sarrera zehatz batekin lotzeko aukera ematen duena. Horri esker, posible da bolumen baten egoera atzera egitea (edo klon bat sortzea) ez soilik apirilaren 23ra arte, 11 ordu 59 segundo 13 milisegundoraino, baizik eta “TAULA GUZTIAK EROTI; KONPROMISOA”.

Metro klusterra

Metro klusterra bi biltegiratze-sistemen arteko noranzko biko erreplikazio sinkronikoa sortzeko aukera ematen duen teknologia da, kanpotik pare honek biltegiratze-sistema baten itxura izan dezan. Geografikoki bereizita dauden besoak dituzten multzoak sortzeko erabiltzen da metroko distantzietan (100 km baino gutxiago).

Birtualizazio ingurune batean erabiltzeko adibidean oinarrituta, metroklusterrak makina birtualak dituen datu-denda bat sortzeko aukera ematen du, bi datu-zentrotatik aldi berean grabatzeko eskuragarria. Kasu honetan, hipervisor mailan kluster bat sortzen da, datu-zentro fisiko ezberdinetako ostalariz osatua, datu-biltegi honetara konektatuta. Horrek aukera ematen dizu honako hau egiteko:

  • Datu-zentroetako bat hil ondoren berreskuratzeko prozesuaren automatizazioa osoa. Funts gehigarririk gabe, hildako datu-zentroan exekutatzen diren VM guztiak automatikoki berrabiaraziko dira gainerakoan. RTO = erabilgarritasun handiko klusterraren denbora-muga (15 segundo VMwarerako) + sistema eragilea kargatzeko eta zerbitzuak abiarazteko denbora.
  • Hondamendiak saihestea edo, errusieraz, hondamendiak saihestea. 1. datu-zentroan elikadura-hornidura-lana aurreikusita badago, orduan karga garrantzitsu osoa 2. datu-zentrora geldirik gabe migratzeko aukera dugu, lana hasi aurretik.

Birtualizazioa

Biltegiratze birtualizazioa teknikoki beste biltegiratze sistema bateko bolumenak disko gisa erabiltzea da. Biltegiratze birtualizatzaile batek beste norbaiten bolumena kontsumitzaileari berea bezala transferi diezaioke, aldi berean beste biltegiratze sistema batera islatuz, edo baita kanpoko bolumenetatik RAID bat sortu ere.
Biltegiratze birtualizazio klaseko ordezkari klasikoak EMC VPLEX eta IBM SVC dira. Eta, jakina, birtualizazio funtzionaltasuna duten biltegiratze sistemak - NetApp, Hitachi, IBM / Lenovo Storwize.

Zergatik beharko litzateke?

  • Erredundantzia biltegiratze sistemaren mailan. Ispilu bat sortzen da bolumenen artean, eta erdi bat HP 3Par-en egon daiteke, eta bestea NetApp-en. Eta birtualizatzailea EMCrena da.
  • Mugitu datuak fabrikatzaile ezberdinen biltegiratze-sistemen artean gutxieneko geldialdiarekin. Demagun datuak Dell berrira migratu behar direla 3Par zaharretik, kendu egingo dena. Kasu honetan, kontsumitzaileak 3Par-etik deskonektatzen dira, bolumenak VPLEX-en bidez transferitzen dira eta kontsumitzaileei berriro aurkezten zaizkie. Bolumenean pixka bat aldatu ez denez, lanak jarraitzen du. Dell berriaren bolumena islatzeko prozesua atzeko planoan hasten da, eta amaitzean, ispilua hautsi egiten da eta 3Par desgaituta dago.
  • Metroklusterren antolaketa.

Konpresioa/desduplikatzea

Konpresioa eta desduplicazioa zure biltegiratze sisteman diskoko lekua aurrezteko aukera ematen duten teknologiak dira. Berehala aipatzea komeni da datu guztiak ez daudela konpresio edo/eta desduplicazioaren menpe, printzipioz, datu-mota batzuk hobeto konprimitzen eta desduplikatzen diren bitartean, eta beste batzuk alderantziz.

Bi konpresio eta deduplicazio mota daude:

Lerrokatuta — datu-blokeen konpresioa eta desduplicazioa gertatzen da datu hauek diskoan idatzi aurretik. Horrela, sistemak blokearen hash-a bakarrik kalkulatzen du eta taulan daudenekin alderatzen du. Lehenik eta behin, diskoan idaztea baino azkarragoa da, eta bigarrenik, ez dugu diskoko espazio gehigarria alferrik galtzen.

Post - eragiketa hauek diskoetan kokatutako dagoeneko grabatutako datuetan egiten direnean. Horren arabera, datuak lehenik diskoan idazten dira, eta gero hash-a kalkulatzen da eta beharrezkoak ez diren blokeak ezabatzen dira eta diskoko baliabideak askatzen dira.

Esan beharra dago saltzaile gehienek bi motak erabiltzen dituztela, eta horri esker, prozesu hauek optimizatu eta, ondorioz, eraginkortasuna areagotzen dute. Biltegiratze-saltzaile gehienek zure datu multzoak aztertzeko aukera ematen duten utilitateak dituzte. Utilitate hauek biltegiratze sisteman ezartzen den logika beraren arabera funtzionatzen dute, beraz, estimatutako eraginkortasun maila berdina izango da. Gainera, kontuan izan saltzaile askok errendimendua bermatzeko programak dituztela, datu-mota jakin batzuetarako (edo guztientzat) gutxienez errendimendu ona agintzen dutenak. Eta ez duzu programa hau ahaztu behar, zure zereginetarako sistema kalkulatuz, sistema jakin baten eraginkortasun koefizientea kontuan hartuta, bolumena aurrez dezakezu. Kontuan izan behar da programa hauek AFA sistemetarako diseinatuta daudela, baina sistema klasikoetan HDDak baino SSD bolumen txikiagoa erosteari esker, horrek kostua murriztuko du, eta disko sistema baten kostua berdina ez bada, orduan. nahiko hurbildu.

Model

Eta hemen galdera zuzenera gatoz.

"Bi biltegiratze aukera eskaintzen dizkidate: ABC SuperStorage S600 eta XYZ HyperOcean 666v4, zer gomendatzen duzu?"

"Hemen bi biltegiratze aukera eskaintzen dizkidate: ABC SuperStorage S600 eta XYZ HyperOcean 666v4, zer gomendatzen duzu?

Xede-karga VMware makina birtualak nahasten dira ekoizpen/proba/garapen begiztekin. Test = produktiboa. 150 TB bakoitzak 80 IOPS-ko errendimendu gorenarekin 000kb blokea %8 ausazko sarbidea 50/80 irakurketa-idazketa. 20 TB garapenerako, 300 IOPS nahikoa da, 50 ausazko, 000 idatzi.

Produktibitatea ustez metroklusterrean RPO = 15 minutu RTO = ordu 1, garapena erreplikazio asinkronoan RPO = 3 ordu, proba gune batean.

50TB DBMS bat egongo da, saioa egitea ona izango litzateke haientzat.

Dell zerbitzariak nonahi ditugu, Hitachi biltegiratze sistema zaharrak, apenas aurre egin dezakete, karga %50 handitzeko asmoa dugu bolumen eta errendimendu aldetik”.

Esaten den moduan, behar bezala formulatutako galdera batek erantzunaren %80 dauka.

Informazio osagarria

Gainera, egileen arabera irakurri beharko zenukeena

liburuak

  • Olifer eta Olifer “Ordenagailu-sareak”. Liburuak IP/Ethernet biltegiratze sistemetarako datu-transmisiorako euskarriak nola funtzionatzen duen sistematizatzen eta agian hobeto ulertzen lagunduko du
  • "EMC informazioa biltegiratzea eta kudeatzea". Biltegiratze sistemen oinarriei buruzko liburu bikaina, zergatik, nola eta zertarako.

Foroak eta txatak

Gomendio orokorrak

Prezioak

Orain, prezioei dagokienez, oro har, biltegiratze sistemen prezioak badaude, normalean Zerrendako prezioak izan ohi dira, eta bezero bakoitzak banakako deskontua jasotzen du. Deskontuaren tamainak parametro ugari ditu, beraz, ezinezkoa da zure enpresak zein azken prezio jasoko duen aurreikustea banatzaileari galdetu gabe. Baina, aldi berean, azkenaldian ohiko informatika-dendetan baxuko modeloak agertzen hasi dira, adibidez, nix.ru edo xcom-shop.ru. Hemen berehala eros dezakezu interesatzen zaizun sistema prezio finko batean, ordenagailuko edozein osagai bezala.

Baina berehala adierazi nahi nuke TB/$-ren zuzeneko konparaketa ez dela zuzena. Ikuspegi honetatik heltzen badiogu, orduan soluzio merkeena JBOD + zerbitzari soil bat izango da, eta horrek ez du emango kontrol bikoitzeko biltegiratze sistema osoak eskaintzen duen malgutasun edo fidagarritasuna. Horrek ez du esan nahi JBOD nazkagarria eta trikimailu zikina denik, irtenbide hau nola eta zertarako erabiliko duzun argi eta garbi ulertu behar duzu berriro. Askotan entzun dezakezu JBODn ez dagoela ezer apurtzeko, atzeko plano bakarra dagoela. Hala ere, atzeko planoek ere batzuetan huts egiten dute. Dena apurtzen da goiz edo beranduago.

Guztira

Beharrezkoa da sistemak elkarren artean alderatzea prezioaren arabera ez ezik, edo errendimenduaren arabera ez ezik, adierazle guztien osotasunean ere.

Erosi HDD HDD behar duzula ziur bazaude soilik. Karga baxuetarako eta datu konprimiezinetarako, bestela, merezi du SSD biltegiratze-eraginkortasuna bermatzeko programetara jotzea, saltzaile gehienek gaur egun dituztenak (eta benetan funtzionatzen dute, baita Errusian ere), baina dena kokatuko diren aplikazio eta datuen araberakoa da. biltegiratze sistema honetan.

Ez joan merke. Batzuetan, une desatsegin asko ezkutatzen dituzte, horietako bat Evgeniy Elizarov-ek buruz idatzitako artikuluetan. Infortrend. Eta hori, azkenean, merketasun horrek atzera egin dezakeela. Ez ahaztu - "azoroak bi aldiz ordaintzen du".

Iturria: www.habr.com

Gehitu iruzkin berria