Kako izbrati shranjevanje, ne da bi se ustrelili v nogo

Predstavitev

Čas je za nakup prostora za shranjevanje. Katerega vzeti, koga poslušati? Prodajalec A govori o prodajalcu B, potem pa je tu še integrator C, ki pove nasprotno in svetuje prodajalcu D. V takšni situaciji se bo tudi izkušenemu arhitektu skladiščenja zvrtelo v glavi, sploh ob vseh novih prodajalcih in SDS ter hiperkonvergenci, ki so v modi. danes.

Torej, kako vse to ugotoviti in ne izpasti norec? mi (AntonVirtual Anton Žbankov in telo Evgeniy Elizarov) poskusimo o tem govoriti v preprosti ruščini.
Članek ima veliko podobnosti in je pravzaprav razširitev "Oblikovanje virtualiziranega podatkovnega centra” v smislu izbire sistemov za shranjevanje in pregleda tehnologij za shranjevanje. Na kratko si bomo ogledali splošno teorijo, vendar priporočamo, da preberete tudi ta članek.

Za kaj

Pogosto lahko opazite situacijo, ko nova oseba pride na forum ali specializiran klepet, kot je Storage Discussions, in postavi vprašanje: »tukaj mi ponujajo dve možnosti shranjevanja - ABC SuperStorage S600 in XYZ HyperOcean 666v4, kaj priporočate ?"

In začne se zmeda o tem, kdo ima kakšne značilnosti izvajanja groznih in nerazumljivih funkcij, ki so za nepripravljeno osebo popolnoma kitajske.

Ključno in prvo vprašanje, ki si ga morate zastaviti že dolgo pred primerjavo specifikacij v komercialnih predlogih, je torej ZAKAJ? Zakaj je potreben ta sistem za shranjevanje?

Kako izbrati shranjevanje, ne da bi se ustrelili v nogo

Odgovor bo nepričakovan in zelo v stilu Tonyja Robbinsa – za shranjevanje podatkov. Hvala, kapitan! Pa vendar se včasih tako poglobimo v primerjanje podrobnosti, da pozabimo, zakaj vse to sploh počnemo.

Torej je naloga sistema za shranjevanje podatkov shranjevanje in zagotavljanje dostopa do PODATKOV z določeno zmogljivostjo. Začeli bomo s podatki.

Podatki

Vrsta podatkov

Kakšne podatke nameravamo shraniti? Zelo pomembno vprašanje, ki lahko mnoge sisteme za shranjevanje izloči iz obravnave. Na primer, nameravate shraniti video posnetke in fotografije. Takoj lahko prečrtate sisteme, zasnovane za naključni dostop v majhnih blokih, ali sisteme z lastniškimi funkcijami pri stiskanju/deduplikaciji. Lahko so to preprosto odlični sistemi, nočemo reči nič slabega. Toda v tem primeru bodo njihove prednosti bodisi oslabele (video in fotografije niso stisnjene) bodisi preprosto znatno povečale stroške sistema.

Nasprotno, če je predvidena uporaba zaseden transakcijski DBMS, potem bodo odlični multimedijski pretočni sistemi, ki lahko zagotavljajo gigabajte na sekundo, slaba izbira.

Količina podatkov

Koliko podatkov nameravamo shraniti? Kvantiteta vedno preraste v kvaliteto, tega ne smemo nikoli pozabiti, še posebej v času eksponentne rasti količine podatkov. Sistemi petabajtnega razreda niso več neobičajni, a večja kot je petabajtna zmogljivost, bolj specifičen postaja sistem, manj dostopna bo običajna funkcionalnost majhnih in srednje velikih sistemov z naključnim dostopom. To je nepomembno, ker same tabele s statistiko dostopa do blokov postanejo večje od razpoložljive količine RAM-a na krmilnikih. Da ne omenjam kompresije/tieringa. Recimo, da želimo algoritem stiskanja preklopiti na zmogljivejšega in stisniti 20 petabajtov podatkov. Kako dolgo bo trajalo: šest mesecev, eno leto?

Po drugi strani, zakaj bi se trudili, če morate shraniti in obdelati 500 GB podatkov? Samo 500. Gospodinjski SSD (z nizkim DWPD) te velikosti ne stanejo nič. Zakaj zgraditi tovarno Fibre Channel in kupiti vrhunske zunanje sisteme za shranjevanje, ki stanejo enakovredno mostu iz litega železa?

Kolikšen odstotek skupnega števila so vroči podatki? Kako neenakomerna je obremenitev glede količine podatkov? Tukaj je lahko tehnologija večplastnega shranjevanja ali Flash Cache zelo koristna, če je količina vročih podatkov majhna v primerjavi s skupno. Ali obratno, z enakomerno obremenitvijo po celotnem volumnu, kar pogosto najdemo pri pretočnih sistemih (videonadzor, nekateri analitični sistemi), takšne tehnologije ne bodo zagotovile ničesar in bodo le podražile/kompleksnost sistema.

IP

Druga stran podatkov je informacijski sistem, ki podatke uporablja. IS ima niz zahtev, ki podedujejo podatke. Za več informacij o IS glejte »Načrt virtualiziranega podatkovnega centra«.

Zahteve glede odpornosti/razpoložljivosti

Zahteve za toleranco napak / razpoložljivost podatkov so podedovane od IS, ki jih uporablja, in so izražene v treh številkah - RPO, RTO, razpoložljivost.

Razpoložljivost — delež za dano časovno obdobje, v katerem so podatki na voljo za delo z njimi. Običajno izraženo kot število 9. Na primer, dve devetki na leto pomenita, da je razpoložljivost 99 %, sicer je dovoljenih 95 ur nedosegljivosti na leto. Tri devetke - 9,5 ure na leto.

RPO / RTO niso skupni kazalniki, ampak za vsak incident (nesreča), v nasprotju z razpoložljivostjo.

RPO — količina podatkov, izgubljenih med nesrečo (v urah). Na primer, če se varnostne kopije izvajajo enkrat na dan, potem je RPO = 24 ur. Tisti. V primeru katastrofe in popolne izgube pomnilniškega sistema se lahko izgubijo podatki do 24 ur (od trenutka varnostne kopije). Na podlagi RPO, določenega za IS, so na primer napisani rezervni predpisi. Prav tako lahko na podlagi RPO razumete, koliko sinhronega/asinhronega podvajanja podatkov je potrebno.

RTO — čas za obnovitev storitve (dostop do podatkov) po katastrofi. Na podlagi dane vrednosti RTO lahko razumemo, ali je potrebna metro gruča ali zadostuje enosmerna replikacija. Potrebujete sistem za shranjevanje z več krmilniki vrhunskega razreda?

Kako izbrati shranjevanje, ne da bi se ustrelili v nogo

Zahteve glede delovanja

Čeprav je to zelo očitno vprašanje, se največ težav pojavi pri tem. Glede na to, ali že imate neko infrastrukturo ali ne, bodo zgrajeni načini za zbiranje potrebnih statističnih podatkov.

Sistem za shranjevanje že imate in iščete zamenjavo ali želite kupiti drugega za razširitev. Tukaj je vse preprosto. Razumete, katere storitve že imate in katere nameravate uvesti v bližnji prihodnosti. Na podlagi trenutnih storitev imate možnost zbiranja statističnih podatkov o uspešnosti. Odločite se o trenutnem številu IOPS in trenutni zakasnitvi – kakšni so ti indikatorji in ali zadostujejo za vaše naloge? To je mogoče storiti tako na samem sistemu za shranjevanje podatkov kot na gostiteljih, ki so z njim povezani.

Poleg tega morate gledati ne le na trenutno obremenitev, ampak na določeno obdobje (po možnosti mesec). Oglejte si, kakšne so največje konice čez dan, kakšno obremenitev ustvari varnostna kopija itd. Če vam vaš sistem za shranjevanje ali njegova programska oprema ne nudi celotnega niza teh podatkov, lahko uporabite brezplačno orodje RRDtool, ki lahko deluje z večino najbolj priljubljenih sistemov za shranjevanje in stikal ter vam lahko zagotovi podrobno statistiko delovanja. Prav tako je vredno pogledati obremenitev gostiteljev, ki delajo s tem sistemom za shranjevanje, za določene virtualne stroje ali kaj točno se izvaja na tem gostitelju.

Kako izbrati shranjevanje, ne da bi se ustrelili v nogo

Ločeno je treba omeniti, da če se zamude na nosilcu in podatkovni shrambi, ki se nahaja na tem nosilcu, precej razlikujejo, bodite pozorni na svoje omrežje SAN, obstaja velika verjetnost, da so težave z njim, in preden kupite novo sistema, je vredno preučiti to vprašanje, ker obstaja zelo velika verjetnost povečanja zmogljivosti trenutnega sistema.

Gradite infrastrukturo iz nič ali pa kupujete sistem za neko novo storitev, katere obremenitev se ne zavedate. Obstaja več možnosti: komunicirajte s kolegi na specializiranih virih, da poskusite ugotoviti in predvideti obremenitev, se obrnite na integratorja, ki ima izkušnje z izvajanjem podobnih storitev in vam lahko izračuna obremenitev. In tretja možnost (običajno najtežje, še posebej, če gre za doma napisane ali redke aplikacije) je, da poskusite od razvijalcev sistema izvedeti zahteve glede zmogljivosti.

In upoštevajte, najbolj pravilna možnost z vidika praktične uporabe je pilot na trenutni opremi ali opremi, ki jo za testiranje zagotovi prodajalec/integrator.

Posebne zahteve

Posebne zahteve so vse, kar ne sodi med zahteve glede zmogljivosti, tolerance napak in funkcionalnosti za neposredno obdelavo in posredovanje podatkov.

Ena najpreprostejših posebnih zahtev za sistem za shranjevanje podatkov se lahko imenuje "odtujljivi pomnilniški medij". In takoj postane jasno, da mora ta sistem za shranjevanje podatkov vključevati tračno knjižnico ali preprosto tračni pogon, na katerega se shrani varnostna kopija. Nato posebej usposobljena oseba podpiše trak in ga ponosno odnese v poseben sef.
Drug primer posebne zahteve je zaščitena oblika, odporna na udarce.

kjer je

Druga glavna komponenta pri izbiri določenega skladiščnega sistema je informacija o tem, KJE bo ta skladiščni sistem nameščen. Začenši z geografijo ali podnebnimi razmerami in konča z osebjem.

Kupec

Za koga je načrtovan ta skladiščni sistem? Vprašanje ima naslednje razloge:

Državna stranka/komerciala.
Komercialni naročnik nima nobenih omejitev in niti ni dolžan izvajati razpisov, razen v skladu z lastnimi internimi predpisi.

Državna stranka je nekaj drugega. 44 zveznega zakona in drugih razpisov in tehničnih specifikacij, ki jih je mogoče izpodbijati.

Stranka je pod sankcijami
No, vprašanje je tukaj zelo preprosto - izbira je omejena le s ponudbami, ki so na voljo dani stranki.

Interni predpisi / prodajalci / modeli, dovoljeni za nakup
Vprašanje je tudi izjemno preprosto, vendar si ga morate zapomniti.

Kje fizično

V tem delu obravnavamo vsa vprašanja glede geografije, komunikacijskih kanalov in mikroklime v namestitvenih prostorih.

osebje

Kdo bo delal s tem sistemom za shranjevanje? To ni nič manj pomembno od tega, kar lahko stori sam sistem za shranjevanje.
Ne glede na to, kako obetaven, kul in čudovit je sistem za shranjevanje od prodajalca A, ga verjetno nima smisla nameščati, če osebje ve, kako delati samo s prodajalcem B, in ni načrtov za nadaljnje nakupe in nadaljnje sodelovanje z A.

In seveda, druga plat vprašanja je, koliko je na voljo usposobljeno osebje na določeni geografski lokaciji neposredno v podjetju in potencialno na trgu dela. Za regije je lahko izbira sistemov za shranjevanje s preprostimi vmesniki ali možnostjo daljinskega centraliziranega upravljanja zelo smiselna. V nasprotnem primeru lahko na neki točki postane neznosno boleče. Internet je poln zgodb o tem, kako je novi zaposleni, ki je prišel, včerajšnji študent, konfiguriral tako stvar, da je bila celotna pisarna ubita.

Kako izbrati shranjevanje, ne da bi se ustrelili v nogo

Okolje

In seveda je pomembno vprašanje, v kakšnem okolju bo ta sistem za shranjevanje deloval.

  • Kaj pa napajanje/hlajenje?
  • Kakšna povezava
  • Kje bo nameščen?
  • In tako naprej.

Pogosto se ta vprašanja jemljejo kot samoumevna in se ne upoštevajo posebej, včasih pa so tista, ki lahko vse obrnejo.

Kaj

Prodajalec

Od danes (sredi leta 2019) lahko ruski trg za shranjevanje razdelimo v 5 kategorij:

  1. Najvišja divizija so uveljavljena podjetja s široko paleto diskovnih polic od najpreprostejših do hi-end (HPE, DellEMC, Hitachi, NetApp, IBM / Lenovo)
  2. Druga divizija - podjetja z omejeno linijo, nišni igralci, resni prodajalci SDS ali novinci v vzponu (Fujitsu, Datacore, Infinidat, Huawei, Pure itd.)
  3. Tretja divizija - nišne rešitve v nižjem rangu, poceni SDS, napredni izdelki na osnovi ceph in drugi odprti projekti (Infortrend, Starwind itd.)
  4. SOHO segment - mali in ultra majhni sistemi za shranjevanje na nivoju doma/majhne pisarne (Synology, QNAP itd.)
  5. Uvozno nadomeščeni sistemi za shranjevanje - to vključuje tako strojno opremo prve divizije s preoznačenimi oznakami kot redke predstavnike druge (RAIDIX, drugo jim damo vnaprej), vendar je to predvsem tretja divizija (Aerodisk, Baum, Depo itd.)

Delitev je precej poljubna in nikakor ne pomeni, da je tretji oziroma SOHO segment slab in ga ni mogoče uporabiti. V specifičnih projektih z jasno definiranim naborom podatkov in obremenitvenim profilom se lahko zelo dobro obnesejo in daleč prekašajo prvo divizijo po razmerju cena/kakovost. Pomembno je, da se najprej odločite za svoje cilje, možnosti rasti in zahtevano funkcionalnost - in takrat vam bo Synology zvesto služil, vaši lasje pa bodo postali mehki in svilnati.

Eden od pomembnih dejavnikov pri izbiri prodajalca je trenutno okolje. Koliko sistemov za shranjevanje že imate in s katerimi sistemi za shranjevanje lahko delajo vaši inženirji. Potrebujete drugega prodajalca, drugo kontaktno točko, ali boste celotno obremenitev postopoma preselili s prodajalca A na prodajalca B?

Ne bi smeli ustvarjati entitet, ki presegajo potrebno.

iSCSI/FC/Datoteka

Med inženirji ni soglasja o vprašanju protokolov za dostop in razprava spominja bolj na teološke kot na inženirske. Toda na splošno je mogoče opozoriti na naslednje točke:

FCoE bolj mrtev kot živ.

FC proti iSCSI. Ena od ključnih prednosti FC v letu 2019 pred shranjevanjem IP, namensko tovarno za dostop do podatkov, je izravnana z namenskim omrežjem IP. FC nima globalnih prednosti pred omrežji IP, IP pa se lahko uporablja za izgradnjo sistemov za shranjevanje katere koli stopnje obremenitve, do sistemov za težke DBMS za osrednji bančni sistem velike banke. Po drugi strani pa se FC že nekaj let prerokuje smrt, ki pa jo nenehno nekaj preprečuje. Danes na primer nekateri igralci na trgu za shranjevanje podatkov aktivno razvijajo standard NVMEoF. Ali bo delil usodo FCoE - bo pokazal čas.

Dostop do datoteke tudi ni nekaj nevrednega pozornosti. NFS/CIFS dobro deluje v produktivnih okoljih in, če je pravilno zasnovan, nima več pritožb kot blokovni protokoli.

Hybrid / All Flash Array

Klasični sistemi za shranjevanje so v dveh vrstah:

  1. AFA (All Flash Array) - sistemi, optimizirani za uporabo SSD.
  2. Hibridni - omogoča uporabo tako HDD kot SSD ali kombinacije njunih.

Njihova glavna razlika so podprte tehnologije za učinkovitost shranjevanja in najvišja raven zmogljivosti (visok IOPS in nizka zakasnitev). Oba sistema (v večini njunih modelov, ne da bi upoštevali nizkocenovni segment) lahko delujeta kot blokovni in datotečni napravi. Podprta funkcionalnost je odvisna od nivoja sistema, pri mlajših modelih pa je največkrat znižana na minimalno raven. Na to je vredno biti pozoren, ko preučujete značilnosti določenega modela in ne le zmogljivosti celotne linije kot celote. Seveda pa so od nivoja sistema odvisne tudi njegove tehnične lastnosti, kot so procesor, količina pomnilnika, predpomnilnik, število in tipi vrat itd. Z vidika upravljanja se AFA od hibridnih (disknih) sistemov razlikujejo le po implementaciji mehanizmov za delo s SSD diski, pa tudi če uporabljate SSD v hibridnem sistemu, to sploh ne pomeni, da boste lahko doseči raven zmogljivosti na ravni sistema AFA. Prav tako so v večini primerov vgrajeni učinkoviti mehanizmi za shranjevanje onemogočeni na hibridnih sistemih, njihova vključitev pa povzroči izgubo zmogljivosti.

Posebni sistemi za shranjevanje

Poleg splošnih sistemov za shranjevanje podatkov, osredotočenih predvsem na operativno obdelavo podatkov, obstajajo posebni sistemi za shranjevanje s ključnimi principi, ki se bistveno razlikujejo od običajnih (nizka latenca, visok IOPS):

Mediji.

Ti sistemi so zasnovani za shranjevanje in obdelavo velikih medijskih datotek. oz. zakasnitev postane praktično nepomembna, v ospredje pa stopi možnost pošiljanja in sprejemanja podatkov v širokem pasu v številnih vzporednih tokovih.

Dedupliciranje sistemov za shranjevanje za varnostne kopije.

Ker se varnostne kopije odlikujejo po medsebojni podobnosti, kar je v normalnih razmerah redko (povprečna varnostna kopija se od včerajšnje kopije razlikuje za 1-2 %), ta razred sistemov izjemno učinkovito zapakira na njih zapisane podatke v razmeroma majhnem obsegu. število fizičnih medijev. Na primer, v nekaterih primerih lahko razmerje stiskanja podatkov doseže 200 proti 1.

Sistemi za shranjevanje predmetov.

Ti sistemi za shranjevanje nimajo običajnih količin blokovnega dostopa in deljenja datotek, predvsem pa so podobni ogromni podatkovni bazi. Dostop do objekta, shranjenega v takem sistemu, se izvaja z enoličnim identifikatorjem ali metapodatki (na primer vsi objekti formata JPEG z datumom nastanka med XX-XX-XXXX in YY-YY-YYYY).

Sistem skladnosti.

Danes v Rusiji niso tako pogosti, vendar jih je vredno omeniti. Namen takih sistemov za shranjevanje je zajamčeno shranjevanje podatkov v skladu z varnostnimi politikami ali regulativnimi zahtevami. Nekateri sistemi (npr. EMC Centera) imajo vgrajeno funkcijo prepovedi brisanja podatkov – takoj ko se ključ obrne in sistem preide v ta način, ne administrator ne kdo drug ne more fizično izbrisati že zapisanih podatkov.

Lastniške tehnologije

Flash predpomnilnik

Flash Cache je skupno ime za vse lastniške tehnologije za uporabo bliskovnega pomnilnika kot predpomnilnika druge ravni. Pri uporabi bliskovnega predpomnilnika je sistem za shranjevanje običajno izračunan tako, da zagotavlja enakomerno obremenitev z magnetnih diskov, medtem ko vrh služi predpomnilniku.

V tem primeru je treba razumeti profil obremenitve in stopnjo lokalizacije dostopa do blokov prostorov za shranjevanje. Flash cache je tehnologija za delovne obremenitve z visoko lokaliziranimi poizvedbami in je praktično neuporabna za enakomerno naložene količine (na primer za analitične sisteme).

Na trgu sta na voljo dve izvedbi bliskovnega predpomnilnika:

  • Le za branje. V tem primeru se v predpomnilnik shranijo samo prebrani podatki, pisanje pa gre neposredno na diske. Nekateri proizvajalci, kot je NetApp, verjamejo, da je pisanje v njihove sisteme za shranjevanje že optimalno in predpomnilnik ne bo prav nič pomagal.
  • Brati, pisati. Predpomnilnik ni samo branje, ampak tudi pisanje, kar vam omogoča, da medpomnite tok in zmanjšate vpliv RAID Penalty ter posledično povečate splošno zmogljivost sistemov za shranjevanje z manj optimalnim mehanizmom zapisovanja.

Raven

Večnivojsko shranjevanje (utrujajoče) je tehnologija za združevanje ravni z različnimi stopnjami zmogljivosti, kot sta SSD in HDD, v eno samo diskovno področje. V primeru izrazite neenakomernosti dostopa do podatkovnih blokov bo sistem lahko samodejno uravnotežil podatkovne bloke, tako da bo naložene premaknil na visoko zmogljivo raven, hladne pa, nasprotno, na počasnejšo.

Hibridni sistemi nižjega in srednjega razreda uporabljajo večnivojsko shranjevanje podatkov s premikanjem podatkov med nivoji po urniku. Hkrati je velikost večnivojskega pomnilniškega bloka za najboljše modele 256 MB. Te lastnosti nam ne omogočajo, da bi tehnologijo večplastnega shranjevanja obravnavali kot tehnologijo za povečanje produktivnosti, kot mnogi zmotno verjamejo. Večnivojsko shranjevanje v sistemih nižjega in srednjega razreda je tehnologija za optimizacijo stroškov skladiščenja za sisteme z izrazito neenakomerno obremenitvijo.

Posnetek

Ne glede na to, koliko govorimo o zanesljivosti sistemov za shranjevanje, obstaja veliko možnosti za izgubo podatkov, ki niso odvisne od težav s strojno opremo. To so lahko virusi, hekerji ali kateri koli drug nenamerni izbris/poškodba podatkov. Iz tega razloga je varnostno kopiranje proizvodnih podatkov sestavni del dela inženirja.

Posnetek je posnetek nosilca v nekem trenutku. Pri delu z večino sistemov, kot so virtualizacija, baze podatkov itd. narediti moramo takšen posnetek, iz katerega bomo kopirali podatke v varnostno kopijo, naš IS pa bo lahko varno nadaljeval delo s tem nosilcem. Vendar si velja zapomniti, da niso vsi posnetki enako uporabni. Različni prodajalci imajo različne pristope k ustvarjanju posnetkov, povezanih z njihovo arhitekturo.

CoW (Copy-On-Write). Ko poskušate zapisati podatkovni blok, se njegova izvirna vsebina prekopira v posebno območje, nato pa pisanje poteka normalno. To prepreči poškodbe podatkov znotraj posnetka. Seveda vse te "parazitske" manipulacije podatkov povzročajo dodatno obremenitev sistema za shranjevanje, zato prodajalci s podobnimi izvedbami ne priporočajo uporabe več kot ducata posnetkov in jih sploh ne uporabljajo na visoko obremenjenih nosilcih.

RoW (preusmeritev ob pisanju). V tem primeru izvirni nosilec naravno zamrzne in ko poskuša zapisati podatkovni blok, sistem za shranjevanje zapiše podatke v posebno območje v prostem prostoru in spremeni lokacijo tega bloka v tabeli metapodatkov. To vam omogoča zmanjšanje števila operacij ponovnega pisanja, kar na koncu odpravi padec zmogljivosti in odstrani omejitve za posnetke in njihovo število.

Tudi posnetki so glede na aplikacije dveh vrst:

Konsistentnost uporabe. V trenutku ustvarjanja posnetka sistem za shranjevanje potegne agenta v uporabnikovem operacijskem sistemu, ki prisilno izpere predpomnilnik diska iz pomnilnika na disk in prisili aplikacijo, da to stori. V tem primeru bodo podatki pri obnavljanju iz posnetka skladni.

Zrušitev dosledna. V tem primeru se nič takega ne zgodi in posnetek je ustvarjen tak, kot je. V primeru obnovitve po takem posnetku je slika enaka tisti, ki bi se zgodila, če bi nenadoma izklopili napajanje in je možna izguba nekaterih podatkov, obtičali so v predpomnilnikih in nikoli ne bi dosegli diska. Takšne posnetke je lažje implementirati in ne povzročajo poslabšanja delovanja aplikacij, vendar so manj zanesljivi.

Zakaj so potrebni posnetki v sistemih za shranjevanje?

  • Varnostno kopiranje brez agentov neposredno iz sistema za shranjevanje
  • Ustvarite testna okolja na podlagi dejanskih podatkov
  • V primeru sistemov za shranjevanje datotek se lahko uporablja za ustvarjanje okolij VDI z uporabo posnetkov sistema za shranjevanje namesto hipervizorja
  • Zagotovite nizke RPO z ustvarjanjem načrtovanih posnetkov s pogostostjo, ki je znatno višja od frekvence varnostnega kopiranja

Kloniranje

Kloniranje obsega - deluje po podobnem principu kot posnetki, vendar se ne uporablja samo za branje podatkov, ampak za celotno delo z njimi. Dobimo lahko natančno kopijo našega zvezka z vsemi podatki na njem, ne da bi naredili fizično kopijo, kar bo prihranilo prostor. Običajno se kloniranje obsega uporablja v Test&Dev ali če želite preveriti delovanje nekaterih posodobitev v vašem IS. Kloniranje vam bo omogočilo, da to storite čim hitreje in čim bolj ekonomično glede na diskovne vire, saj Zapisani bodo samo spremenjeni podatkovni bloki.

Replikacija / dnevnik

Replikacija je mehanizem za ustvarjanje kopije podatkov na drugem fizičnem sistemu za shranjevanje. Običajno ima vsak prodajalec lastniško tehnologijo, ki deluje samo znotraj njegove linije. Obstajajo pa tudi rešitve tretjih oseb, vključno s tistimi, ki delujejo na ravni hipervizorja, kot je VMware vSphere Replication.

Funkcionalnost lastniških tehnologij in enostavnost njihove uporabe sta običajno veliko boljša od univerzalnih, vendar se izkažeta za neuporabna, ko je na primer potrebno narediti repliko iz NetApp v HP MSA.

Podvajanje je razdeljeno na dve podvrsti:

Sinhrono. V primeru sinhronega podvajanja je operacija pisanja takoj poslana v drugi sistem za shranjevanje in izvedba ni potrjena, dokler sistem za oddaljeno shranjevanje ne potrdi. Zaradi tega se zakasnitev dostopa poveča, vendar imamo natančno zrcalno kopijo podatkov. Tisti. RPO = 0 v primeru izgube glavnega skladiščnega sistema.

asinhroni. Operacije pisanja se izvajajo samo na glavnem pomnilniškem sistemu in so takoj potrjene, hkrati pa se kopičijo v medpomnilniku za paketni prenos v oddaljeni pomnilniški sistem. Ta vrsta replikacije je ustrezna za manj vredne podatke ali za kanale z nizko pasovno širino ali visoko zakasnitvijo (tipično za razdalje nad 100 km). V skladu s tem je RPO = frekvenca pošiljanja paketov.

Pogosto skupaj z replikacijo obstaja mehanizem sečnja diskovne operacije. V tem primeru je za sečnjo dodeljeno posebno območje in shranjeni so zapisovalni postopki določene globine v času ali omejeni z obsegom hloda. Pri nekaterih lastniških tehnologijah, kot je EMC RecoverPoint, obstaja integracija s sistemsko programsko opremo, ki vam omogoča, da določene zaznamke povežete z določenim vnosom v dnevnik. Zahvaljujoč temu je mogoče stanje nosilca povrniti nazaj (ali ustvariti klon) ne samo na 23. april, 11 ur 59 sekund in 13 milisekund, ampak na trenutek pred »IZPUSTI VSE TABELE; ZVEZI se.”

Metro grozd

Metro cluster je tehnologija, ki omogoča ustvarjanje dvosmerne sinhrone replikacije med dvema sistemoma za shranjevanje na tak način, da je ta par od zunaj videti kot en sistem za shranjevanje. Uporablja se za ustvarjanje grozdov z geografsko ločenimi kraki na metro razdaljah (manj kot 100 km).

Na podlagi primera uporabe v virtualizacijskem okolju vam metrocluster omogoča ustvarjanje podatkovne shrambe z virtualnimi stroji, dostopnimi za snemanje iz dveh podatkovnih centrov hkrati. V tem primeru se na ravni hipervizorja ustvari gruča, ki jo sestavljajo gostitelji v različnih fizičnih podatkovnih centrih, ki so povezani s to podatkovno shrambo. Kar vam omogoča naslednje:

  • Popolna avtomatizacija postopka obnovitve po smrti enega od podatkovnih centrov. Brez kakršnih koli dodatnih sredstev se bodo vsi navidezni računalniki, ki se izvajajo v pokojnem podatkovnem centru, samodejno znova zagnali v preostalem. RTO = časovna omejitev gruče visoke razpoložljivosti (15 sekund za VMware) + čas za nalaganje operacijskega sistema in zagon storitev.
  • Izogibanje katastrofam ali po rusko izogibanje katastrofam. Če so v podatkovnem centru 1 predvidena dela napajalne enote, imamo možnost celotno pomembno obremenitev preseliti v podatkovni center 2 non stop vnaprej, pred začetkom del.

Virtualizacija

Virtualizacija shranjevanja je tehnično uporaba nosilcev iz drugega pomnilniškega sistema kot diskov. Virtualizator shranjevanja lahko uporabniku preprosto prenese nosilec nekoga drugega kot svojega, ga hkrati zrcali v drug sistem shranjevanja ali celo ustvari RAID iz zunanjih nosilcev.
Klasična predstavnika v virtualizacijskem razredu skladiščenja sta EMC VPLEX in IBM SVC. In seveda sistemi za shranjevanje s funkcionalnostjo virtualizacije - NetApp, Hitachi, IBM / Lenovo Storwize.

Zakaj je morda potrebno?

  • Redundanca na ravni skladiščnega sistema. Med nosilci se ustvari ogledalo, ena polovica je lahko na HP 3Par, druga pa na NetApp. In virtualizator je od EMC.
  • Premikanje podatkov z minimalnimi izpadi med sistemi za shranjevanje različnih proizvajalcev. Predpostavimo, da je treba podatke preseliti iz starega 3Par, ki bo odpisan, v novi Dell. V tem primeru so porabniki odklopljeni od 3Par, količine se prenesejo pod VPLEX in se ponovno prikažejo porabnikom. Ker se na glasnosti ni spremenilo niti malo, se delo nadaljuje. Postopek zrcaljenja glasnosti v novi Dell se začne v ozadju in po zaključku se zrcalo pokvari in 3Par je onemogočen.
  • Organizacija metroclustrov.

Stiskanje/deduplikacija

Stiskanje in deduplikacija sta tehnologiji, ki vam omogočata, da prihranite prostor na disku v sistemu za shranjevanje. Takoj je treba omeniti, da vsi podatki načeloma niso podvrženi stiskanju in / ali deduplikaciji, medtem ko so nekatere vrste podatkov bolje stisnjene in deduplicirane, nekatere pa obratno.

Obstajata dve vrsti stiskanja in deduplikacije:

V vrsti — pride do stiskanja in deduplikacije podatkovnih blokov, preden se ti podatki zapišejo na disk. Tako sistem samo izračuna hash bloka in ga v tabeli primerja z obstoječimi. Prvič, hitrejši je kot samo pisanje na disk, drugič pa ne zapravljamo dodatnega prostora na disku.

Prispevek - ko se te operacije izvajajo na že posnetih podatkih, ki se nahajajo na diskih. Skladno s tem se podatki najprej zapišejo na disk, šele nato se izračuna hash in izbrišejo nepotrebni bloki ter sprostijo viri diska.

Omeniti velja, da večina prodajalcev uporablja obe vrsti, kar jim omogoča optimizacijo teh procesov in s tem povečanje njihove učinkovitosti. Večina prodajalcev pomnilnikov ima pripomočke, ki vam omogočajo analizo naborov podatkov. Ti pripomočki delujejo po isti logiki, ki je implementirana v sistemu za shranjevanje, zato bo ocenjena stopnja učinkovitosti enaka. Upoštevajte tudi, da ima veliko prodajalcev programe za zagotavljanje zmogljivosti, ki obljubljajo vsaj enako dobro zmogljivost za določene (ali vse) vrste podatkov. In tega programa ne smete zanemariti, saj lahko z izračunom sistema za svoje naloge ob upoštevanju koeficienta učinkovitosti določenega sistema prihranite pri glasnosti. Upoštevati je treba tudi, da so ti programi zasnovani za sisteme AFA, vendar bo zaradi nakupa manjšega obsega SSD diskov kot HDD v klasičnih sistemih to znižalo njihove stroške in če ne bo enako strošku diskovnega sistema, potem priti čisto blizu.

Model

In tu smo pri pravem vprašanju.

»Ponujajo mi dve možnosti shranjevanja - ABC SuperStorage S600 in XYZ HyperOcean 666v4, kaj priporočate?«

Spremeni se v »Tukaj mi ponujajo dve možnosti shranjevanja - ABC SuperStorage S600 in XYZ HyperOcean 666v4, kaj priporočate?

Ciljna obremenitev so mešani virtualni stroji VMware s proizvodnimi/testnimi/razvojnimi zankami. Test = produktiven. 150 TB vsak z najvišjo zmogljivostjo 80 IOPS 000kb blok 8 % naključni dostop 50/80 branje-pisanje. 20 TB za razvoj, 300 IOPS je dovolj, 50 random, 000 write.

Produktivnost predvidoma v metroclustru RPO = 15 minut RTO = 1 ura, razvoj v asinhroni replikaciji RPO = 3 ure, test na enem mestu.

Tam bo 50TB DBMS, beleženje bi jim prišlo prav.

Strežnike Dell imamo povsod, stare sisteme za shranjevanje Hitachi, ki komaj zmorejo, načrtujemo povečanje obremenitve za 50 % v smislu količine in zmogljivosti.”

Kot pravijo, pravilno oblikovano vprašanje vsebuje 80% odgovora.

dodatne informacije

Kaj bi morali po mnenju avtorjev dodatno prebrati

knjige

  • Olifer in Olifer “Računalniška omrežja”. Knjiga bo pomagala sistematizirati in morda bolje razumeti, kako deluje medij za prenos podatkov za sisteme za shranjevanje IP / Ethernet
  • "EMC informacijsko shranjevanje in upravljanje." Odlična knjiga o osnovah sistemov za shranjevanje, zakaj, kako in zakaj.

Forumi in klepeti

Splošna priporočila

cene

Zdaj, kar se tiče cen - na splošno, če obstajajo cene za sisteme za shranjevanje, so to običajno cene po ceniku, od katerih vsaka stranka prejme individualni popust. Velikost popusta je sestavljena iz velikega števila parametrov, zato je preprosto nemogoče napovedati, kakšno končno ceno bo prejelo vaše podjetje, ne da bi vprašali distributerja. Hkrati pa so se v zadnjem času v običajnih računalniških trgovinah začeli pojavljati modeli nižjega cenovnega razreda, kot je npr. nix.ru ali xcom-shop.ru. Tukaj lahko takoj kupite sistem, ki vas zanima, po fiksni ceni, kot vse računalniške komponente.

Vendar bi rad takoj opozoril, da neposredna primerjava s TB/$ ni pravilna. Če se tega lotimo s tega vidika, bo najcenejša rešitev preprost strežnik JBOD +, ki ne bo zagotavljal ne fleksibilnosti ne zanesljivosti, ki jo zagotavlja polnopravni sistem za shranjevanje z dvojnim krmilnikom. To sploh ne pomeni, da je JBOD odvraten in grd umazan trik, le še enkrat morate zelo jasno razumeti, kako in za kakšne namene boste to rešitev uporabljali. Pogosto lahko slišite, da v JBOD ni ničesar zlomiti, obstaja samo ena hrbtna plošča. Vendar tudi hrbtne plošče včasih odpovejo. Vse se prej ali slej zlomi.

Skupno

Sisteme je treba primerjati med seboj ne samo po ceni ali ne samo po zmogljivosti, temveč po celoti vseh kazalnikov.

Trdi disk kupite le, če ste prepričani, da ga potrebujete. Za nizke obremenitve in nestisljive vrste podatkov se sicer splača obrniti na programe za zagotavljanje učinkovitosti shranjevanja SSD, ki jih ima zdaj večina prodajalcev (in res delujejo, tudi v Rusiji), vendar je vse odvisno od aplikacij in podatkov, ki se bodo nahajali na tem sistemu za shranjevanje.

Ne posegajte po poceni. Včasih se za njimi skriva veliko neprijetnih trenutkov, enega izmed njih je Evgeniy Elizarov opisal v svojih člankih o Infortrend. In da se ti na koncu ta cenenost lahko povrne. Ne pozabite - "skopuh plača dvakrat."

Vir: www.habr.com

Dodaj komentar