Kuidas valida hoiuruumi ilma jalga tulistamata

Sissejuhatus

On aeg hoiuruumi osta. Kumba võtta, keda kuulata? Müüja A räägib müüjast B ja siis on integraator C, kes räägib vastupidist ja nõustab müüjat D. Sellises olukorras läheb isegi kogenud laoarhitekti pea ringi, eriti kui tegemist on kõigi uute müüjate ja SDS-ide ning hüperkonvergentsiga, mis on moes. täna.

Niisiis, kuidas sellest kõigest aru saada ja mitte lolliks jääda? Meie (AntonVirtual Anton Žbankov ja keha Jevgeni Elizarov) proovime sellest tavalises vene keeles rääkida.
Artiklil on palju sarnasusi ja see on tegelikult artikli "Virtualiseeritud andmekeskuse disain” salvestussüsteemide valiku ja salvestustehnoloogiate ülevaatamise osas. Vaatame lühidalt üldist teooriat, kuid soovitame lugeda ka seda artiklit.

Mida

Tihti võib näha olukorda, kus foorumisse või spetsiaalsesse vestlusesse (nt Storage Discussions) tuleb uus inimene ja esitab küsimuse: "Siin nad pakuvad mulle kahte salvestusvõimalust - ABC SuperStorage S600 ja XYZ HyperOcean 666v4, mida te soovitate ?”

Ja algab segadus, kellel on kohutavate ja arusaamatute funktsioonide rakendamise tunnused, mis ettevalmistamata inimese jaoks on täiesti hiinapärased.

Niisiis, peamine ja kõige esimene küsimus, mille peate endalt küsima juba ammu enne kommertspakkumiste spetsifikatsioonide võrdlemist, on MIKS? Miks seda salvestussüsteemi vaja on?

Kuidas valida hoiuruumi ilma jalga tulistamata

Vastus on ootamatu ja väga Tony Robbinsi stiilis - andmete salvestamiseks. Aitäh, kapten! Ja ometi jõuame mõnikord detailide võrdlemisse nii sügavale, et unustame, miks me seda kõike üldse teeme.

Seega on andmesalvestussüsteemi ülesanne ANDMETE salvestamine ja neile juurdepääsu võimaldamine etteantud jõudlusega. Alustame andmetega.

Andmed

Andmetüüp

Milliseid andmeid plaanime salvestada? Väga oluline küsimus, mis võib paljud salvestussüsteemid isegi kaalumisest välja jätta. Näiteks plaanite salvestada videoid ja fotosid. Saate koheselt läbi kriipsutada süsteemid, mis on loodud juhuslikuks juurdepääsuks väikestes plokkides, või süsteemid, millel on pakkimise / dubleerimise patenteeritud funktsioonid. Need võivad olla lihtsalt suurepärased süsteemid, me ei taha midagi halba öelda. Kuid sel juhul muutuvad nende tugevad küljed nõrgaks (videot ja fotosid ei tihendata) või lihtsalt suurendavad oluliselt süsteemi maksumust.

Ja vastupidi, kui kavandatud kasutusala on hõivatud tehingutega seotud DBMS-i, on suurepärased multimeediumi voogedastussüsteemid, mis on võimelised edastama gigabaite sekundis, halb valik.

Andmemaht

Kui palju andmeid plaanime salvestada? Kvantiteet areneb alati kvaliteediks; seda ei tohiks kunagi unustada, eriti meie andmemahu eksponentsiaalse kasvu ajal. Petabaitide klassi süsteemid pole enam haruldased, kuid mida suurem on petabaitide mahutavus, seda spetsiifilisemaks süsteem muutub, seda vähem kättesaadavaks jääb väikeste ja keskmise suurusega suvapöördussüsteemide tavapärane funktsionaalsus. See on triviaalne, sest ainuüksi plokkide juurdepääsu statistika tabelid muutuvad suuremaks kui kontrollerite saadaolev RAM-i hulk. Rääkimata kokkusurumisest/astmest. Oletame, et tahame vahetada tihendusalgoritmi võimsama vastu ja tihendada 20 petabaiti andmeid. Kui kaua see aega võtab: kuus kuud, aasta?

Teisest küljest, milleks vaeva näha, kui on vaja salvestada ja töödelda 500 GB andmeid? Ainult 500. Sellise suurusega kodumajapidamises kasutatavad SSD-d (madala DWPD-ga) ei maksa midagi. Miks ehitada Fibre Channeli tehas ja osta tipptasemel väliseid salvestussüsteeme, mis maksavad samaväärselt malmsillaga?

Kui suur protsent kogusummast on kuumad andmed? Kui ebaühtlane on koormus andmemahu osas? Siin võib mitmetasandiline salvestustehnoloogia või Flash-vahemälu olla väga kasulik, kui kuumade andmete hulk on koguarvuga võrreldes väike. Või vastupidi, ühtlase koormuse korral kogu helitugevuse ulatuses, mida sageli leidub voogedastussüsteemides (videovalve, mõned analüüsisüsteemid), ei anna sellised tehnoloogiad midagi ja suurendavad ainult süsteemi maksumust / keerukust.

IP

Andmete teine ​​pool on andmeid kasutav infosüsteem. IS-l on nõuete kogum, mis pärib andmeid. IS-i kohta lisateabe saamiseks vaadake jaotist "Virtualiseeritud andmekeskuse disain".

Vastupidavus/kättesaadavuse nõuded

Nõuded tõrketaluvusele / andmete kättesaadavusele on päritud neid kasutavast IS-ist ja on väljendatud kolmes numbris - RPO, OTR, kättesaadavus.

Kättesaadavus — osa teatud aja jooksul, mille jooksul on nendega töötamiseks kättesaadavad andmed. Tavaliselt väljendatakse arvuna 9. Näiteks kaks üheksat aastas tähendab, et saadavus on 99% või muidu on aastas lubatud 95 tundi mittekättesaadavust. Kolm üheksat – 9,5 tundi aastas.

RPO / RTO ei ole kogunäitajad, vaid erinevalt kättesaadavusest iga juhtumi (õnnetuse) kohta.

RPO — õnnetuse käigus kaotatud andmete hulk (tundides). Näiteks kui varukoopiaid tehakse üks kord päevas, siis RPO = 24 tundi. Need. Õnnetuse ja salvestussüsteemi täieliku kadumise korral võivad andmed kaduda kuni 24 tundi (alates varundamise hetkest). IS-i jaoks määratud RPO alusel kirjutatakse näiteks varumäärused. Samuti saate RPO põhjal aru, kui palju sünkroonset/asünkroonset andmete replikatsiooni on vaja.

OTR — aeg teenuse taastamiseks (juurdepääs andmetele) pärast katastroofi. Antud RTO väärtuse põhjal saame aru, kas on vaja metrooklastrit või piisab ühesuunalisest replikatsioonist. Kas vajate tippklassi mitme kontrolleri salvestussüsteemi?

Kuidas valida hoiuruumi ilma jalga tulistamata

Jõudlusnõuded

Kuigi see on väga ilmselge küsimus, kerkib see kõige raskustesse. Sõltuvalt sellest, kas teil on juba mingisugune infrastruktuur või mitte, ehitatakse välja võimalused vajaliku statistika kogumiseks.

Teil on juba salvestussüsteem ja otsite asendust või soovite laiendamiseks osta teise. Siin on kõik lihtne. Saate aru, millised teenused teil juba on ja mida kavatsete lähiajal kasutusele võtta. Praeguste teenuste põhjal on teil võimalus koguda jõudlusstatistikat. Otsustage praegune IOPS-i arv ja praegune latentsusaeg – millised need näitajad on ja kas neist piisab teie ülesannete täitmiseks? Seda saab teha nii andmesalvestussüsteemis endas kui ka sellega ühendatud hostides.

Pealegi peate vaatama mitte ainult praegust koormust, vaid teatud perioodi (eelistatavalt kuu) jooksul. Vaata, millised on maksimaalsed tipud päeval, millise koormuse varundus loob jne. Kui teie salvestussüsteem või selle tarkvara ei paku teile nende andmete täielikku komplekti, võite kasutada tasuta RRDtool'i, mis töötab enamiku populaarsemate salvestussüsteemide ja lülititega ning pakub üksikasjalikku jõudlusstatistikat. Samuti tasub vaadata selle salvestussüsteemiga töötavate hostide koormust konkreetsete virtuaalmasinate puhul või seda, mis sellel hostil täpselt töötab.

Kuidas valida hoiuruumi ilma jalga tulistamata

Eraldi tasub märkida, et kui helitugevuse ja sellel köitel paikneva andmehoidla viivitused erinevad üsna oluliselt, peaksite tähelepanu pöörama oma SAN-võrgule, suure tõenäosusega on sellega probleeme ja enne uue ostmist. süsteemi, tasub seda probleemi uurida, sest praeguse süsteemi jõudluse suurendamise tõenäosus on väga suur.

Te ehitate nullist infrastruktuuri või ostate süsteemi mõne uue teenuse jaoks, mille koormustest te teadlik pole. Võimalusi on mitu: suhelge kolleegidega spetsiaalsete ressursside osas, et püüda välja selgitada ja prognoosida koormust, võtke ühendust integraatoriga, kellel on sarnaste teenuste juurutamise kogemus ja kes suudab teie eest koormuse arvutada. Ja kolmas võimalus (tavaliselt kõige keerulisem, eriti kui see puudutab kodus kirjutatud või haruldasi rakendusi) on proovida jõudlusnõudeid süsteemi arendajatelt välja selgitada.

Ja pange tähele, praktilise rakenduse seisukohast kõige õigem variant on praeguste seadmete piloot või müüja/integraatori poolt testimiseks pakutud seadmed.

Erinõuded

Erinõuded on kõik, mis ei kuulu andmete vahetu töötlemise ja edastamise jõudluse, tõrketaluvuse ja funktsionaalsuse nõuete alla.

Ühte lihtsat andmesalvestussüsteemi erinõuet võib nimetada "võõratavaks salvestusmeediumiks". Ja kohe saab selgeks, et see andmesalvestussüsteem peab sisaldama lindiraamatukogu või lihtsalt lindiseadet, millele varukoopia kantakse. Pärast seda allkirjastab eriväljaõppe saanud inimene lindile ja kannab selle uhkelt spetsiaalsesse seifi.
Teine erinõude näide on kaitstud põrutuskindel disain.

kus

Teine põhikomponent konkreetse salvestussüsteemi valimisel on teave selle kohta, KUS see salvestussüsteem asub. Alustades geograafiast või kliimatingimustest ja lõpetades personaliga.

Klient

Kelle jaoks on see salvestussüsteem planeeritud? Küsimusel on järgmised põhjused:

Valitsuse klient/äriklient.
Kommertskliendil ei ole piiranguid ja ta pole isegi kohustatud pakkumisi korraldama, välja arvatud tema enda sisemiste eeskirjade kohaselt.

Valitsuse klient on hoopis teine ​​asi. 44 Föderaalseadus ja muud rõõmud pakkumiste ja tehniliste kirjeldustega, mida saab vaidlustada.

Klient on sanktsioonide all
Noh, küsimus on siin väga lihtne – valikut piiravad ainult antud kliendile saadaolevad pakkumised.

Siseeeskirjad / müüjad / mudelid on lubatud osta
Küsimus on samuti äärmiselt lihtne, kuid peate seda meeles pidama.

Kus füüsiliselt

Selles osas käsitleme kõiki geograafia, sidekanalite ja majutusruumide mikrokliimaga seotud küsimusi.

personal

Kes hakkab selle salvestussüsteemiga töötama? See pole vähem oluline kui see, mida salvestussüsteem ise suudab.
Ükskõik kui paljulubav, lahe ja imeline on müüja A salvestussüsteem, pole selle paigaldamisel ilmselt suurt mõtet, kui töötajad teavad ainult müüja B-ga koostööd ning A-ga pole plaanis edasisi oste ega jätkuvat koostööd teha.

Ja loomulikult on küsimuse teine ​​pool see, kui saadaval on koolitatud töötajaid antud geograafilises asukohas otse ettevõttes ja potentsiaalselt tööturul. Piirkondade jaoks võib lihtsate liidestega või kaughalduse tsentraliseerimise võimalusega salvestussüsteemide valimine olla väga mõttekas. Vastasel juhul võib see ühel hetkel muutuda piinavalt valusaks. Internet on täis lugusid sellest, kuidas saabunud uus töötaja, eile tudeng, seadistas sellise asja, et kogu kontor hävis.

Kuidas valida hoiuruumi ilma jalga tulistamata

Ümbruskond

Ja loomulikult on oluline küsimus, millises keskkonnas see salvestussüsteem töötab.

  • Aga toiteplokk/jahutus?
  • Mis seos
  • Kuhu see paigaldatakse?
  • Jne.

Sageli on need küsimused iseenesestmõistetavad ja eriti ei arvestata, kuid mõnikord võivad just need kõik ümber pöörata.

Et

Müüja

Tänase seisuga (2019. aasta keskpaigas) võib Venemaa salvestusturu jagada 5 kategooriasse:

  1. Kõrgeim divisjon on väljakujunenud ettevõtted, millel on lai valik kettariiuleid kõige lihtsamast kuni tipptasemel (HPE, DellEMC, Hitachi, NetApp, IBM / Lenovo)
  2. Teine divisjon – piiratud liiniga ettevõtted, nišimängijad, tõsised SDS-i müüjad või tõusvad uustulnukad (Fujitsu, Datacore, Infinidat, Huawei, Pure jne)
  3. Kolmas divisjon - nišilahendused madalal tasemel, odavad SDS-id, täiustatud tooted, mis põhinevad cephil ja muudel avatud projektidel (Infortrend, Starwind jne)
  4. SOHO segment – ​​väikesed ja üliväikesed kodu/väikese kontori taseme salvestussüsteemid (Synology, QNAP jne)
  5. Impordiga asendatud salvestussüsteemid - see hõlmab nii esimese jaotuse riistvara, millel on uuesti märgistatud sildid, kui ka teise haruldasi esindajaid (RAIDIX, teise anname neile ette), kuid peamiselt on see kolmas jaotus (Aerodisk, Baum, Depo jne)

Jaotus on üsna meelevaldne ega tähenda sugugi, et kolmas ehk SOHO segment on halb ja seda ei saa kasutada. Konkreetsetes projektides, millel on selgelt määratletud andmekogum ja koormusprofiil, võivad need töötada väga hästi, ületades hinna ja kvaliteedi suhte poolest kaugelt esimest jaotust. Oluline on esmalt otsustada oma eesmärgid, kasvuväljavaated ja vajalik funktsionaalsus – ja siis Synology teenib teid truult ning teie juuksed muutuvad pehmeks ja siidiseks.

Üks olulisi tegureid müüja valimisel on praegune keskkond. Kui palju salvestussüsteeme teil juba on ja milliste salvestussüsteemidega saavad teie insenerid töötada. Kas vajate teist tarnijat, teist kontaktpunkti, kas viite järk-järgult kogu koormuse hankijalt A hankijale B?

Ei tohiks toota üksusi kaugemale sellest, mis on vajalik.

iSCSI/FC/Fail

Inseneride seas puudub pääsuprotokollide küsimuses üksmeel ja debatt meenutab rohkem teoloogilisi kui insenertehnilisi arutelusid. Kuid üldiselt võib märkida järgmisi punkte:

FCoE rohkem surnud kui elus.

FC vs iSCSI. Üks FC 2019. aasta peamisi eeliseid IP-salvestuse ees, mis on andmetele juurdepääsuks spetsiaalne tehas, kompenseeritakse spetsiaalse IP-võrguga. FC-l pole IP-võrkude ees globaalseid eeliseid ja IP-d saab kasutada mis tahes koormustasemega salvestussüsteemide loomiseks, kuni suure panga põhipangandussüsteemi raskete DBMS-süsteemideni. Teisalt on FC surma ennustatud juba mitu aastat, kuid miski takistab seda pidevalt. Näiteks täna arendavad mõned salvestusturu mängijad aktiivselt NVMEoF standardit. Kas ta jagab FCoE saatust – seda näitab aeg.

Juurdepääs failidele pole ka midagi tähelepanuväärset. NFS/CIFS toimib hästi tootlikkuskeskkondades ja kui see on õigesti kavandatud, pole sellel rohkem kaebusi kui plokkprotokollidel.

Hübriid / kõik välklambi massiiv

Klassikalisi salvestussüsteeme on kahte tüüpi:

  1. AFA (All Flash Array) – SSD kasutamiseks optimeeritud süsteemid.
  2. Hübriid – võimaldab kasutada nii HDD-d kui ka SSD-d või nende kombinatsiooni.

Nende peamine erinevus on toetatud salvestusefektiivsuse tehnoloogiad ja maksimaalne jõudluse tase (kõrge IOPS ja madal latentsusaeg). Mõlemad süsteemid (enamiku mudelite puhul, arvestamata odavat segmenti) võivad töötada nii plokk- kui ka failiseadmetena. Toetatud funktsionaalsus sõltub süsteemi tasemest ja nooremate mudelite puhul on see enamasti viidud miinimumtasemele. Sellele tasub tähelepanu pöörata, kui uurite konkreetse mudeli omadusi, mitte ainult kogu rea kui terviku võimalusi. Samuti sõltuvad loomulikult süsteemi tasemest ka selle tehnilised omadused, nagu protsessor, mälumaht, vahemälu, portide arv ja tüübid jne. Haldamise seisukohast erinevad AFA-d hübriidsüsteemidest (ketas) ainult SSD-draividega töötamise mehhanismide rakendamise poolest ja isegi kui kasutate hübriidsüsteemis SSD-d, ei tähenda see sugugi, et saate jõudluse taseme saavutamiseks AFA süsteemi tasemel . Samuti on enamikul juhtudel hübriidsüsteemides sisemised tõhusad salvestusmehhanismid keelatud ja nende kaasamine toob kaasa jõudluse vähenemise.

Spetsiaalsed salvestussüsteemid

Lisaks üldotstarbelistele salvestussüsteemidele, mis keskenduvad peamiselt operatiivsele andmetöötlusele, on olemas spetsiaalsed salvestussüsteemid, mille põhiprintsiibid on tavapärastest põhimõtteliselt erinevad (madal latentsus, kõrge IOPS):

Meedia.

Need süsteemid on mõeldud suurte meediumifailide salvestamiseks ja töötlemiseks. Resp. viivitus muutub praktiliselt ebaoluliseks ning esile kerkib võimalus saata ja vastu võtta andmeid lairibas paljudes paralleelsetes voogudes.

Salvestussüsteemide dubleerimine varukoopiate jaoks.

Kuna varukoopiad eristuvad omavahelise sarnasuse poolest, mis tavatingimustes on haruldane (keskmine varukoopia erineb eilsest koopiast 1-2%), pakendab see süsteemiklass neile salvestatud andmed äärmiselt tõhusalt üsna väikesesse mahutisse. füüsiliste andmekandjate arv. Näiteks mõnel juhul võib andmete tihendamise suhe ulatuda 200:1-ni.

Objektide salvestussüsteemid.

Nendel salvestussüsteemidel pole tavalisi plokkjuurdepääsu mahtusid ja failijagamisi ning ennekõike meenutavad nad tohutut andmebaasi. Juurdepääs sellises süsteemis salvestatud objektile toimub kordumatu identifikaatori või metaandmete abil (näiteks kõik JPEG-vormingus objektid, mille loomise kuupäev on vahemikus XX-XX-XXXX kuni YY-YY-YYYY).

Vastavussüsteem.

Need pole tänapäeval Venemaal nii levinud, kuid väärivad mainimist. Selliste salvestussüsteemide eesmärk on tagada andmete säilitamine, mis vastab turvapoliitikale või regulatiivsetele nõuetele. Mõned süsteemid (näiteks EMC Centera) on rakendanud funktsiooni andmete kustutamise keelamiseks – niipea kui võtit keeratakse ja süsteem sellesse režiimi siseneb, ei saa administraator ega keegi teine ​​juba salvestatud andmeid füüsiliselt kustutada.

Patenditud tehnoloogiad

Flashi vahemälu

Välkmälu on levinud nimetus kõikidele patenteeritud tehnoloogiatele, mis kasutavad välkmälu teise taseme vahemäluna. Välkmälu kasutamisel arvutatakse salvestussüsteem tavaliselt nii, et see tagab magnetketastelt püsiva koormuse, samal ajal kui tipptaseme teenindab vahemälu.

Sel juhul on vaja mõista koormusprofiili ja salvestusmahtude plokkidele juurdepääsu lokaliseerimise astet. Flash-vahemälu on tehnoloogia väga lokaliseeritud päringutega töökoormuste jaoks ja seda praktiliselt ei saa kasutada ühtlaselt laaditud mahtude jaoks (nt analüüsisüsteemide jaoks).

Turul on saadaval kaks välkmälu vahemälu rakendust:

  • Loe ainult. Sel juhul salvestatakse vahemällu ainult loetud andmed ja kirjutamine läheb otse ketastele. Mõned tootjad, näiteks NetApp, usuvad, et nende salvestussüsteemidesse kirjutamine on juba optimaalne ja vahemälu ei aita üldse.
  • Lugema kirjutama. Vahemällu ei salvestata mitte ainult lugemist, vaid ka kirjutamist, mis võimaldab teil voogu puhverdada ja vähendada RAID karistuse mõju ning selle tulemusena suurendada vähem optimaalse kirjutamismehhanismiga salvestussüsteemide üldist jõudlust.

Mitmetasandiline

Mitmetasandiline salvestus (väsitav) on tehnoloogia erinevate jõudlustasemetega tasemete (nt SSD ja HDD) ühendamiseks üheks kettakogumiks. Andmeplokkidele juurdepääsu märgatava ebaühtluse korral suudab süsteem andmeplokke automaatselt tasakaalustada, liigutades koormatud suure jõudlusega tasemele ja külmad, vastupidi, aeglasemale.

Madalama ja keskklassi hübriidsüsteemid kasutavad mitmetasandilist salvestusruumi, kus andmed liiguvad graafiku alusel tasemete vahel. Samal ajal on parimate mudelite mitmetasandilise salvestusploki suurus 256 MB. Need funktsioonid ei võimalda meil pidada mitmetasandilist salvestustehnoloogiat tootlikkuse suurendamise tehnoloogiaks, nagu paljud inimesed ekslikult arvavad. Mitmetasandiline salvestus madala- ja keskklassi süsteemides on tehnoloogia salvestuskulude optimeerimiseks süsteemide puhul, millel on väljendunud koormuse ebaühtlus.

Snapshot

Ükskõik kui palju me salvestussüsteemide töökindlusest ka ei räägiks, on palju võimalusi andmete kaotamiseks, mis ei sõltu riistvaraprobleemidest. See võib olla viirused, häkkerid või muu tahtmatu andmete kustutamine/rikkumine. Sel põhjusel on tootmisandmete varundamine inseneri töö lahutamatu osa.

Hetktõmmis on helitugevuse hetktõmmis mingil ajahetkel. Töötades enamiku süsteemidega, nagu virtualiseerimine, andmebaasid jne. peame tegema sellise hetktõmmise, millest kopeerime andmed varukoopiasse, samal ajal kui meie IS saab selle mahuga turvaliselt edasi töötada. Kuid tasub meeles pidada, et mitte kõik hetktõmmised pole võrdselt kasulikud. Erinevatel müüjatel on oma arhitektuuriga seotud hetktõmmiste loomisel erinevad lähenemisviisid.

Lehm (kopeerimine-kirjutamisel). Kui proovite kirjutada andmeplokki, kopeeritakse selle algne sisu spetsiaalsesse piirkonda, misjärel kirjutamine jätkub tavapäraselt. See hoiab ära andmete riknemise hetketõmmises. Loomulikult põhjustavad kõik need "parasiitsed" andmemanipulatsioonid salvestussüsteemile lisakoormust ja seetõttu ei soovita sarnaste rakendustega müüjad kasutada rohkem kui tosinat hetktõmmist ja mitte kasutada neid väga koormatud mahtudel.

Rida (kirjutamisel ümbersuunamine). Sellisel juhul algne maht loomulikult hangub ja andmeplokki kirjutades kirjutab salvestussüsteem andmed vabas ruumis olevale spetsiaalsele alale, muutes selle ploki asukohta metaandmete tabelis. See võimaldab teil vähendada ümberkirjutamistoimingute arvu, mis lõppkokkuvõttes välistab jõudluse languse ja eemaldab piirangud hetktõmmiste ja nende arvu kohta.

Seoses rakendustega on ka hetktõmmiseid kahte tüüpi:

Rakenduse järjepidevus. Pildi loomise hetkel tõmbab salvestussüsteem tarbija operatsioonisüsteemi agendi, mis tühjendab sunniviisiliselt ketta vahemälu mälust kettale ja sunnib rakendust seda tegema. Sel juhul on andmed hetktõmmise taastamisel järjepidevad.

Krahhi järjekindel. Sel juhul midagi sellist ei juhtu ja hetktõmmis luuakse sellisena, nagu see on. Sellisest hetktõmmisest taastamise korral on pilt identne sellega, mis juhtuks siis, kui toide äkitselt välja lülitataks ja võimalik on andmete kadu, mis on takerdunud vahemällu ega jõua kunagi kettale. Selliseid hetktõmmiseid on lihtsam rakendada ja need ei põhjusta rakenduste jõudluse halvenemist, kuid on vähem usaldusväärsed.

Miks on salvestussüsteemides hetktõmmiseid vaja?

  • Agendita varundamine otse salvestussüsteemist
  • Looge reaalsetel andmetel põhinevaid testkeskkondi
  • Failisalvestussüsteemide puhul saab seda kasutada VDI-keskkondade loomiseks, kasutades hüperviisori asemel salvestussüsteemi hetktõmmiseid
  • Tagage madalad RPO-d, luues ajastatud hetktõmmiseid sagedusega, mis on oluliselt suurem kui varundussagedus

Kloonimine

Volume kloonimine - töötab sarnasel põhimõttel nagu hetktõmmised, kuid seda kasutatakse mitte ainult andmete lugemiseks, vaid ka täielikuks töötamiseks. Meil on võimalik saada oma köite täpne koopia koos kõigi sellel olevate andmetega ilma füüsilist koopiat tegemata, mis säästab ruumi. Tavaliselt kasutatakse mahu kloonimist kas rakenduses Test&Dev või siis, kui soovite kontrollida oma IS-i mõne värskenduse funktsionaalsust. Kloonimine võimaldab teil seda kettaressursside osas võimalikult kiiresti ja säästlikult teha, kuna Kirjutatakse ainult muudetud andmeplokid.

Replikatsioon / ajakirjandus

Replikatsioon on mehhanism andmete koopia loomiseks teises füüsilises salvestussüsteemis. Tavaliselt on igal müüjal patenteeritud tehnoloogia, mis töötab ainult oma tootesarja piires. Kuid on ka kolmandate osapoolte lahendusi, sealhulgas neid, mis töötavad hüperviisori tasemel, näiteks VMware vSphere Replication.

Patenditud tehnoloogiate funktsionaalsus ja kasutuslihtsus on tavaliselt universaalsetest palju paremad, kuid need osutuvad mittekasutatavateks, kui näiteks on vaja teha NetAppist HP MSA-le koopia.

Replikatsioon on jagatud kahte alamtüüpi:

Sünkroonne. Sünkroonse replikatsiooni korral saadetakse kirjutamisoperatsioon kohe teise salvestussüsteemi ja täitmist ei kinnitata enne, kui kaugsalvestussüsteem seda kinnitab. Tänu sellele pikeneb juurdepääsu viivitus, kuid meil on andmete täpne peegelkoopia. Need. RPO = 0 põhisalvestussüsteemi kadumise korral.

asünkroonne. Kirjutamistoiminguid teostatakse ainult põhimälusüsteemis ja need kinnitatakse koheselt, kogudes samal ajal puhvrisse partii edastamiseks kaugsalvestussüsteemi. Seda tüüpi replikatsioon on asjakohane vähem väärtuslike andmete või väikese ribalaiuse või suure latentsusega kanalite puhul (tavaline vahemaade puhul, mis on üle 100 km). Seega RPO = pakettide saatmise sagedus.

Sageli on koos replikatsiooniga ka mehhanism metsaraie kettatoimingud. Sel juhul eraldatakse metsaraie jaoks spetsiaalne ala ja salvestatakse teatud ajasügavusega või palgi mahuga piiratud toiminguid. Teatud patenteeritud tehnoloogiate (nt EMC RecoverPoint) puhul on integratsioon süsteemitarkvaraga, mis võimaldab teil siduda teatud järjehoidjad konkreetse logikirjega. Tänu sellele on võimalik helitugevuse olekut tagasi kerida (või klooni luua) mitte ainult 23. aprillini, 11 tundi 59 sekundit 13 millisekundit, vaid hetkeni enne “Drop ALL TABLES; KOHTU."

Metroo klaster

Metro cluster on tehnoloogia, mis võimaldab teil luua kahe salvestussüsteemi vahel kahesuunalist sünkroonset replikatsiooni nii, et see paar näeb väljastpoolt välja nagu üks salvestussüsteem. Seda kasutatakse geograafiliselt eraldatud harudega klastrite loomiseks metroo kaugusel (alla 100 km).

Tuginedes virtualiseerimiskeskkonnas kasutamise näitele, võimaldab metroklaster luua virtuaalmasinatega andmehoidla, kuhu pääseb salvestamiseks korraga kahest andmekeskusest. Sel juhul luuakse hüperviisori tasemel klaster, mis koosneb selle andmesalvega ühendatud erinevates füüsilistes andmekeskustes asuvatest hostidest. Mis võimaldab teil teha järgmist:

  • Taastamisprotsessi täielik automatiseerimine pärast ühe andmekeskuse surma. Ilma täiendavate rahaliste vahenditeta taaskäivitatakse kõik surnud andmekeskuses töötavad VM-id automaatselt ülejäänud ühes. RTO = kõrge käideldusega klastri ajalõpp (15 sekundit VMware jaoks) + aeg operatsioonisüsteemi laadimiseks ja teenuste käivitamiseks.
  • Katastroofide vältimine ehk vene keeles katastroofide vältimine. Kui andmekeskuses 1 on planeeritud toitetööd, siis on meil võimalus enne tööde algust migreerida kogu oluline koormus andmekeskusesse 2 vahetpidamata ette.

Virtualiseerimine

Salvestusruumi virtualiseerimine on tehniliselt teisest salvestussüsteemist pärit köidete kasutamine ketastena. Salvestus virtualiseerija võib lihtsalt edastada kellegi teise köite tarbijale enda omana, peegeldades seda samaaegselt teise salvestussüsteemi või isegi luua välistest köidetest RAID-i.
Klassikalised esindajad salvestusruumi virtualiseerimisklassis on EMC VPLEX ja IBM SVC. Ja loomulikult virtualiseerimisfunktsiooniga salvestussüsteemid - NetApp, Hitachi, IBM / Lenovo Storwize.

Miks seda vaja võib minna?

  • Üleliigsus salvestussüsteemi tasemel. Köidete vahele luuakse peegel ja üks pool võib olla HP 3Paris ja teine ​​NetAppis. Ja virtualiseerija on EMC-st.
  • Teisaldage andmeid erinevate tootjate salvestussüsteemide vahel minimaalse seisakuga. Oletame, et andmed tuleb migreerida vanast 3Parist, mis kantakse maha, uude Delli. Sel juhul lülitatakse tarbijad 3Par-ist välja, mahud kantakse VPLEX-i alla ja esitatakse uuesti tarbijatele. Kuna helitugevuses pole vähegi muutunud, siis töö jätkub. Helitugevuse peegeldamine uuele Dellile algab taustal ja selle lõpetamisel peegel katki läheb ja 3Par on keelatud.
  • Metroklastrite organiseerimine.

Pakkimine/dedublikatsioon

Tihendamine ja dubleerimine on tehnoloogiad, mis võimaldavad säästa salvestussüsteemi kettaruumi. Tasub kohe mainida, et mitte kõik andmed ei kuulu põhimõtteliselt tihendamisele ja/või deduplikatsioonile, samas kui teatud tüüpi andmeid tihendatakse ja eemaldatakse paremini ning mõnda – vastupidi.

Pakkimist ja dubleerimist on kahte tüüpi:

Järjekorras — andmeplokkide tihendamine ja dubleerimine toimub enne andmete kettale kirjutamist. Seega arvutab süsteem ainult ploki räsi ja võrdleb seda tabelis olemasolevatega. Esiteks on see kiirem kui lihtsalt kettale kirjutamine ja teiseks ei raiska me lisakettaruumi.

post - kui neid toiminguid tehakse ketastel juba salvestatud andmetega. Vastavalt sellele kirjutatakse andmed esmalt kettale ja alles siis arvutatakse räsi ja kustutatakse mittevajalikud plokid ning vabastatakse kettaressursid.

Tasub öelda, et enamik müüjaid kasutab mõlemat tüüpi, mis võimaldab neil neid protsesse optimeerida ja seeläbi tõhusust tõsta. Enamikul salvestusseadmete tarnijatel on utiliidid, mis võimaldavad teil andmekogumeid analüüsida. Need utiliidid töötavad sama loogika järgi, mida rakendatakse salvestussüsteemis, seega on hinnanguline tõhususe tase sama. Samuti pidage meeles, et paljudel müüjatel on toimivusgarantii programmid, mis lubavad teatud (või kõigi) andmetüüpide puhul vähemalt sama head jõudlust. Ja te ei tohiks seda programmi tähelepanuta jätta, sest oma ülesannete jaoks süsteemi arvutamisel, võttes arvesse konkreetse süsteemi efektiivsuskoefitsienti, saate mahtu kokku hoida. Samuti tasub arvestada, et need programmid on mõeldud AFA-süsteemide jaoks, kuid tänu klassikalistes süsteemides väiksema mahuga SSD-de ostmisele kui kõvakettad, vähendab see nende maksumust ja kui mitte võrdne kettasüsteemi maksumusega, siis jõuda sellele üsna lähedale.

Mudel

Ja siit jõuame õige küsimuseni.

"Nad pakuvad mulle kahte salvestusvõimalust - ABC SuperStorage S600 ja XYZ HyperOcean 666v4, mida te soovitate?"

Muutub "Siin pakuvad nad mulle kahte salvestusvõimalust - ABC SuperStorage S600 ja XYZ HyperOcean 666v4, mida te soovitate?

Sihtkoormuseks on VMware segatud virtuaalmasinad koos tootmis-/testimis-/arendusahelatega. Test = produktiivne. 150 TB igaüks tippjõudlusega 80 000 IOPS 8 kb plokk 50% juhusliku juurdepääsuga 80/20 lugemine-kirjutamine. Arenduseks 300 TB, piisab 50 000 IOPS-ist, 80 juhuslikust, 80 kirjutamisest.

Tootlikkus eeldatavasti metroklastris RPO = 15 minutit RTO = 1 tund, arendus asünkroonses replikatsioonis RPO = 3 tundi, test ühes kohas.

Tuleb 50TB DBMS, logimine oleks neile tore.

Meil on igal pool Delli serverid, vanad Hitachi salvestussüsteemid, need saavad vaevu hakkama, plaanime koormust 50% suurendada nii mahu kui ka jõudluse osas.

Nagu öeldakse, sisaldab õigesti sõnastatud küsimus 80% vastusest.

lisainfo

Mida peaksite autorite sõnul lisaks lugema

raamatud

  • Olifer ja Olifer “Arvutivõrgud”. Raamat aitab süstematiseerida ja ehk paremini mõista, kuidas IP/Ethernet salvestussüsteemide andmeedastusmeedium töötab
  • "EMC teabe salvestamine ja haldamine." Suurepärane raamat salvestussüsteemide põhitõdedest, miks, kuidas ja milleks.

Foorumid ja vestlused

Üldised soovitused

Hinnad

Nüüd, mis puudutab hindu - üldiselt, kui on olemas hinnad salvestussüsteemidele, siis on need tavaliselt Lihthinnad, millest iga klient saab individuaalse allahindluse. Allahindluse suurus koosneb suurest hulgast parameetritest, mistõttu on turustaja käest küsimata lihtsalt võimatu ennustada, millise lõpphinna teie ettevõte saab. Kuid samas on viimasel ajal hakanud tavalistesse arvutipoodidesse ilmuma ka odavmudeleid, nagu näiteks nix.ru või xcom-shop.ru. Siit saate endale huvipakkuva süsteemi nagu kõik arvutikomponendid kohe fikseeritud hinnaga osta.

Kuid tahaksin kohe märkida, et otsene võrdlus TB/$ järgi ei ole õige. Kui läheneda sellest vaatenurgast, siis odavaim lahendus on lihtne JBOD + server, mis ei taga ei paindlikkust ega töökindlust, mida pakub täisväärtuslik kahe kontrolleriga salvestussüsteem. See ei tähenda sugugi, et JBOD on vastik ja vastik räpane trikk, peate lihtsalt jälle väga selgelt aru saama, kuidas ja mis eesmärkidel seda lahendust kasutate. Tihti võib kuulda, et JBODis pole midagi murda, on ainult üks tagaplaat. Kuid ka tagaplaanid ebaõnnestuvad mõnikord. Kõik puruneb varem või hiljem.

Kogusummas

Süsteeme tuleb omavahel võrrelda mitte ainult hinna või mitte ainult jõudluse, vaid kõigi näitajate kogumi järgi.

Ostke kõvaketast ainult siis, kui olete kindel, et vajate kõvaketast. Madala koormuse ja tihendamatute andmetüüpide puhul tasub vastasel juhul pöörduda SSD-salvestuse tõhususe garantiiprogrammide poole, mis on enamikul müüjatel praegu olemas (ja need tõesti töötavad isegi Venemaal), kuid kõik sõltub rakendustest ja andmetest, mis asuvad. selles salvestussüsteemis.

Ära otsi odavat. Mõnikord peidavad need endas palju ebameeldivaid hetki, millest üht kirjeldas Jevgeni Elizarov oma artiklites Infortrend. Ja lõpuks võib see odavus teile tagasilöögi anda. Ärge unustage - "kooner maksab kaks korda."

Allikas: www.habr.com

Lisa kommentaar