Kaip pasirinkti saugyklą nešaunant sau į koją

įvedimas

Atėjo laikas nusipirkti saugyklą. Kurį imti, ko klausyti? Pardavėjas A kalba apie pardavėją B, o tada yra integratorius C, kuris sako priešingai ir pataria pardavėjui D. Esant tokiai situacijai, net patyrusiam saugyklos architektui galva susisuks, ypač su visais naujais pardavėjais ir SDS bei hiperkonvergencija, kuri yra madinga. šiandien.

Taigi, kaip viską išsiaiškinti ir netapti kvailiu? Mes (AntonVirtual Antonas Žbankovas ir korp Jevgenijus Elizarovas) pabandykime apie tai pakalbėti paprasta rusiškai.
Straipsnis turi daug panašumų ir iš tikrųjų yra "pratęsimas"Virtualizuotas duomenų centro dizainas“ kalbant apie saugojimo sistemų pasirinkimą ir saugojimo technologijų peržiūrą. Trumpai apžvelgsime bendrą teoriją, tačiau rekomenduojame perskaityti ir šį straipsnį.

Už ką

Dažnai galite pamatyti situaciją, kai naujas asmuo ateina į forumą ar specializuotą pokalbį, pvz., „Saugojimo diskusijos“, ir užduoda klausimą: „čia jie man siūlo dvi saugojimo parinktis - ABC SuperStorage S600 ir XYZ HyperOcean 666v4, ką jūs rekomenduojate ?”

Ir prasideda painiava, kas turi kokių bruožų įgyvendinant baisius ir nesuprantamus bruožus, kurie nepasiruošusiam žmogui yra visiškai kiniški.

Taigi, pagrindinis ir pats pirmasis klausimas, kurį turite užduoti sau ilgai prieš palygindami komercinių pasiūlymų specifikacijas, yra KODĖL? Kodėl reikalinga ši saugojimo sistema?

Kaip pasirinkti saugyklą nešaunant sau į koją

Atsakymas bus netikėtas ir labai Tony Robbins stilius – saugoti duomenis. Ačiū, kapitone! Ir vis dėlto kartais taip įsigiliname į detalių palyginimą, kad pamirštame, kodėl iš pradžių visa tai darome.

Taigi, duomenų saugojimo sistemos užduotis yra saugoti ir suteikti prieigą prie DUOMENŲ su tam tikru našumu. Pradėsime nuo duomenų.

Duomenys

Duomenų tipas

Kokius duomenis planuojame saugoti? Labai svarbus klausimas, galintis net nesvarstyti daugelio saugojimo sistemų. Pavyzdžiui, planuojate saugoti vaizdo įrašus ir nuotraukas. Galite iš karto perbraukti sistemas, skirtas atsitiktinei prieigai mažuose blokuose, arba sistemas su patentuotomis glaudinimo / dubliavimo funkcijomis. Tai gali būti tiesiog puikios sistemos, nenorime pasakyti nieko blogo. Tačiau tokiu atveju jų stipriosios pusės arba pasidarys silpnos (vaizdo įrašas ir nuotraukos nesuspausti), arba tiesiog gerokai padidins sistemos kainą.

Ir atvirkščiai, jei numatytas naudojimas yra užimtas operacijų DBVS, tada puikios daugialypės terpės srautinio perdavimo sistemos, galinčios perduoti gigabaitus per sekundę, bus prastas pasirinkimas.

Duomenų apimtis

Kiek duomenų planuojame saugoti? Kiekis visada virsta kokybe; to niekada nereikėtų pamiršti, ypač šiais laikais, kai duomenų kiekis sparčiai auga. Petabaitų klasės sistemos nebėra neįprastos, tačiau kuo didesnė petabaitų talpa, tuo sistema tampa konkretesnė, tuo mažiau prieinamas bus įprastas mažų ir vidutinių laisvosios prieigos sistemų funkcionalumas. Tai nereikšminga, nes vien blokinės prieigos statistikos lentelės tampa didesnės nei turimas valdiklių RAM kiekis. Jau nekalbant apie suspaudimą / pakopų nustatymą. Tarkime, kad norime perjungti glaudinimo algoritmą į galingesnį ir suspausti 20 petabaitų duomenų. Kiek tai užtruks: šešis mėnesius, metus?

Kita vertus, kam vargti, jei reikia saugoti ir apdoroti 500 GB duomenų? Tik 500. Tokio dydžio buitiniai SSD (su žemu DWPD) nieko nekainuoja. Kam statyti Fibre Channel gamyklą ir pirkti aukščiausios klasės išorines saugojimo sistemas, kurios kainuoja tiek pat, kiek ketaus tiltas?

Kiek procentų visos sumos sudaro karštieji duomenys? Kiek netolygi apkrova duomenų apimties atžvilgiu? Čia pakopinė saugojimo technologija arba „Flash“ talpykla gali būti labai naudinga, jei karštų duomenų kiekis yra nedidelis, palyginti su bendru. Arba atvirkščiai, esant vienodai apkrovai visame tūryje, kuri dažnai būna srautinio perdavimo sistemose (vaizdo stebėjimas, kai kurios analitinės sistemos), tokios technologijos nieko neduos ir tik padidins sistemos kainą / sudėtingumą.

IP

Kita duomenų pusė – duomenis naudojanti informacinė sistema. IS turi reikalavimų, kurie paveldi duomenis, rinkinį. Norėdami gauti daugiau informacijos apie IS, žr. „Virtualizuotas duomenų centro dizainas“.

Atsparumo/prieinamumo reikalavimai

Gedimų tolerancijos / duomenų prieinamumo reikalavimai yra paveldimi iš juos naudojančios IS ir išreiškiami trimis skaičiais - RPO, OTR, prieinamumas.

Prieinamumas — dalis tam tikram laikotarpiui, per kurį galima su jais dirbti su duomenimis. Paprastai išreiškiamas skaičiumi 9. Pavyzdžiui, du devyneri per metus reiškia, kad pasiekiamumas yra 99 % arba kitu atveju leidžiama 95 nepasiekiamumo valandas per metus. Trys devyneri – 9,5 valandos per metus.

RPO / RTO nėra bendri rodikliai, o kiekvieno incidento (nelaimingo atsitikimo) rodikliai, priešingai nei prieinamumas.

RPO — avarijos metu prarastų duomenų kiekis (valandomis). Pavyzdžiui, jei atsarginės kopijos daromos kartą per dieną, tada RPO = 24 valandos. Tie. Nelaimės ir visiško saugojimo sistemos praradimo atveju duomenys gali būti prarasti iki 24 valandų (nuo atsarginės kopijos kūrimo momento). Remiantis, pavyzdžiui, IS nurodyta RPO, rašomos atsarginės taisyklės. Be to, remiantis RPO, galite suprasti, kiek reikia sinchroninio / asinchroninio duomenų replikavimo.

OTR — laikas atkurti paslaugą (prieigą prie duomenų) po nelaimės. Pagal pateiktą RTO reikšmę galime suprasti, ar reikalingas metro klasteris, ar pakanka vienkrypčio replikacijos. Ar jums reikia aukščiausios klasės kelių valdiklių saugojimo sistemos?

Kaip pasirinkti saugyklą nešaunant sau į koją

Atlikimo reikalavimai

Nors tai labai akivaizdus klausimas, būtent čia iškyla daugiausiai sunkumų. Priklausomai nuo to, ar jau turite tam tikrą infrastruktūrą, ar ne, bus sukurti būdai, kaip surinkti reikiamą statistiką.

Jau turite saugojimo sistemą ir ieškote pakeitimo arba norite įsigyti kitą, kad galėtumėte išplėsti. Čia viskas paprasta. Jūs suprantate, kokias paslaugas jau turite ir kurias planuojate įgyvendinti artimiausiu metu. Remdamiesi dabartinėmis paslaugomis, turite galimybę rinkti našumo statistiką. Nuspręskite apie dabartinį IOPS skaičių ir dabartinį delsą – kokie yra šie rodikliai ir ar jų pakanka jūsų užduotims atlikti? Tai galima padaryti tiek pačioje duomenų saugojimo sistemoje, tiek iš prie jos prijungtų kompiuterių.

Be to, reikia žiūrėti ne tik į esamą apkrovą, bet ir per tam tikrą laikotarpį (geriausia mėnesį). Pažiūrėkite, kokie didžiausi pikai per dieną, kokią apkrovą sukuria atsarginė kopija ir pan. Jei jūsų saugojimo sistemoje ar jos programinėje įrangoje nepateikiamas visas šių duomenų rinkinys, galite naudoti nemokamą RRDtool, kuri gali veikti su dauguma populiariausių saugojimo sistemų ir jungiklių ir gali pateikti išsamią našumo statistiką. Taip pat verta pažvelgti į pagrindinių kompiuterių, kurie dirba su šia saugojimo sistema, apkrovą konkrečioms virtualioms mašinoms arba kas tiksliai veikia šiame pagrindiniame kompiuteryje.

Kaip pasirinkti saugyklą nešaunant sau į koją

Atskirai verta paminėti, kad jei tomo ir šiame tome esančios duomenų saugyklos vėlavimai labai skiriasi, turėtumėte atkreipti dėmesį į savo SAN tinklą, yra didelė tikimybė, kad su juo kils problemų ir prieš perkant naują sistemą, verta panagrinėti šią problemą, nes yra labai didelė tikimybė, kad dabartinės sistemos našumas padidės.

Kuriate infrastruktūrą nuo nulio arba perkate sistemą kokiai nors naujai paslaugai, kurios apkrovos nežinote. Galimi keli variantai: bendraukite su kolegomis dėl specializuotų išteklių, bandydami išsiaiškinti ir nuspėti apkrovą, kreiptis į integratorių, turintį panašių paslaugų diegimo patirties ir galintį apskaičiuoti apkrovą už jus. Ir trečias variantas (dažniausiai pats sunkiausias, ypač jei tai susiję su namuose parašytomis ar retomis programomis) – pabandyti išsiaiškinti našumo reikalavimus iš sistemos kūrėjų.

Ir atkreipkite dėmesį, kad praktinio pritaikymo požiūriu teisingiausias variantas yra dabartinės įrangos bandomasis variantas arba įranga, kurią pardavėjas / integratorius pateikia išbandyti.

Specialūs reikalavimai

Specialūs reikalavimai yra viskas, kas nepatenka į našumo, atsparumo gedimams ir tiesioginio duomenų apdorojimo ir teikimo funkcionalumo reikalavimus.

Vienas iš paprasčiausių specialiųjų reikalavimų duomenų saugojimo sistemai gali būti vadinamas „atsisavinamomis laikmenomis“. Ir iš karto tampa aišku, kad ši duomenų saugojimo sistema turi turėti juostų biblioteką arba tiesiog juostinį įrenginį, į kurį įkeliama atsarginė kopija. Po to specialiai apmokytas asmuo pasirašo ant juostos ir išdidžiai neša į specialų seifą.
Kitas specialaus reikalavimo pavyzdys – apsaugota smūgiams atspari konstrukcija.

kur

Antras pagrindinis komponentas renkantis konkrečią saugojimo sistemą yra informacija apie tai, KUR bus ši saugojimo sistema. Pradedant nuo geografijos ar klimato sąlygų ir baigiant personalu.

Klientas

Kam skirta ši saugojimo sistema? Klausimas turi šias priežastis:

Vyriausybės klientas / komercija.
Komercinis užsakovas neturi jokių apribojimų ir net neprivalo rengti konkursų, nebent pagal savo vidaus taisykles.

Valdžios klientas yra kitas reikalas. 44 Federalinis įstatymas ir kiti malonumai su pasiūlymais ir techninėmis specifikacijomis, kurias galima ginčyti.

Klientui taikomos sankcijos
Na, o klausimas čia labai paprastas – pasirinkimą riboja tik konkrečiam klientui prieinami pasiūlymai.

Vidaus taisyklės / pardavėjai / modeliai, kuriuos leidžiama įsigyti
Klausimas taip pat labai paprastas, bet reikia jį atsiminti.

Kur fiziškai

Šioje dalyje aptariame visus klausimus, susijusius su geografija, komunikacijos kanalais ir mikroklimatu apgyvendinimo patalpose.

personalas

Kas dirbs su šia saugojimo sistema? Tai ne mažiau svarbu nei tai, ką gali padaryti pati saugojimo sistema.
Kad ir kokia perspektyvi, šauni ir nuostabi būtų saugojimo sistema iš pardavėjo A, tikriausiai nėra prasmės ją diegti, jei darbuotojai žino, kaip dirbti tik su pardavėju B, o tolesnių pirkimų ir nuolatinio bendradarbiavimo su A nėra planų.

Ir, žinoma, kita klausimo pusė yra tai, kiek apmokytų darbuotojų yra konkrečioje geografinėje vietoje tiesiogiai įmonėje ir potencialiai darbo rinkoje. Regionams gali būti labai prasminga pasirinkti saugojimo sistemas su paprastomis sąsajomis arba galimybe nuotoliniu būdu centralizuoti valdymą. Priešingu atveju tam tikru momentu tai gali tapti nepakeliamai skausminga. Internetas pilnas istorijų apie tai, kaip atvykęs naujas darbuotojas, vakarykštis studentas, sukonfigūravo taip, kad visas biuras buvo sunaikintas.

Kaip pasirinkti saugyklą nešaunant sau į koją

Apylinkės

Ir, žinoma, svarbus klausimas, kokioje aplinkoje veiks ši saugojimo sistema.

  • O kaip dėl maitinimo / aušinimo?
  • Koks ryšys
  • Kur jis bus sumontuotas?
  • ir kt.

Dažnai šie klausimai yra savaime suprantami ir ne itin svarstomi, tačiau kartais būtent jie gali viską apversti.

Kad

Pardavėjas

Šiandien (2019 m. vidurys) Rusijos saugyklų rinką galima suskirstyti į 5 kategorijas:

  1. Aukščiausias padalinys – nusistovėjusios įmonės, turinčios platų diskų lentynų asortimentą nuo pačių paprasčiausių iki aukščiausios klasės (HPE, DellEMC, Hitachi, NetApp, IBM / Lenovo).
  2. Antrasis padalinys – įmonės su ribota linija, nišiniai žaidėjai, rimti SDS pardavėjai ar kylantys naujokai (Fujitsu, Datacore, Infinidat, Huawei, Pure ir kt.)
  3. Trečias skyrius - nišiniai sprendimai žemos klasės reitinge, pigūs SDS, pažangūs produktai, pagrįsti ceph ir kitais atvirais projektais (Infortrend, Starwind ir kt.)
  4. SOHO segmentas – mažos ir itin mažos saugojimo sistemos namų/mažo biuro lygiu (Synology, QNAP ir kt.)
  5. Importu pakeičiamos saugojimo sistemos - tai apima ir pirmojo skyriaus aparatinę įrangą su perženklintomis etiketėmis, ir retus antrojo atstovus (RAIDIX, antrąjį pateiksime jiems iš anksto), tačiau daugiausia tai yra trečiasis skyrius (Aerodisk, Baum, Depo ir kt.)

Padalijimas yra gana savavališkas ir visiškai nereiškia, kad trečiasis arba SOHO segmentas yra blogas ir negali būti naudojamas. Konkrečiuose projektuose su aiškiai apibrėžtu duomenų rinkiniu ir apkrovos profiliu jie gali veikti labai gerai, kainos ir kokybės santykiu gerokai pralenkdami pirmąjį skyrių. Pirmiausia svarbu apsispręsti dėl savo tikslų, augimo perspektyvų ir reikalingo funkcionalumo – tada Synology jums ištikimai tarnaus, o jūsų plaukai taps švelnūs ir šilkiniai.

Vienas iš svarbių veiksnių renkantis pardavėją yra esama aplinka. Kiek saugojimo sistemų jau turite ir su kokiomis saugojimo sistemomis gali dirbti jūsų inžinieriai. Ar jums reikia kito pardavėjo, kito kontaktinio taško, ar palaipsniui perkelsite visą apkrovą iš tiekėjo A į pardavėją B?

Nereikėtų kurti subjektų, viršijančių tai, kas būtina.

iSCSI/FC/Failas

Tarp inžinierių nėra sutarimo prieigos protokolų klausimu, o diskusijos labiau primena teologines nei inžinerines diskusijas. Tačiau apskritai galima atkreipti dėmesį į šiuos dalykus:

FCoE daugiau mirusių nei gyvų.

FC prieš iSCSI. Vienas iš pagrindinių FC pranašumų 2019 m., palyginti su IP saugykla, skirta duomenų prieigos gamykla, yra kompensuojamas specialiu IP tinklu. FC neturi pasaulinių pranašumų prieš IP tinklus, o IP gali būti naudojamas kuriant bet kokio apkrovos lygio saugojimo sistemas, iki didelių DBVS sistemų, skirtų pagrindinei didelio banko bankų sistemai. Kita vertus, FC mirtis pranašaujama jau keletą metų, bet kažkas nuolat tam trukdo. Pavyzdžiui, šiandien kai kurie saugyklų rinkos žaidėjai aktyviai kuria NVMEoF standartą. Ar jis pasidalins FCoE likimu – parodys laikas.

Prieiga prie failų taip pat nėra kažkas neverto dėmesio. NFS/CIFS gerai veikia produktyvumo aplinkoje ir, jei suprojektuota teisingai, neturi daugiau priekaištų nei blokiniai protokolai.

Hibridinis / visas „Flash“ masyvas

Klasikinės saugojimo sistemos yra dviejų tipų:

  1. AFA (All Flash Array) – sistemos, optimizuotos naudoti SSD.
  2. Hibridinis – leidžia naudoti ir HDD, ir SSD arba jų derinį.

Pagrindinis jų skirtumas yra palaikomos saugojimo efektyvumo technologijos ir maksimalus našumo lygis (didelis IOPS ir mažas delsimas). Abi sistemos (daugumoje jų modelių, neskaitant žemos klasės segmento) gali veikti ir kaip blokiniai, ir kaip failų įrenginiai. Palaikomas funkcionalumas priklauso nuo sistemos lygio, o jaunesniems modeliams dažniausiai sumažinamas iki minimalaus lygio. Į tai verta atkreipti dėmesį, kai tyrinėjate konkretaus modelio charakteristikas, o ne tik visos linijos galimybes. Taip pat, žinoma, nuo sistemos lygio priklauso ir jo techninės charakteristikos, tokios kaip procesorius, atminties kiekis, talpykla, prievadų skaičius ir tipai ir kt. Valdymo požiūriu AFA nuo hibridinių (disko) sistemų skiriasi tik darbo su SSD diskais mechanizmų įgyvendinimu, ir net jei hibridinėje sistemoje naudojate SSD, tai visiškai nereiškia, kad galėsite pasiekti AFA sistemos našumo lygį. Be to, daugeliu atvejų hibridinėse sistemose išjungiami veiksmingi saugojimo mechanizmai, o jų įtraukimas praranda našumą.

Specialios saugojimo sistemos

Be bendrosios paskirties saugojimo sistemų, daugiausia orientuotų į operatyvinį duomenų apdorojimą, yra specialios saugojimo sistemos, kurių pagrindiniai principai iš esmės skiriasi nuo įprastų (mažas delsimas, didelis IOPS):

Žiniasklaida.

Šios sistemos skirtos dideliems medijos failams saugoti ir apdoroti. Resp. delsimas tampa praktiškai nereikšmingas, todėl išryškėja galimybė siųsti ir priimti duomenis plačia juosta daugeliu lygiagrečių srautų.

Atsarginių kopijų saugojimo sistemų dubliavimo panaikinimas.

Kadangi atsarginės kopijos išsiskiria savo panašumu viena į kitą, o tai įprastomis sąlygomis pasitaiko retai (vidutinė atsarginė kopija nuo vakarykštės skiriasi 1-2%), šios klasės sistemos itin efektyviai supakuoja jose įrašytus duomenis į gana mažą fizinių laikmenų skaičius. Pavyzdžiui, kai kuriais atvejais duomenų glaudinimo koeficientas gali siekti 200:1.

Objektų saugojimo sistemos.

Šios saugojimo sistemos neturi įprastų blokinės prieigos tomų ir failų bendrinimo, o labiausiai primena didžiulę duomenų bazę. Prieiga prie tokioje sistemoje saugomo objekto atliekama naudojant unikalų identifikatorių arba metaduomenis (pavyzdžiui, visi JPEG formato objektai, kurių sukūrimo data yra nuo XX-XX-XXXX iki YY-YY-YYYY).

Atitikties sistema.

Šiandien Rusijoje jie nėra tokie įprasti, tačiau verta paminėti. Tokių saugojimo sistemų paskirtis – garantuotas duomenų saugojimas, atitinkantis saugumo politiką arba norminius reikalavimus. Kai kuriose sistemose (pavyzdžiui, EMC Centera) yra įdiegta duomenų trynimo uždraudimo funkcija – vos pasukus raktą ir sistemai perėjus į šį režimą, nei administratorius, nei kas nors kitas negali fiziškai ištrinti jau įrašytų duomenų.

Patentuotos technologijos

Flash talpykla

„Flash Cache“ yra bendras visų patentuotų technologijų, skirtų naudoti „flash“ atmintį kaip antrojo lygio talpyklą, pavadinimas. Naudojant „flash“ talpyklą, saugojimo sistema paprastai apskaičiuojama taip, kad užtikrintų pastovią magnetinių diskų apkrovą, o didžiausią talpyklą aptarnauja talpykla.

Tokiu atveju būtina suprasti apkrovos profilį ir prieigos prie saugojimo tūrių blokų lokalizacijos laipsnį. „Flash“ talpykla yra technologija, skirta darbo krūviams su labai lokalizuotomis užklausomis ir praktiškai netaikoma vienodai įkeliamiems kiekiams (pvz., analizės sistemoms).

Rinkoje yra du „flash“ talpyklos diegimai:

  • Tik skaitymui. Šiuo atveju talpykloje saugomi tik nuskaityti duomenys, o rašymas eina tiesiai į diskus. Kai kurie gamintojai, pavyzdžiui, „NetApp“, mano, kad rašymas į jų saugojimo sistemas jau yra optimalus, o talpykla visiškai nepadės.
  • Skaityk rašyk. Ne tik skaitymas, bet ir rašymas yra talpykloje, o tai leidžia buferizuoti srautą ir sumažinti RAID baudos poveikį, o dėl to padidinti bendrą saugojimo sistemų našumą su mažiau optimaliu rašymo mechanizmu.

Pakopų nustatymas

Kelių lygių saugykla (varginanti) yra technologija, skirta sujungti skirtingų našumo lygių lygius, pvz., SSD ir HDD, į vieną diskų telkinį. Esant ryškiems prieigos prie duomenų blokų netolygumams, sistema galės automatiškai subalansuoti duomenų blokus, perkeldama įkrautus į didelio našumo lygį, o šaltus, priešingai, į lėtesnį.

Žemesnės ir vidurinės klasės hibridinėse sistemose naudojama kelių lygių saugykla, o duomenys perkeliami iš vieno lygio pagal tvarkaraštį. Tuo pačiu metu geriausių modelių kelių lygių saugojimo bloko dydis yra 256 MB. Šios savybės neleidžia mums laikyti pakopinės saugojimo technologijos produktyvumo didinimo technologija, kaip daugelis klaidingai mano. Daugiapakopis saugojimas žemos ir vidutinės klasės sistemose yra technologija, skirta optimizuoti saugojimo išlaidas sistemoms, kuriose yra ryškus apkrovos netolygumas.

Momentinė nuotrauka

Kad ir kiek kalbėtume apie saugojimo sistemų patikimumą, yra daug galimybių prarasti duomenis, kurie nepriklauso nuo aparatinės įrangos problemų. Tai gali būti virusai, įsilaužėliai ar bet koks kitas netyčinis duomenų ištrynimas / sugadinimas. Dėl šios priežasties gamybos duomenų atsarginių kopijų kūrimas yra neatsiejama inžinieriaus darbo dalis.

Momentinė nuotrauka yra momentinė apimties nuotrauka tam tikru momentu. Dirbant su dauguma sistemų, tokių kaip virtualizacija, duomenų bazės ir kt. turime padaryti tokį momentinį vaizdą, iš kurio nukopijuosime duomenis į atsarginę kopiją, o mūsų IS galės saugiai toliau dirbti su šiuo tomu. Tačiau verta atsiminti, kad ne visos momentinės nuotraukos yra vienodai naudingos. Skirtingi pardavėjai taiko skirtingus požiūrius į momentinių nuotraukų, susijusių su jų architektūra, kūrimą.

COW (kopijuoti ant rašymo). Kai bandote įrašyti duomenų bloką, jo originalus turinys nukopijuojamas į specialią sritį, po kurios rašymas vyksta įprastai. Tai apsaugo nuo duomenų sugadinimo momentinės nuotraukos viduje. Natūralu, kad visos šios „parazitinės“ duomenų manipuliacijos papildomai apkrauna saugojimo sistemą ir dėl šios priežasties panašių diegimų pardavėjai nerekomenduoja naudoti daugiau nei tuziną momentinių nuotraukų, o labai apkrautuose tomuose jų visai nenaudoti.

Eilutė (peradresavimas rašant). Tokiu atveju pradinis tūris natūraliai užšąla, o bandant įrašyti duomenų bloką, saugojimo sistema įrašo duomenis į specialią sritį laisvoje erdvėje, pakeisdama šio bloko vietą metaduomenų lentelėje. Tai leidžia sumažinti perrašymo operacijų skaičių, o tai galiausiai pašalina našumo sumažėjimą ir pašalina momentinių vaizdų bei jų skaičiaus apribojimus.

Momentinės nuotraukos taip pat yra dviejų tipų, susijusių su programomis:

Taikymo nuoseklumas. Momentinės nuotraukos kūrimo metu saugojimo sistema iš vartotojo operacinės sistemos ištraukia agentą, kuris priverstinai išplauna disko talpyklas iš atminties į diską ir priverčia programą tai padaryti. Tokiu atveju, atkuriant iš momentinės nuotraukos, duomenys bus nuoseklūs.

Avarijos nuoseklus. Tokiu atveju nieko panašaus neįvyksta ir momentinė nuotrauka sukuriama tokia, kokia yra. Atkūrimo po tokios momentinės nuotraukos vaizdas yra identiškas tai, kas atsitiktų staiga išjungus maitinimą ir galimi tam tikri duomenų praradimai, įstrigę talpyklose ir nepasiekę disko. Tokias momentines nuotraukas lengviau įdiegti ir jos nesumažina programų našumo, tačiau yra mažiau patikimos.

Kodėl saugojimo sistemose reikalingos momentinės nuotraukos?

  • Atsarginė kopija be agento tiesiai iš saugojimo sistemos
  • Kurkite testavimo aplinką, pagrįstą tikrais duomenimis
  • Failų saugojimo sistemų atveju ji gali būti naudojama kuriant VDI aplinkas, naudojant saugojimo sistemos momentines nuotraukas, o ne hipervizorių.
  • Užtikrinkite mažus RPO kurdami suplanuotas momentines nuotraukas, kurių dažnis yra daug didesnis nei atsarginės kopijos dažnis

Klonavimas

Tūrinis klonavimas – veikia panašiu principu kaip momentinės nuotraukos, tačiau naudojamas ne tik duomenims nuskaityti, bet ir pilnam darbui su jais. Galime gauti tikslią savo tomo kopiją su visais joje esančiais duomenimis, nedarydami fizinės kopijos, tai sutaupys vietos. Paprastai apimties klonavimas naudojamas „Test&Dev“ arba jei norite patikrinti kai kurių IS naujinimų funkcionalumą. Klonavimas leis tai padaryti kuo greičiau ir ekonomiškiau disko išteklių atžvilgiu, nes Bus rašomi tik pakeisti duomenų blokai.

Replikacija / Žurnalų rašymas

Replikacija yra mechanizmas, leidžiantis sukurti duomenų kopiją kitoje fizinėje saugojimo sistemoje. Paprastai kiekvienas pardavėjas turi patentuotą technologiją, kuri veikia tik savo linijoje. Tačiau yra ir trečiųjų šalių sprendimų, įskaitant tuos, kurie veikia hipervizoriaus lygiu, pvz., „VMware vSphere Replication“.

Patentuotų technologijų funkcionalumas ir jų naudojimo paprastumas paprastai yra daug pranašesni už universaliąsias, tačiau pasirodo, kad jos nepritaikomos, kai, pavyzdžiui, reikia padaryti „NetApp“ kopiją į HP MSA.

Replikacija skirstoma į du potipius:

Sinchroninis. Sinchroninio replikacijos atveju įrašymo operacija iš karto siunčiama į antrąją saugojimo sistemą, o vykdymas nepatvirtinamas tol, kol nepatvirtina nuotolinio saugojimo sistema. Dėl šios priežasties prieigos delsa didėja, tačiau mes turime tikslią veidrodinę duomenų kopiją. Tie. RPO = 0, jei prarandama pagrindinė saugojimo sistema.

asinchroninis. Rašymo operacijos vykdomos tik pagrindinėje saugojimo sistemoje ir patvirtinamos iš karto, kartu kaupiamos buferyje paketiniam perdavimui į nuotolinio saugojimo sistemą. Šis replikacijos tipas tinka mažiau vertingiems duomenims arba kanalams su mažu pralaidumu arba dideliu delsimu (būdinga didesniems nei 100 km atstumams). Atitinkamai, RPO = paketų siuntimo dažnis.

Dažnai kartu su replikacija yra mechanizmas medienos ruoša disko operacijos. Šiuo atveju kirtimui skiriamas specialus plotas ir saugomos tam tikro gylio laike arba apribotos rąsto tūrio operacijos. Tam tikroms patentuotoms technologijoms, pvz., EMC RecoverPoint, yra integracija su sistemos programine įranga, leidžiančia susieti tam tikras žymes su konkrečiu žurnalo įrašu. Dėl šios priežasties galima grąžinti tūrio būseną (arba sukurti kloną) ne tik iki balandžio 23 d., 11 valandų 59 sekundžių 13 milisekundžių, bet iki momento prieš „DROP ALL TABLES; ĮSIPAREIGOTI“.

Metro klasteris

Metro klasteris yra technologija, leidžianti sukurti dvikryptį sinchroninį replikaciją tarp dviejų saugojimo sistemų taip, kad iš išorės ši pora atrodytų kaip viena saugojimo sistema. Jis naudojamas kuriant grupes su geografiškai atskirtomis rankomis metro atstumu (mažiau nei 100 km).

Remiantis naudojimo virtualizacijos aplinkoje pavyzdžiu, metroklasteris leidžia sukurti duomenų saugyklą su virtualiomis mašinomis, pasiekiamą įrašymui iš dviejų duomenų centrų vienu metu. Šiuo atveju hipervizoriaus lygiu sukuriamas klasteris, susidedantis iš prieglobos skirtinguose fiziniuose duomenų centruose, prijungtų prie šios duomenų saugyklos. Tai leidžia atlikti šiuos veiksmus:

  • Visiškas atkūrimo proceso automatizavimas po vieno iš duomenų centrų mirties. Be papildomų lėšų visos VM, veikiančios mirusiame duomenų centre, bus automatiškai paleistos iš naujo likusiame. RTO = didelio pasiekiamumo klasterio skirtasis laikas (15 sekundžių VMware) + laikas įkelti operacinę sistemą ir paleisti paslaugas.
  • Nelaimių išvengimas arba, rusiškai, nelaimių išvengimas. Jeigu 1-ame duomenų centre planuojami maitinimo darbai, tai turime galimybę visą svarbią apkrovą migruoti į 2-ąjį duomenų centrą be sustojimo iš anksto, prieš pradedant darbus.

Virtualizacija

Saugyklos virtualizavimas techniškai yra tomų iš kitos saugojimo sistemos naudojimas kaip diskai. Saugyklos virtualizatorius gali tiesiog perduoti kieno nors kito tomą vartotojui kaip savo, tuo pat metu atspindėdamas jį kitoje saugojimo sistemoje arba net sukurti RAID iš išorinių tomų.
Klasikiniai saugojimo virtualizavimo klasės atstovai yra EMC VPLEX ir IBM SVC. Ir, žinoma, saugojimo sistemos su virtualizacijos funkcionalumu – NetApp, Hitachi, IBM / Lenovo Storwize.

Kodėl jo gali prireikti?

  • Atleidimas saugojimo sistemos lygiu. Tarp tomų sukuriamas veidrodis, o viena pusė gali būti HP 3Par, o kita - NetApp. O virtualizatorius yra iš EMC.
  • Perkelkite duomenis tarp skirtingų gamintojų saugojimo sistemų su minimaliomis prastovomis. Tarkime, kad duomenis reikia perkelti iš senojo 3Par, kuris bus nurašytas, į naująjį „Dell“. Tokiu atveju vartotojai atjungiami nuo 3Par, tūriai perkeliami pagal VPLEX ir vėl pateikiami vartotojams. Kadangi garsumas nė kiek nepasikeitė, darbas tęsiasi. Garso atspindėjimo į naująjį „Dell“ procesas prasideda fone, o baigus veidrodis sugenda ir 3Par išjungiamas.
  • Metroklasterių organizavimas.

Suspaudimas / išduplikavimas

Suspaudimas ir dubliavimo panaikinimas yra technologijos, leidžiančios sutaupyti vietos diske saugojimo sistemoje. Iš karto verta paminėti, kad iš principo ne visi duomenys yra suglaudinami ir (arba) deduplikuojami, tuo tarpu kai kurių tipų duomenys yra geriau suglaudinami ir atšaukiami, o kai kurie – atvirkščiai.

Yra 2 glaudinimo ir dubliavimo panaikinimo tipai:

Įterpti — prieš įrašant šiuos duomenis į diską įvyksta duomenų blokų suspaudimas ir dubliavimo panaikinimas. Taigi sistema tik apskaičiuoja bloko maišą ir palygina ją lentelėje su esamomis. Pirma, tai greičiau nei tiesiog rašymas į diską, antra, mes neeikvojame papildomos vietos diske.

paštas - kai šios operacijos atliekamos su jau įrašytais duomenimis, esančiais diskuose. Atitinkamai, pirmiausia duomenys įrašomi į diską, o tik tada apskaičiuojama maiša ir ištrinami nereikalingi blokai bei atlaisvinami disko resursai.

Verta pasakyti, kad dauguma pardavėjų naudoja abu tipus, o tai leidžia optimizuoti šiuos procesus ir taip padidinti jų efektyvumą. Dauguma saugyklos pardavėjų turi paslaugų, leidžiančių analizuoti duomenų rinkinius. Šios komunalinės paslaugos veikia pagal tą pačią logiką, kuri yra įdiegta saugojimo sistemoje, todėl numatomas efektyvumo lygis bus toks pat. Be to, atminkite, kad daugelis pardavėjų turi našumo garantijų programas, kurios žada bent tokį patį gerą tam tikrų (arba visų) duomenų tipų našumą. Ir neturėtumėte pamiršti šios programos, nes apskaičiuodami sistemą savo užduotims, atsižvelgdami į konkrečios sistemos efektyvumo koeficientą, galite sutaupyti. Taip pat verta manyti, kad šios programos yra skirtos AFA sistemoms, tačiau įsigijus mažesnį SSD tūrį nei klasikinėse sistemose esantys HDD, tai sumažins jų sąnaudas ir, jei neprilygs disko sistemos kainai, tada. priartėti prie jo gana arti.

Modelis

Ir čia mes priėjome prie teisingo klausimo.

„Jie man siūlo dvi saugojimo parinktis – ABC SuperStorage S600 ir XYZ HyperOcean 666v4, ką rekomenduojate?

Pavirsta į „Čia jie man siūlo dvi saugyklos parinktis – ABC SuperStorage S600 ir XYZ HyperOcean 666v4, ką rekomenduojate?

Tikslinė apkrova yra mišrios VMware virtualios mašinos su gamybos / bandymo / kūrimo kilpomis. Testas = produktyvus. 150 TB kiekvienas su didžiausiu 80 000 IOPS 8kb našumu, 50 % laisvosios prieigos 80/20 skaitymo ir rašymo blokas. 300 TB plėtrai, užtenka 50 000 IOPS, 80 atsitiktinių, 80 rašyti.

Manoma, kad produktyvumas metroklasteryje RPO = 15 minučių RTO = 1 valanda, plėtra asinchroninėje replikacijoje RPO = 3 valandos, bandymas vienoje vietoje.

Bus 50 TB DBVS, jiems būtų malonu prisijungti.

Visur turime „Dell“ serverius, senas „Hitachi“ saugojimo sistemas, jos vos susitvarko, planuojame padidinti apkrovą 50% pagal apimtį ir našumą“.

Kaip sakoma, teisingai suformuluotas klausimas turi 80% atsakymo.

Papildoma informacija

Ką, pasak autorių, reikėtų perskaityti papildomai

knygos

  • Oliferis ir Oliferis „Kompiuterių tinklai“. Knyga padės susisteminti ir galbūt geriau suprasti, kaip veikia IP / Ethernet saugojimo sistemų duomenų perdavimo terpė
  • „EMC informacijos saugojimas ir valdymas“. Puiki knyga apie saugojimo sistemų pagrindus, kodėl, kaip ir kodėl.

Forumai ir pokalbiai

Bendrosios rekomendacijos

Kainos

Dabar kalbant apie kainas – apskritai, jei yra saugojimo sistemų kainos, tai dažniausiai yra Sąrašo kainos, nuo kurių kiekvienas klientas gauna individualią nuolaidą. Nuolaidos dydis susideda iš daugybės parametrų, todėl nuspėti, kokią galutinę kainą gaus Jūsų įmonė, nepaklausus platintojo tiesiog neįmanoma. Tačiau tuo pačiu metu įprastose kompiuterių parduotuvėse, pavyzdžiui, pradėjo pasirodyti žemos klasės modeliai nix.ru arba xcom-shop.ru. Čia galite iš karto įsigyti jus dominančią sistemą už fiksuotą kainą, kaip ir bet kokius kompiuterio komponentus.

Tačiau iš karto norėčiau pastebėti, kad tiesioginis palyginimas pagal TB/$ nėra teisingas. Jei žvelgsime iš šios pusės, tai pigiausias sprendimas bus paprastas JBOD + serveris, kuris nesuteiks nei lankstumo, nei patikimumo, kurį suteikia visavertė, dviejų valdiklių saugojimo sistema. Tai visiškai nereiškia, kad JBOD yra šlykštus ir bjaurus nešvarus triukas, tereikia vėl labai aiškiai suprasti, kaip ir kokiais tikslais naudosite šį sprendimą. Dažnai galima išgirsti, kad JBOD nėra ko laužyti, yra tik viena galinė plokštė. Tačiau galinės plokštės kartais sugenda. Viskas anksčiau ar vėliau sugenda.

Iš viso

Reikia lyginti sistemas tarpusavyje ne tik pagal kainą, ar ne tik pagal našumą, bet pagal visų rodiklių visumą.

Pirkite HDD tik tuo atveju, jei esate tikri, kad jums reikia HDD. Dėl mažų apkrovų ir nesuspaudžiamų duomenų tipų, priešingu atveju verta kreiptis į SSD saugojimo efektyvumo garantijų programas, kurias dabar turi dauguma pardavėjų (ir jos tikrai veikia net Rusijoje), tačiau viskas priklauso nuo programų ir duomenų, kurie bus rasti. šioje saugojimo sistemoje.

Nepirkite pigiai. Kartais tai slepia daugybę nemalonių akimirkų, iš kurių vieną Jevgenijus Elizarovas aprašė savo straipsniuose apie Infortrend. Ir tai, galų gale, šis pigumas gali atsiliepti prieš jus. Nepamirškite - „šykštuolis moka du kartus“.

Šaltinis: www.habr.com

Добавить комментарий