Kuinka valita säilytystila ampumatta itseäsi jalkaan

Esittely

On aika ostaa säilytystilaa. Kumpi ottaa, ketä kuunnella? Toimittaja A puhuu toimittajasta B, ja sitten on integraattori C, joka väittää päinvastaista ja neuvoo myyjää D. Tällaisessa tilanteessa kokeneenkin varastoarkkitehdin pää pyörii, varsinkin kun kaikki uudet myyjät ja SDS ja hyperkonvergenssi ovat muodikkaita tänään.

Joten miten saat selville kaiken ja et päädy hölmöksi? Me (AntonVirtual Anton Zhbankov ja kehon Jevgeni Elizarov) yritetään puhua tästä puhtaalla venäjällä.
Artikkelissa on monia yhtäläisyyksiä ja se on itse asiassa jatkoa "Virtualisoitu datakeskussuunnittelu” tallennusjärjestelmien valinnassa ja tallennustekniikoiden arvioinnissa. Tarkastellaan lyhyesti yleistä teoriaa, mutta suosittelemme, että luet myös tämän artikkelin.

Mitä varten

Voit usein nähdä tilanteen, jossa uusi henkilö tulee foorumille tai erikoistuneeseen chattiin, kuten Storage Discussions, ja kysyy: "tässä he tarjoavat minulle kaksi tallennusvaihtoehtoa - ABC SuperStorage S600 ja XYZ HyperOcean 666v4, mitä suosittelette ?”

Ja hämmennys alkaa siitä, kenellä on mitä ominaisuuksia kauheiden ja käsittämättömien ominaisuuksien toteuttamisessa, jotka valmistautumattomalle henkilölle ovat täysin kiinalaisia.

Joten avain ja ensimmäinen kysymys, joka sinun on kysyttävä itseltäsi kauan ennen kaupallisten ehdotusten teknisten tietojen vertailua, on MIKSI? Miksi tätä säilytysjärjestelmää tarvitaan?

Kuinka valita säilytystila ampumatta itseäsi jalkaan

Vastaus on odottamaton, ja hyvin Tony Robbinsin tyyliin - tallentaa tietoja. Kiitos, kapteeni! Ja silti, joskus menemme niin syvälle yksityiskohtien vertailuun, että unohdamme miksi teemme kaiken tämän.

Tietojen tallennusjärjestelmän tehtävänä on siis tallentaa ja tarjota pääsy DATA:lle tietyllä suorituskyvyllä. Aloitamme tiedoista.

Tiedot

Tietotyyppi

Millaisia ​​tietoja aiomme tallentaa? Erittäin tärkeä kysymys, joka voi poistaa monia tallennusjärjestelmiä edes harkitusta. Aiot esimerkiksi tallentaa videoita ja valokuvia. Voit välittömästi yliviivata järjestelmät, jotka on suunniteltu satunnaiseen käyttöön pienissä lohkoissa, tai järjestelmät, joissa on omat pakkaus-/kopiointiominaisuudet. Nämä voivat yksinkertaisesti olla erinomaisia ​​järjestelmiä, emme halua sanoa mitään pahaa. Mutta tässä tapauksessa niiden vahvuudet joko heikkenevät (videota ja valokuvia ei pakata) tai yksinkertaisesti lisäävät järjestelmän kustannuksia merkittävästi.

Kääntäen, jos käyttötarkoituksena on kiireinen tapahtumatietokantajärjestelmä, erinomaiset multimedian suoratoistojärjestelmät, jotka pystyvät toimittamaan gigatavuja sekunnissa, ovat huono valinta.

Tietojen määrä

Kuinka paljon dataa aiomme tallentaa? Määrästä kehittyy aina laatu; tätä ei pidä koskaan unohtaa, varsinkin nyt, kun datamäärä kasvaa eksponentiaalisesti. Petabyyttiluokan järjestelmät eivät ole enää harvinaisia, mutta mitä suurempi petatavukapasiteetti on, sitä tarkempi järjestelmä muuttuu, sitä vähemmän saavutettavissa on pienten ja keskikokoisten hajasaantijärjestelmien tavanomaiset toiminnot. Se on triviaalia, koska pelkästään lohkokäyttötilastotaulukot tulevat suuremmiksi kuin ohjainten käytettävissä oleva RAM-muistin määrä. Puhumattakaan puristamisesta/tasostamisesta. Oletetaan, että haluamme vaihtaa pakkausalgoritmin tehokkaampaan ja pakata 20 petabyyttiä tietoa. Kuinka kauan se kestää: kuusi kuukautta, vuosi?

Toisaalta, miksi vaivautua, jos sinun täytyy tallentaa ja käsitellä 500 Gt dataa? Vain 500. Tämän kokoiset kotitalouksien SSD-levyt (alhainen DWPD) eivät maksa mitään. Miksi rakentaa Fibre Channel -tehdas ja ostaa huippuluokan ulkoisia tallennusjärjestelmiä, jotka maksavat valurautaista siltaa vastaavan summan?

Kuinka monta prosenttia kokonaismäärästä on kuumaa dataa? Kuinka epätasainen kuormitus on datamäärän suhteen? Tässä porrastettu tallennustekniikka tai Flash-välimuisti voi olla erittäin hyödyllinen, jos kuuman tiedon määrä on pieni verrattuna kokonaismäärään. Tai päinvastoin, koko volyymin tasaisella kuormituksella, jota usein esiintyy suoratoistojärjestelmissä (videovalvonta, jotkut analytiikkajärjestelmät), tällaiset tekniikat eivät tarjoa mitään ja vain lisäävät järjestelmän kustannuksia / monimutkaisuutta.

IC

Tiedon toinen puoli on dataa käyttävä tietojärjestelmä. IS:llä on joukko vaatimuksia, jotka perivät tiedot. Lisätietoja IS:stä on kohdassa Virtualized Data Center Design.

Kestävyys/saatavuusvaatimukset

Vaatimukset vikasietokyvylle/tietojen saatavuudelle periytyvät niitä käyttävältä IS:ltä ja ilmaistaan ​​kolmella numerolla - RPO, RTO, saatavuus.

saatavuus — osuus tietyltä ajanjaksolta, jonka aikana tietoja on saatavilla heidän kanssaan työskentelyä varten. Yleensä ilmaistaan ​​lukuna 9. Esimerkiksi kaksi yhdeksää vuodessa tarkoittaa, että saatavuus on 99 % tai muuten 95 tuntia poissaoloa vuodessa sallitaan. Kolme yhdeksää - 9,5 tuntia vuodessa.

RPO / RTO eivät ole kokonaisindikaattoreita, vaan jokaisesta tapauksesta (onnettomuudesta), toisin kuin saatavuus.

RPO — onnettomuuden aikana menetettyjen tietojen määrä (tunteina). Jos esimerkiksi varmuuskopiointi tapahtuu kerran päivässä, RPO = 24 tuntia. Nuo. Katastrofin ja tallennusjärjestelmän täydellisen katoamisen sattuessa tietoja voidaan menettää jopa 24 tuntia (varmuuskopion tekemisestä). Esimerkiksi IS:lle määritetyn RPO:n perusteella kirjoitetaan varmuuskopiointisäännöt. RPO:n perusteella voit myös ymmärtää, kuinka paljon synkronista/asynkronista tietojen replikointia tarvitaan.

RTO — aika palauttaa palvelu (tietoihin pääsy) katastrofin jälkeen. Annetun RTO-arvon perusteella voimme ymmärtää, tarvitaanko metroklusteria vai riittääkö yksisuuntainen replikointi. Tarvitsetko huippuluokan moniohjaimen tallennusjärjestelmän?

Kuinka valita säilytystila ampumatta itseäsi jalkaan

Suorituskykyvaatimukset

Vaikka tämä on hyvin ilmeinen kysymys, suurin osa vaikeuksista syntyy siitä. Riippuen siitä, onko sinulla jo jonkinlainen infrastruktuuri vai ei, rakennetaan tapoja kerätä tarvittavat tilastot.

Sinulla on jo säilytysjärjestelmä ja etsit vaihtoa tai haluat ostaa toisen laajentamista varten. Täällä kaikki on yksinkertaista. Ymmärrät, mitä palveluita sinulla on jo ja mitä aiot ottaa käyttöön lähitulevaisuudessa. Nykyisten palvelujen perusteella sinulla on mahdollisuus kerätä suorituskykytilastoja. Päätä nykyinen IOPS-määrä ja nykyinen latenssi - mitä nämä indikaattorit ovat ja ovatko ne riittävät tehtäviisi? Tämä voidaan tehdä sekä itse tiedontallennusjärjestelmässä että siihen yhdistetyissä isännissä.

Lisäksi sinun ei tarvitse tarkastella vain nykyistä kuormitusta, vaan tietyn ajanjakson (mieluiten kuukauden) aikana. Katso, mitkä huippuhuiput ovat päivän aikana, mitä kuormitusta varmuuskopiointi luo jne. Jos tallennusjärjestelmäsi tai sen ohjelmisto ei tarjoa sinulle täydellistä sarjaa näistä tiedoista, voit käyttää ilmaista RRDtool-työkalua, joka toimii useimpien suosituimpien tallennusjärjestelmien ja kytkimien kanssa ja voi tarjota sinulle yksityiskohtaisia ​​suorituskykytilastoja. On myös syytä tarkastella tämän tallennusjärjestelmän kanssa toimivien isäntien kuormitusta tiettyjen virtuaalikoneiden osalta tai tarkalleen, mitä tällä isännällä on käynnissä.

Kuinka valita säilytystila ampumatta itseäsi jalkaan

Erikseen kannattaa huomioida, että jos levyn ja tällä taltiolla sijaitsevan tietovaraston viiveet poikkeavat toisistaan ​​melko merkittävästi, kannattaa kiinnittää huomiota SAN-verkkoosi, siinä on suuri todennäköisyys, että siinä on ongelmia ja ennen uuden ostamista. järjestelmässä, kannattaa tutkia tätä asiaa, koska on erittäin suuri todennäköisyys parantaa nykyisen järjestelmän suorituskykyä.

Olet rakentamassa infrastruktuuria tyhjästä tai ostamassa järjestelmää johonkin uuteen palveluun, jonka kuormituksista et ole tietoinen. Vaihtoehtoja on useita: ota yhteyttä kollegoiden kanssa erikoisresurssien avulla selvittääksesi ja ennustaaksesi kuormitusta, ota yhteyttä integraattoriin, jolla on kokemusta vastaavien palvelujen toteuttamisesta ja joka voi laskea kuorman puolestasi. Ja kolmas vaihtoehto (yleensä vaikein, varsinkin jos se koskee kotikirjoitettuja tai harvinaisia ​​sovelluksia) on yrittää selvittää suorituskykyvaatimukset järjestelmän kehittäjiltä.

Ja huomaa, että käytännön soveltamisen kannalta oikea vaihtoehto on pilotti nykyisestä laitteesta tai myyjän/integraattorin testattavaksi toimittamasta laitteistosta.

Erityisvaatimukset

Erityisvaatimuksia ovat kaikki, mikä ei kuulu suorituskyvyn, vikasietoisuuden ja tietojen suoran käsittelyn ja toimituksen toimivuuden vaatimusten piiriin.

Yksi yksinkertaisimmista tiedontallennusjärjestelmän erityisvaatimuksista voidaan kutsua "vieraantuvaksi tallennusvälineeksi". Ja heti käy selväksi, että tässä tiedontallennusjärjestelmässä on oltava nauhakirjasto tai yksinkertaisesti nauha-asema, jolle varmuuskopio tallennetaan. Tämän jälkeen erikoiskoulutettu henkilö allekirjoittaa nauhan ja kantaa sen ylpeänä erityiseen kassakaappiin.
Toinen esimerkki erityisvaatimuksista on suojattu iskunkestävä rakenne.

jossa

Toinen pääkomponentti tietyn tallennusjärjestelmän valinnassa on tieto siitä, MISSÄÄ tämä tallennusjärjestelmä sijoitetaan. Alkaen maantiedosta tai ilmasto-olosuhteista ja päättyen henkilöstöön.

Asiakas

Kenelle tämä säilytysjärjestelmä on suunniteltu? Kysymykseen on seuraavat syyt:

Valtion asiakas/kauppa.
Kaupallisella asiakkaalla ei ole rajoituksia, eikä se ole edes velvollinen järjestämään tarjouskilpailuja, paitsi omien sisäisten määräystensä mukaisesti.

Valtion asiakas on eri asia. 44 Liittovaltion laki ja muut tarjoukset ja tekniset eritelmät, jotka voidaan riitauttaa.

Asiakas on sanktioiden alainen
No, kysymys tässä on hyvin yksinkertainen - valintaa rajoittavat vain tietyn asiakkaan saatavilla olevat tarjoukset.

Sisäiset määräykset / myyjät / mallit sallittu ostaa
Kysymys on myös erittäin yksinkertainen, mutta sinun on muistettava se.

Missä fyysisesti

Tässä osiossa pohditaan kaikkia maantieteeseen, viestintäkanaviin ja majoitustilojen mikroilmastoon liittyviä asioita.

henkilöstö

Kuka työskentelee tämän tallennusjärjestelmän kanssa? Tämä on yhtä tärkeää kuin se, mitä tallennusjärjestelmä itse voi tehdä.
Huolimatta siitä, kuinka lupaava, siisti ja upea toimittajan A varastojärjestelmä on, sen asentamisessa ei todennäköisesti ole mitään järkeä, jos henkilökunta vain osaa työskennellä toimittajan B kanssa, eikä jatkohankintoja tai jatkuvaa yhteistyötä A:n kanssa ole suunnitteilla.

Ja tietysti kysymyksen toinen puoli on se, kuinka koulutettua henkilöstöä on tietyllä maantieteellisellä paikalla suoraan yrityksessä ja mahdollisesti työmarkkinoilla. Alueille yksinkertaisten käyttöliittymien tai hallinnan etäkeskittämisen mahdollistavien tallennusjärjestelmien valitseminen voi olla järkevää. Muuten se voi jossain vaiheessa tulla tuskallisen kipeäksi. Internet on täynnä tarinoita siitä, kuinka paikalle saapunut uusi työntekijä, eilen opiskelija, konfiguroi niin, että koko toimisto tuhoutui.

Kuinka valita säilytystila ampumatta itseäsi jalkaan

Ympäristö

Ja tietysti tärkeä kysymys on, missä ympäristössä tämä tallennusjärjestelmä toimii.

  • Entä virtalähde/jäähdytys?
  • Mikä yhteys
  • Mihin se asennetaan?
  • Ja niin edelleen.

Usein nämä kysymykset ovat itsestäänselvyyksiä, eikä niitä erityisesti harkita, mutta joskus ne voivat kääntää kaiken toisin.

Että

Myyjä

Tällä hetkellä (vuoden 2019 puolivälissä) Venäjän tallennusmarkkinat voidaan jakaa viiteen luokkaan:

  1. Ylin divisioona on vakiintuneet yritykset, joilla on laaja valikoima levyhyllyjä yksinkertaisista huippuluokan (HPE, DellEMC, Hitachi, NetApp, IBM / Lenovo)
  2. Toinen divisioona - yritykset, joilla on rajoitettu linja, markkinarakopelaajat, vakavat SDS-toimittajat tai nousevat uudet tulokkaat (Fujitsu, Datacore, Infinidat, Huawei, Pure jne.)
  3. Kolmas divisioona - niche-ratkaisut alemman tason luokkaan, halpa SDS, kehittyneet tuotteet, jotka perustuvat cephiin ja muihin avoimiin projekteihin (Infortrend, Starwind jne.)
  4. SOHO-segmentti - kodin/pienen toimiston pienet ja erittäin pienet säilytysjärjestelmät (Synology, QNAP jne.)
  5. Tuontikorvatut tallennusjärjestelmät - tämä sisältää sekä ensimmäisen divisioonan laitteistot, joissa on uudelleenmerkityt etiketit, että toisen harvinaiset edustajat (RAIDIX, annamme heille toisen etukäteen), mutta pääasiassa tämä on kolmas divisioona (Aerodisk, Baum, Depo jne.)

Jako on melko mielivaltainen, eikä se tarkoita ollenkaan, että kolmas tai SOHO-segmentti olisi huono eikä sitä voida käyttää. Tietyissä projekteissa, joissa on selkeästi määritelty tietojoukko ja kuormitusprofiili, ne voivat toimia erittäin hyvin, ylittäen hinta/laatusuhteeltaan selvästi ensimmäiset. On tärkeää päättää ensin tavoitteesi, kasvunäkymät ja tarvittava toiminnallisuus – sitten Synology palvelee sinua uskollisesti, ja hiuksistasi tulee pehmeät ja silkkiset.

Yksi tärkeimmistä tekijöistä toimittajaa valittaessa on nykyinen ympäristö. Kuinka monta tallennusjärjestelmää sinulla on jo ja mitä tallennusjärjestelmiä insinöörisi voivat työskennellä. Tarvitsetko toisen toimittajan, toisen yhteyspisteen, siirrätkö vähitellen koko kuorman toimittajalta A toimittajalle B?

Ei pidä tuottaa kokonaisuuksia enempää kuin on välttämätöntä.

iSCSI/FC/Tiedosto

Insinöörien keskuudessa ei ole yksimielisyyttä pääsyprotokollasta, ja keskustelu muistuttaa enemmän teologisia kuin teknisiä keskusteluja. Mutta yleisesti ottaen voidaan huomata seuraavat seikat:

FCoE enemmän kuollut kuin elossa.

FC vs iSCSI. Yksi FC:n tärkeimmistä eduista vuonna 2019 verrattuna IP-tallennustilaan, joka on omistettu tehdas tietojen pääsylle, korvataan erillisellä IP-verkolla. FC:llä ei ole globaaleja etuja IP-verkkoihin verrattuna, ja IP:tä voidaan käyttää minkä tahansa kuormitustason tallennusjärjestelmien rakentamiseen, aina suuren pankin ydinpankkijärjestelmän raskaisiin DBMS-järjestelmiin asti. Toisaalta FC:n kuolemaa on ennustettu jo useita vuosia, mutta jokin estää sen jatkuvasti. Nykyään esimerkiksi jotkut tallennusmarkkinoiden toimijat kehittävät aktiivisesti NVMEoF-standardia. Jakaako hän FCoE:n kohtalon - aika näyttää.

Tiedostojen käyttöoikeus ei myöskään ole huomionarvoinen asia. NFS/CIFS toimii hyvin tuottavuusympäristöissä, ja jos se on suunniteltu oikein, siinä ei ole enempää valittamista kuin lohkoprotokollia.

Hybridi / All Flash Array

Klassisia säilytysjärjestelmiä on kahta tyyppiä:

  1. AFA (All Flash Array) - SSD-käyttöön optimoidut järjestelmät.
  2. Hybridi - mahdollistaa sekä HDD:n että SSD:n tai niiden yhdistelmän käytön.

Niiden tärkein ero on tuetut tallennustehokkuustekniikat ja suorituskyvyn maksimitaso (korkea IOPS ja pieni latenssi). Molemmat järjestelmät (useimmissa malleissaan, halvempaa segmenttiä lukuun ottamatta) voivat toimia sekä lohko- että tiedostolaitteina. Tuettu toiminnallisuus riippuu järjestelmän tasosta, ja nuoremmissa malleissa se on useimmiten vähennetty minimitasolle. Tämä kannattaa kiinnittää huomiota, kun tutkit tietyn mallin ominaisuuksia, etkä vain koko linjan ominaisuuksia. Tietysti myös sen tekniset ominaisuudet, kuten prosessori, muistin määrä, välimuisti, porttien määrä ja tyypit jne., riippuvat myös järjestelmän tasosta. Hallinnan näkökulmasta AFA:t eroavat hybridijärjestelmistä (levy) vain SSD-asemien kanssa työskentelymekanismien toteuttamisessa, ja vaikka käyttäisit SSD-levyä hybridijärjestelmässä, tämä ei tarkoita ollenkaan, että pystyt saavuttaa AFA - järjestelmän tason suorituskyky . Useimmissa tapauksissa sisäiset tehokkaat tallennusmekanismit poistetaan käytöstä hybridijärjestelmissä, ja niiden sisällyttäminen johtaa suorituskyvyn heikkenemiseen.

Erityiset säilytysjärjestelmät

Yleiskäyttöisten, ensisijaisesti operatiiviseen tietojenkäsittelyyn keskittyvien tallennusjärjestelmien lisäksi on olemassa erityisiä tallennusjärjestelmiä, joiden keskeiset periaatteet eroavat olennaisesti tavallisista (pieni latenssi, korkea IOPS):

Media.

Nämä järjestelmät on suunniteltu suurten mediatiedostojen tallentamiseen ja käsittelyyn. Resp. viive muuttuu käytännössä merkityksettömäksi, ja kyky lähettää ja vastaanottaa dataa laajalla kaistalla useissa rinnakkaisissa virroissa tulee esiin.

Päällekkäisten tallennusjärjestelmien poistaminen varmuuskopiointia varten.

Koska varmuuskopiot erottuvat keskenään samankaltaisuudestaan, mikä on harvinaista normaaleissa olosuhteissa (keskimääräinen varmuuskopio eroaa eilisestä 1-2 %), tämän luokan järjestelmät pakaavat erittäin tehokkaasti niille tallennetut tiedot melko pieneen fyysisten tietovälineiden määrä. Esimerkiksi joissakin tapauksissa tiedon pakkaussuhteet voivat olla 200:1.

Objektien säilytysjärjestelmät.

Näissä tallennusjärjestelmissä ei ole tavanomaisia ​​estokäyttöisiä määriä ja tiedostoosuuksia, ja ennen kaikkea ne muistuttavat valtavaa tietokantaa. Pääsy tällaiseen järjestelmään tallennettuun objektiin tapahtuu yksilöllisen tunnisteen tai metatietojen avulla (esimerkiksi kaikki JPEG-muotoiset objektit, joiden luontipäivämäärä on välillä XX-XX-XXXX ja YY-YY-YYYY).

Vaatimustenmukaisuusjärjestelmä.

Ne eivät ole niin yleisiä Venäjällä nykyään, mutta ne ovat mainitsemisen arvoisia. Tällaisten tallennusjärjestelmien tarkoitus on taattu tietojen tallennus tietoturvakäytäntöjen tai säännösten vaatimusten mukaisesti. Joissakin järjestelmissä (esim. EMC Centera) on toiminto, joka estää tietojen poistamisen - heti kun avainta käännetään ja järjestelmä siirtyy tähän tilaan, ylläpitäjä tai kukaan muu ei voi fyysisesti poistaa jo tallennettuja tietoja.

Omistusteknologiat

Flash-välimuisti

Flash-välimuisti on yleinen nimi kaikille patentoiduille tekniikoille, joilla flash-muistia käytetään toisen tason välimuistina. Flash-välimuistia käytettäessä tallennusjärjestelmän lasketaan yleensä tarjoavan tasaisen kuormituksen magneettilevyiltä, ​​kun taas piikin palvelee välimuisti.

Tässä tapauksessa on tarpeen ymmärtää kuormitusprofiili ja tallennustilalohkoihin pääsyn lokalisointiaste. Flash-välimuisti on tekniikka työkuormille, joissa on erittäin lokalisoituja kyselyitä, ja sitä ei käytännössä voida soveltaa tasaisesti ladatuissa määrissä (kuten analytiikkajärjestelmissä).

Markkinoilla on kaksi flash-välimuistin toteutusta:

  • Lue ainoastaan. Tässä tapauksessa vain luetut tiedot tallennetaan välimuistiin, ja kirjoittaminen menee suoraan levyille. Jotkut valmistajat, kuten NetApp, uskovat, että heidän tallennusjärjestelmiinsä kirjoittaminen on jo optimaalista, eikä välimuisti auta ollenkaan.
  • Lukea kirjoittaa. Ei vain lukemista, vaan myös kirjoittamista tallennetaan välimuistiin, mikä mahdollistaa virran puskuroinnin ja RAID-rangaistuksen vaikutuksen vähentämisen, mikä lisää yleistä suorituskykyä tallennusjärjestelmissä, joissa on vähemmän optimaalinen kirjoitusmekanismi.

Tasoitus

Monitasoinen tallennus (väsyttävä) on tekniikka, jolla yhdistetään eri suorituskykytasoja, kuten SSD ja HDD, yhdeksi levypooliksi. Jos tietolohkoihin pääsyssä on selvää epätasaisuutta, järjestelmä pystyy automaattisesti tasapainottamaan tietolohkot siirtämällä ladatut korkean suorituskyvyn tasolle ja kylmät päinvastoin hitaammalle.

Alemman ja keskiluokan hybridijärjestelmät käyttävät monitasoista tallennusta, jossa data liikkuu tasojen välillä aikataulun mukaan. Samaan aikaan parhaiden mallien monitasoisen tallennuslohkon koko on 256 Mt. Nämä ominaisuudet eivät salli meidän pitää porrastettua tallennustekniikkaa tuottavuutta lisäävänä teknologiana, kuten monet ihmiset virheellisesti uskovat. Monitasoinen varastointi matalan ja keskiluokan järjestelmissä on tekniikka, jolla optimoidaan varastointikustannukset järjestelmissä, joissa kuormituksen epätasaisuus on selvä.

Kuva

Huolimatta siitä, kuinka paljon puhumme tallennusjärjestelmien luotettavuudesta, on monia mahdollisuuksia menettää tietoja, jotka eivät riipu laitteistoongelmista. Tämä voi olla viruksia, hakkereita tai mitä tahansa muuta tahatonta tietojen poistamista/korruptoitumista. Tästä syystä tuotantotietojen varmuuskopiointi on olennainen osa insinöörin työtä.

Tilannekuva on tilannekuva tilavuudesta jossain vaiheessa. Kun työskentelet useimpien järjestelmien, kuten virtualisoinnin, tietokantojen jne., kanssa. meidän on otettava sellainen tilannekuva, josta kopioimme tiedot varmuuskopioon, kun taas IS voi turvallisesti jatkaa työskentelyä tämän taltion kanssa. Mutta on syytä muistaa, että kaikki tilannekuvat eivät ole yhtä hyödyllisiä. Eri toimittajilla on erilaisia ​​lähestymistapoja arkkitehtuuriinsa liittyvien tilannekuvien luomiseen.

CoW (kopiointi-kirjoitus). Kun yrität kirjoittaa tietolohkoa, sen alkuperäinen sisältö kopioidaan erityisalueelle, jonka jälkeen kirjoittaminen etenee normaalisti. Tämä estää tietojen korruptoitumisen tilannekuvan sisällä. Luonnollisesti kaikki nämä "parasiittiset" tiedonkäsittelyt aiheuttavat lisäkuormitusta tallennusjärjestelmään ja tästä syystä toimittajat, joilla on samankaltaiset toteutukset, eivät suosittele käyttämään yli tusinaa tilannekuvaa ja olemaan käyttämättä niitä ollenkaan erittäin kuormitetuilla taltioilla.

Rivi (uudelleenohjaus kirjoitettaessa). Tällöin alkuperäinen taltio luonnollisesti jäätyy, ja kun yritetään kirjoittaa tietolohkoa, tallennusjärjestelmä kirjoittaa tiedot erityiselle alueelle vapaassa tilassa, jolloin tämä lohko muuttuu metatietotaulukossa. Tämän avulla voit vähentää uudelleenkirjoitustoimintojen määrää, mikä lopulta eliminoi suorituskyvyn heikkenemisen ja poistaa tilannekuvia ja niiden määrää koskevat rajoitukset.

Tilannekuvia on myös kahdenlaisia ​​sovellusten suhteen:

Sovelluksen johdonmukaisuus. Tilannekuvan luomishetkellä tallennusjärjestelmä vetää kuluttajan käyttöjärjestelmään agentin, joka pakottaa levyvälimuistit muistista levylle ja pakottaa sovelluksen tähän. Tässä tapauksessa tilannekuvasta palautettaessa tiedot ovat yhdenmukaisia.

Crash johdonmukainen. Tässä tapauksessa mitään sellaista ei tapahdu ja tilannekuva luodaan sellaisenaan. Kun kyseessä on toipuminen tällaisesta tilannekuvasta, kuva on identtinen sen kanssa, mitä tapahtuisi, jos virta katkaistaan ​​äkillisesti ja tietojen menetys on mahdollista, juuttunut välimuistiin eivätkä koskaan pääse levylle. Tällaiset tilannevedokset on helpompi toteuttaa, eivätkä ne aiheuta sovellusten suorituskyvyn heikkenemistä, mutta ne ovat vähemmän luotettavia.

Miksi tilannekuvia tarvitaan tallennusjärjestelmissä?

  • Agenttiton varmuuskopiointi suoraan tallennusjärjestelmästä
  • Luo testiympäristöjä todellisiin tietoihin perustuen
  • Tiedostojen tallennusjärjestelmien tapauksessa sitä voidaan käyttää VDI-ympäristöjen luomiseen käyttämällä tallennusjärjestelmän tilannekuvia hypervisorin sijaan
  • Varmista alhaiset RPO:t luomalla ajoitettuja tilannekuvia taajuudella, joka on huomattavasti suurempi kuin varmuuskopiointitaajuus

Kloonaus

Volyymikloonaus - toimii samanlaisella periaatteella kuin tilannekuvat, mutta sitä ei käytetä vain tietojen lukemiseen, vaan myös täydelliseen työskentelyyn sen kanssa. Pystymme saamaan tarkan kopion levystämme kaikkine tiedoineen ilman fyysistä kopiota, mikä säästää tilaa. Tyypillisesti volyymikloonausta käytetään joko Test&Devissä tai jos haluat tarkistaa joidenkin IS-päivitysten toimivuuden. Kloonauksen avulla voit tehdä tämän mahdollisimman nopeasti ja taloudellisesti levyresurssien suhteen, koska Vain muuttuneet tietolohkot kirjoitetaan.

Replikointi / päiväkirja

Replikointi on mekanismi, jolla luodaan kopio tiedoista toisessa fyysisessä tallennusjärjestelmässä. Tyypillisesti jokaisella toimittajalla on oma tekniikka, joka toimii vain omalla tuotelinjallaan. Mutta on myös kolmansien osapuolien ratkaisuja, mukaan lukien hypervisor-tasolla toimivat ratkaisut, kuten VMware vSphere Replication.

Omien teknologioiden toimivuus ja helppokäyttöisyys ovat yleensä paljon universaaleja parempia, mutta ne osoittautuvat käyttökelvottomiksi, kun esimerkiksi NetAppista on tarpeen tehdä kopio HP MSA:han.

Replikointi on jaettu kahteen alatyyppiin:

Synkroninen. Synkronisen replikoinnin tapauksessa kirjoitustoiminto lähetetään välittömästi toiseen tallennusjärjestelmään ja suoritusta ei vahvisteta ennen kuin etätallennusjärjestelmä vahvistaa. Tästä johtuen pääsyviive kasvaa, mutta meillä on tiedoista tarkka peilikopio. Nuo. RPO = 0, jos päämuistijärjestelmä katoaa.

asynkroninen. Kirjoitustoiminnot suoritetaan vain päätallennusjärjestelmässä ja vahvistetaan välittömästi, samalla kun ne kerääntyvät puskuriin erälähetystä varten etätallennusjärjestelmään. Tämän tyyppinen replikointi on merkityksellistä vähemmän arvokkaalle datalle tai kanaville, joilla on pieni kaistanleveys tai korkea latenssi (tyypillistä yli 100 km:n etäisyyksille). Vastaavasti RPO = paketin lähetystaajuus.

Usein replikoinnin ohella on mekanismi puunkorjuu levytoiminnot. Tässä tapauksessa on varattu erityinen alue hakkuita varten ja tallennetaan tietyn ajan syvyydet tai tukin tilavuuden rajoittamat toiminnot. Tietyissä patentoiduissa teknologioissa, kuten EMC RecoverPoint, on integrointi järjestelmäohjelmistoon, jonka avulla voit linkittää tiettyjä kirjanmerkkejä tiettyyn lokimerkintään. Tämän ansiosta on mahdollista palauttaa taltion tilaa (tai luoda klooni) ei vain huhtikuun 23. päivään 11 ​​tuntia 59 sekuntia 13 millisekuntia, vaan hetkeen ennen "DROP ALL TABLES; TEHDÄ."

Metroklusteri

Metroklusteri on tekniikka, jonka avulla voit luoda kaksisuuntaisen synkronisen replikoinnin kahden tallennusjärjestelmän välillä siten, että tämä pari näyttää ulkopuolelta yhdeltä tallennusjärjestelmältä. Sitä käytetään luomaan klustereita, joissa on maantieteellisesti erotetut haarat metroetäisyyksillä (alle 100 km).

Virtualisointiympäristön käyttöesimerkin perusteella metroklusterin avulla voit luoda virtuaalikoneita sisältävän tietovaraston, johon voidaan tallentaa kahdesta datakeskuksesta kerralla. Tässä tapauksessa hypervisor-tasolle luodaan klusteri, joka koostuu eri fyysisissä tietokeskuksissa olevista isännistä, jotka on yhdistetty tähän tietovarastoon. Tämän avulla voit tehdä seuraavat:

  • Palautusprosessin täydellinen automatisointi yhden palvelinkeskuksen kuoleman jälkeen. Ilman lisärahoitusta kaikki kuolleessa datakeskuksessa toimivat virtuaalikoneet käynnistetään automaattisesti uudelleen jäljellä olevassa palvelinkeskuksessa. RTO = korkean käytettävyyden klusterin aikakatkaisu (15 sekuntia VMwarelle) + aika käyttöjärjestelmän lataamiseen ja palvelujen käynnistämiseen.
  • Katastrofien välttäminen tai venäjäksi katastrofien välttäminen. Jos konesalissa 1 suunnitellaan tehonsyöttötöitä, niin meillä on mahdollisuus siirtää koko tärkeä kuorma konesaliin 2 taukoamatta etukäteen, ennen töiden alkamista.

virtualisointi

Tallennusvirtualisointi on teknisesti toisen tallennusjärjestelmän taltioiden käyttöä levyinä. Tallennusvirtualisoija voi yksinkertaisesti siirtää jonkun muun taltion kuluttajalle omakseen, samalla peilata sen toiseen tallennusjärjestelmään tai jopa luoda RAIDin ulkoisista taltioista.
Tallennusvirtualisointiluokan klassisia edustajia ovat EMC VPLEX ja IBM SVC. Ja tietysti tallennusjärjestelmät virtualisointitoiminnoilla - NetApp, Hitachi, IBM / Lenovo Storwize.

Miksi se voi olla tarpeen?

  • Redundanssi tallennusjärjestelmän tasolla. Taltioiden väliin luodaan peili, ja toinen puolikas voi olla HP 3Parissa ja toinen NetAppissa. Ja virtualisaattori on EMC:ltä.
  • Siirrä tietoja mahdollisimman vähän seisokkeja eri valmistajien tallennusjärjestelmien välillä. Oletetaan, että tiedot on siirrettävä vanhasta 3Parista, joka poistetaan, uuteen Delliin. Tällöin kuluttajat irrotetaan 3Parista, volyymit siirretään VPLEX:n alle ja esitetään uudelleen kuluttajille. Koska äänenvoimakkuus ei ole muuttunut, työ jatkuu. Äänenvoimakkuuden peilaus uuteen Delliin alkaa taustalla, ja kun se on valmis, peili rikkoutuu ja 3Par poistetaan käytöstä.
  • Metroklusterien järjestäminen.

Pakkaus / kopioinnin poistaminen

Pakkaus ja kopioinnin poistaminen ovat tekniikoita, joiden avulla voit säästää levytilaa tallennusjärjestelmässäsi. On syytä mainita heti, että kaikki tiedot eivät ole periaatteessa pakkaamisen ja/tai kopioinnin alaisia, kun taas tietyn tyyppiset tiedot pakataan ja poistetaan paremmin ja jotkut - päinvastoin.

Pakkausta ja kopioinnin poistoa on 2 tyyppiä:

Linjassa — Tietolohkojen pakkaus ja kopiointi tapahtuu ennen tietojen kirjoittamista levylle. Siten järjestelmä laskee vain lohkon tiivisteen ja vertaa sitä taulukossa olemassa oleviin. Ensinnäkin se on nopeampaa kuin pelkkä levylle kirjoittaminen, ja toiseksi emme tuhlaa ylimääräistä levytilaa.

Kirje - kun nämä toiminnot suoritetaan levyille jo tallennetuille tiedoille. Näin ollen tiedot kirjoitetaan ensin levylle ja vasta sitten lasketaan hash ja tarpeettomat lohkot poistetaan ja levyresurssit vapautetaan.

On syytä sanoa, että useimmat myyjät käyttävät molempia tyyppejä, mikä antaa heille mahdollisuuden optimoida nämä prosessit ja siten lisätä tehokkuuttaan. Useimmilla tallennustilatoimittajilla on apuohjelmia, joiden avulla voit analysoida tietojoukkojasi. Nämä apuohjelmat toimivat samalla logiikalla, joka on toteutettu tallennusjärjestelmässä, joten arvioitu tehokkuustaso on sama. Muista myös, että monilla toimittajilla on suoritustakuuohjelmia, jotka lupaavat vähintään yhtä hyvän suorituskyvyn tietyille (tai kaikille) tietotyypeille. Ja sinun ei pitäisi laiminlyödä tätä ohjelmaa, koska laskemalla järjestelmän tehtävillesi ottaen huomioon tietyn järjestelmän tehokkuuskerroin, voit säästää volyymia. On myös syytä harkita, että nämä ohjelmat on suunniteltu AFA-järjestelmille, mutta koska ostetaan pienempi määrä SSD-levyjä kuin kiintolevyt klassisissa järjestelmissä, tämä vähentää niiden kustannuksia, ja jos ei ole yhtä suuri kuin levyjärjestelmän kustannukset, niin päästä melko lähelle sitä.

Malli

Ja tässä päästään oikeaan kysymykseen.

"He tarjoavat minulle kaksi tallennusvaihtoehtoa - ABC SuperStorage S600 ja XYZ HyperOcean 666v4, mitä suosittelette?"

Muuttuu "Tässä he tarjoavat minulle kaksi tallennusvaihtoehtoa - ABC SuperStorage S600 ja XYZ HyperOcean 666v4, mitä suosittelette?

Kohdekuorma on sekoitettu VMware-virtuaalikone tuotanto-/testaus-/kehityssilmukalla. Testi = tuottava. 150 Tt kukin, huippusuorituskyky 80 000 IOPS 8 kb lohko 50 % satunnaiskäyttö 80/20 luku-kirjoitus. 300 TB kehitystä varten, 50 000 IOPS riittää, 80 satunnaista, 80 kirjoitusta.

Tuottavuus oletettavasti metroklusterissa RPO = 15 minuuttia RTO = 1 tunti, kehitys asynkronisessa replikaatiossa RPO = 3 tuntia, testi yhdessä paikassa.

Tulee 50 Tt:n DBMS, kirjaus olisi mukavaa heille.

Meillä on Dell-palvelimia kaikkialla, vanhoja Hitachi-tallennusjärjestelmiä, ne tuskin selviytyvät, aiomme lisätä kuormitusta 50 % volyymin ja suorituskyvyn suhteen.

Kuten sanotaan, oikein muotoiltu kysymys sisältää 80% vastauksesta.

lisätiedot

Mitä sinun pitäisi lukea lisää tekijöiden mukaan

kirjat

  • Olifer ja Olifer "Tietokoneverkot". Kirja auttaa systematisoimaan ja ehkä paremmin ymmärtämään, kuinka IP/Ethernet-tallennusjärjestelmien tiedonsiirtoväline toimii
  • "EMC-tietojen tallennus ja hallinta." Erinomainen kirja säilytysjärjestelmien perusteista, miksi, miten ja miksi.

Foorumit ja chatit

Yleiset suositukset

Hinnat

Mitä nyt tulee hintoihin - yleensä, jos säilytysjärjestelmille on hintoja, ne ovat yleensä listahintoja, joista jokainen asiakas saa yksilöllisen alennuksen. Alennuksen koko koostuu suuresta määrästä parametreja, joten on yksinkertaisesti mahdotonta ennustaa, minkä lopullisen hinnan yrityksesi saa kysymättä jakelijalta. Mutta samaan aikaan viime aikoina halpoja malleja on alkanut ilmestyä tavallisiin tietokoneliikkeisiin, kuten esim nix.ru tai xcom-shop.ru. Täältä voit heti ostaa sinua kiinnostavan järjestelmän kiinteään hintaan, kuten minkä tahansa tietokoneen komponentin.

Mutta haluaisin heti huomauttaa, että suora vertailu TB/$ ei ole oikea. Jos lähestymme asiaa tästä näkökulmasta, niin halvin ratkaisu on yksinkertainen JBOD + -palvelin, joka ei tarjoa joustavuutta tai luotettavuutta, jota täysimittainen, kahden ohjaimen tallennusjärjestelmä tarjoaa. Tämä ei suinkaan tarkoita, että JBOD olisi inhottava ja ilkeä likainen temppu, sinun on vain ymmärrettävä jälleen hyvin selvästi, miten ja mihin tarkoituksiin käytät tätä ratkaisua. Voit usein kuulla, että JBOD:ssa ei ole mitään hajotettavaa, on vain yksi taustalevy. Kuitenkin myös taustalevyt epäonnistuvat joskus. Kaikki hajoaa ennemmin tai myöhemmin.

Yhteensä

On tarpeen verrata järjestelmiä keskenään paitsi hinnan tai ei vain suorituskyvyn, vaan kaikkien indikaattoreiden kokonaisuuden perusteella.

Osta HDD vain, jos olet varma, että tarvitset kiintolevyä. Pienten kuormien ja pakkaamattomien tietotyyppien osalta kannattaa muuten kääntyä SSD-tallennustehokkuuden takuuohjelmiin, joita useimmilla myyjillä on nyt (ja ne todella toimivat jopa Venäjällä), mutta kaikki riippuu sijoitettavista sovelluksista ja tiedoista. tässä tallennusjärjestelmässä.

Älä mene halvalla. Joskus nämä kätkevät paljon epämiellyttäviä hetkiä, joista yhtä Jevgeni Elizarov kuvaili artikkeleissaan Infortrend. Ja se, että tämä halpa voi lopulta kostaa sinua vastaan. Älä unohda - "kuru maksaa kahdesti."

Lähde: www.habr.com

Lisää kommentti