Vähennä seisokkien riskejä Shared Nothing -arkkitehtuurin avulla

Tietojen tallennusjärjestelmien vikasietoisuus on aina ajankohtainen, sillä laajan virtualisoinnin ja resurssien yhdistämisen aikakaudellamme tallennusjärjestelmät ovat se linkki, jonka epäonnistuminen ei johda pelkästään tavalliseen onnettomuuteen, vaan palveluiden pitkäaikaiseen seisokkiin. Siksi nykyaikaiset tallennusjärjestelmät sisältävät monia päällekkäisiä komponentteja (jopa ohjaimia). Mutta onko tällainen suoja riittävä?

Vähennä seisokkien riskejä Shared Nothing -arkkitehtuurin avulla

Ehdottomasti kaikki myyjät mainitsevat tallennusjärjestelmien ominaisuuksia listatessaan aina ratkaisujensa korkean vikasietoisuuden ja lisäävät aina termin "ilman yhtä vikakohtaa". Katsotaanpa tarkemmin tyypillistä säilytysjärjestelmää. Huollon katkosten välttämiseksi tallennusjärjestelmä kopioi virtalähteet, jäähdytysmoduulit, tulo-/lähtöportit, asemat (tarkoitamme RAID:ia) ja tietysti ohjaimia. Jos tarkastelet tätä arkkitehtuuria tarkasti, huomaat ainakin kaksi mahdollista epäonnistumiskohtaa, jotka vaikenevat vaatimattomasti:

  1. Yhden taustalevyn saatavuus
  2. Yksi kopio tiedoista

Taustalevy on teknisesti monimutkainen laite, joka on testattava vakavasti tuotannon aikana. Ja siksi on erittäin harvinaisia ​​tapauksia, joissa se epäonnistuu kokonaan. Kuitenkin jopa osittaisissa ongelmissa, kuten toimimattomassa asemapaikassa, se on korvattava siten, että tallennusjärjestelmä sammutetaan kokonaan.

Useiden kopioiden luominen tiedoista ei myöskään ole ongelma ensi silmäyksellä. Esimerkiksi tallennusjärjestelmien Clone-toiminto, jonka avulla voit päivittää täydellisen kopion tiedoista tietyin väliajoin, on melko yleinen. Jos samassa taustatoistossa on ongelmia, kopio on kuitenkin yhtä poissa kuin alkuperäinen.

Täysin ilmeinen ratkaisu näiden puutteiden voittamiseksi on replikointi toiseen tallennusjärjestelmään. Jos suljemme silmämme odotetulta laitteistokustannusten kaksinkertaistumiselta (oletamme silti, että tällaisen päätöksen tehneet ihmiset ajattelevat riittävästi ja hyväksyvät tämän tosiasian etukäteen), replikoinnin järjestämisestä lisenssien muodossa voi silti aiheutua mahdollisia kustannuksia, lisäkustannuksia. ohjelmistot ja laitteistot. Ja mikä tärkeintä, sinun on jollakin tavalla varmistettava replikoitujen tietojen johdonmukaisuus. Nuo. rakentaa tallennusvirtualisoija/vSAN/etc., mikä vaatii myös rahaa ja aikaa.

AccelStor High Availability -järjestelmiämme luodessaan asetimme tavoitteeksi päästä eroon yllä mainituista puutteista. Näin ilmestyi tulkinta Shared Nothing -teknologiasta, joka löyhästi käännettynä tarkoittaa "ilman jaettujen laitteiden käyttöä".

Käsite Ei jaettu mitään arkkitehtuuri edustaa kahden itsenäisen solmun (ohjaimen) käyttöä, joilla kullakin on oma tietojoukkonsa. Synkroninen replikointi tapahtuu solmujen välillä InfiniBand 56G -liitännän kautta, mikä on täysin läpinäkyvä tallennusjärjestelmän päällä olevalle ohjelmistolle. Tämän seurauksena tallennusvirtualisoijien, ohjelmistoagenttien jne. käyttöä ei vaadita.

Fyysisesti AccelStorin kahden solmun ratkaisu voidaan toteuttaa kahdessa mallissa:

  • H510 — perustuu Twin-palvelimiin 2U-kotelossa, jos vaaditaan kohtalaista suorituskykyä ja kapasiteettia jopa 22 Tt:iin asti;
  • H710 — perustuu yksittäisiin 2U-palvelimiin, jos vaaditaan korkeaa suorituskykyä ja suurta kapasiteettia (jopa 57 Tt).

Vähennä seisokkien riskejä Shared Nothing -arkkitehtuurin avulla

Twin-palvelimeen perustuva malli H510

Vähennä seisokkien riskejä Shared Nothing -arkkitehtuurin avulla

Malli H710 perustuu yksittäisiin palvelimiin

Eri muototekijöiden käyttö johtuu siitä, että tarvitaan eri määrä SSD-levyjä tietyn volyymin ja suorituskyvyn saavuttamiseksi. Lisäksi Twin-alusta on halvempi ja mahdollistaa edullisempien ratkaisujen tarjoamisen, vaikkakin tietyillä ehdollisilla "haitoilla" yhden taustalevyn muodossa. Kaikki muu, mukaan lukien toimintaperiaatteet, on täysin identtinen molemmissa malleissa.

Jokaisen solmun tietojoukossa on kaksi ryhmää FlexiRemap, plus 2 kuumaa varaosaa. Jokainen ryhmä pystyy kestämään yhden SSD-levyn vian. Kaikki saapuvat pyynnöt tallentaa solmu mukaisesti ideologia FlexiRemap rakentaa 4 kilotavun lohkot uudelleen peräkkäisiksi ketjuiksi, jotka sitten kirjoitetaan SSD-levylle niille mukavimmassa tilassa (peräkkäinen tallennus). Lisäksi isäntä saa tallennusvahvistuksen vasta sen jälkeen, kun tiedot on fyysisesti asetettu SSD-levylle, ts. ilman välimuistia RAM-muistiin. Tuloksena on erittäin vaikuttava suorituskyky jopa 600 1 IOPS-kirjoituksella ja 710 M+ IOPS-lukumäärällä (malli HXNUMX).

Kuten aiemmin mainittiin, tietojoukot synkronoidaan reaaliajassa InfiniBand 56G -liitännän kautta, jolla on korkea suorituskyky ja pieni latenssi. Viestintäkanavan mahdollisimman tehokas hyödyntäminen pienten pakettien lähettämisessä. Koska Viestintäkanavaa on vain yksi; erillistä 1GbE-linkkiä käytetään lisäsykemittaukseen. Sen kautta välittyy vain syke, joten nopeusominaisuuksille ei ole vaatimuksia.

Jos järjestelmän kapasiteetti kasvaa (jopa 400+TB) johtuen laajennushyllyt ne on myös yhdistetty pareittain "ei yksittäistä vikakohtaa" -konseptin ylläpitämiseksi.

Tietojen lisäsuojaa varten (sen lisäksi, että AccelStorilla on jo kaksi kopiota), käytetään erityistä käyttäytymisalgoritmia, jos jokin SSD-levy epäonnistuu. Jos SSD-levy epäonnistuu, solmu alkaa rakentaa tietoja uudelleen jollekin kuumalle vara-asemalle. FlexiRemap-ryhmä, joka on heikentyneessä tilassa, siirtyy vain luku -tilaan. Tämä tehdään häiriön poistamiseksi varmuuskopiolevyn kirjoitus- ja uudelleenrakennustoimintojen välillä, mikä lopulta nopeuttaa palautusprosessia ja vähentää aikaa, jolloin järjestelmä on mahdollisesti haavoittuvainen. Uudelleenmuodostuksen päätyttyä solmu palaa normaaliin luku-kirjoitustilaan.

Vähennä seisokkien riskejä Shared Nothing -arkkitehtuurin avulla

Tietenkin, kuten muutkin järjestelmät, uudelleenrakentamisen aikana kokonaissuorituskyky heikkenee (jokin yksi FlexiRemap-ryhmistä ei toimi tallennusta varten). Mutta itse palautusprosessi tapahtuu mahdollisimman nopeasti, mikä erottaa AccelStor-järjestelmät muiden valmistajien ratkaisuista.

Toinen Nothing Shared -arkkitehtuuriteknologian hyödyllinen ominaisuus on solmujen toiminta niin kutsutussa todellisessa aktiivi-aktiivisessa tilassa. Toisin kuin "klassisessa" arkkitehtuurissa, jossa vain yksi ohjain omistaa tietyn aseman/poolin ja toinen yksinkertaisesti suorittaa I/O-toimintoja järjestelmissä. AccelStor jokainen solmu toimii omalla tietojoukollaan eikä lähetä pyyntöjä "naapurilleen". Tämän seurauksena järjestelmän yleinen suorituskyky paranee solmujen I/O-pyyntöjen rinnakkaisen käsittelyn ja asemien käytön ansiosta. Myöskään vikasietoa ei käytännössä ole olemassa, koska ei yksinkertaisesti tarvitse siirtää volyymien hallintaa toiselle solmulle vian sattuessa.

Jos vertaamme Nothing Shared -arkkitehtuuritekniikkaa täysimittaiseen tallennusjärjestelmän päällekkäisyyteen, se on ensi silmäyksellä hieman huonompi kuin katastrofipalautuksen täysi toteutus joustavuudessa. Tämä pätee erityisesti viestintälinjan järjestämiseen tallennusjärjestelmien välillä. Näin ollen H710-mallissa on mahdollista levittää solmuja jopa 100 metrin etäisyydelle käyttämällä ei kovin halpoja InfiniBand-aktiivisia optisia kaapeleita. Mutta vaikka verrattuna tavanomaiseen synkroniseen replikointiin muilta toimittajilta saatavilla olevan FibreChannelin kautta, jopa pitemmillä etäisyyksillä, AccelStorin ratkaisu on halvempi ja helpompi asentaa/käyttää, koska ei tarvitse asentaa tallennusvirtualisoijia ja/tai integroida ohjelmistoihin (mikä ei aina ole periaatteessa mahdollista). Älä myöskään unohda, että AccelStor-ratkaisut ovat kaikkia Flash-ryhmiä, joiden suorituskyky on parempi kuin "klassisissa" tallennusjärjestelmissä, joissa on vain SSD.

Vähennä seisokkien riskejä Shared Nothing -arkkitehtuurin avulla

Käytettäessä AccelStorin Nothing Shared -arkkitehtuuria on mahdollista saavuttaa 99.9999 % tallennusjärjestelmän käytettävyys erittäin kohtuullisin kustannuksin. Ratkaisun korkea luotettavuus, mukaan lukien kahden datakopion käyttö, ja vaikuttava suorituskyky patentoitujen algoritmien ansiosta FlexiRemap, ratkaisut alkaen AccelStor ovat erinomaisia ​​ehdokkaita avaintehtäviin modernia datakeskusta rakennettaessa.

Lähde: will.com

Lisää kommentti