Tema e tolerancës së gabimeve në sistemet e ruajtjes së të dhënave është gjithmonë e rëndësishme, pasi në epokën tonë të virtualizimit dhe konsolidimit të gjerë të burimeve, sistemet e ruajtjes janë lidhja, dështimi i të cilave do të çojë jo vetëm në një aksident të zakonshëm, por në një ndërprerje afatgjatë të shërbimeve. Prandaj, sistemet moderne të ruajtjes përmbajnë shumë komponentë të dyfishuar (madje edhe kontrollues). Por a është e mjaftueshme një mbrojtje e tillë?

Absolutisht të gjithë shitësit, kur renditin karakteristikat e sistemeve të ruajtjes, përmendin gjithmonë tolerancën e lartë të gabimeve të zgjidhjeve të tyre, duke shtuar gjithmonë termin "pa një pikë të vetme dështimi". Le të hedhim një vështrim më të afërt në një sistem tipik ruajtjeje. Për të shmangur ndërprerjen e mirëmbajtjes, sistemi i ruajtjes kopjon furnizimet me energji elektrike, modulet e ftohjes, portat hyrëse/dalëse, disqet (nënkuptojmë RAID) dhe, natyrisht, kontrollorët. Nëse shikoni nga afër këtë arkitekturë, do të vini re të paktën dy pika të mundshme dështimi, të cilat heshtin në mënyrë modeste:
- Disponueshmëria e një aeroplani të vetëm
- Duke pasur një kopje të të dhënave
Avioni i pasmë është një pajisje teknikisht komplekse që duhet t'i nënshtrohet testeve serioze gjatë prodhimit. Dhe për këtë arsye, ka raste jashtëzakonisht të rralla kur dështon plotësisht. Megjithatë, edhe në rastin e problemeve të pjesshme, si p.sh. një fole disku që nuk funksionon, do të duhet të zëvendësohet me një mbyllje të plotë të sistemit të ruajtjes.
Krijimi i kopjeve të shumta të të dhënave nuk është gjithashtu një problem në shikim të parë. Për shembull, funksionaliteti Clone në sistemet e ruajtjes, i cili ju lejon të përditësoni një kopje të plotë të të dhënave në disa intervale, është mjaft i përhapur. Megjithatë, në rast të problemeve me të njëjtën sfond, kopja do të jetë po aq e padisponueshme sa origjinali.
Një zgjidhje krejtësisht e qartë për të kapërcyer këto mangësi është përsëritja në një sistem tjetër ruajtjeje. Nëse mbyllim sytë ndaj dyfishimit të pritshëm të kostos së harduerit (ne ende supozojmë se njerëzit që zgjedhin një vendim të tillë mendojnë në mënyrë adekuate dhe e pranojnë këtë fakt paraprakisht), do të ketë ende kosto të mundshme për organizimin e riprodhimit në formën e licencave, shtesë. softuer dhe harduer. Dhe më e rëndësishmja, do t'ju duhet të siguroni disi konsistencën e të dhënave të përsëritura. Ato. ndërtoni një virtualizues ruajtjeje/vSAN/etj., i cili gjithashtu kërkon para dhe burime kohe.
Kur krijojmë sistemet tona me disponueshmëri të lartë, ne kemi vendosur një qëllim për të hequr qafe mangësitë e lartpërmendura. Kështu u shfaq interpretimi i teknologjisë Shared Nothing, që përkthehet lirshëm do të thotë "pa përdorimin e pajisjeve të përbashkëta".
koncept arkitektura paraqet përdorimin e dy nyjeve (kontrolluesve) të pavarur, secila prej të cilave ka grupin e vet të të dhënave. Replikimi sinkron ndodh midis nyjeve nëpërmjet ndërfaqes InfiniBand 56G, plotësisht transparent ndaj softuerit që funksionon në krye të sistemit të ruajtjes. Si rezultat, përdorimi i virtualizuesve të ruajtjes, agjentëve të softuerit, etj.
Fizikisht, zgjidhja me dy nyje nga AccelStor mund të zbatohet në dy modele:
- — bazuar në serverët Twin në një rast 2U, nëse kërkohet performancë e moderuar dhe kapacitet deri në 22 TB;
- — bazuar në serverë individualë 2U, nëse kërkohet performancë e lartë dhe kapacitet i madh (deri në 57 TB).

Modeli H510 i bazuar në serverin Twin

Modeli H710 i bazuar në serverë individualë
Përdorimi i faktorëve të ndryshëm të formës është për shkak të nevojës për numra të ndryshëm SSD për të arritur një vëllim dhe performancë të caktuar. Plus, platforma Twin është më e lirë dhe ju lejon të ofroni zgjidhje më të përballueshme, megjithëse me disa "disvantazh" të kushtëzuar në formën e një plani të vetëm. Çdo gjë tjetër, duke përfshirë parimet e funksionimit, është plotësisht identike për të dy modelet.
Seti i të dhënave për secilën nyje ka dy grupe , plus 2 rezerva të nxehta. Secili grup është në gjendje të përballojë dështimin e një SSD. Të gjitha kërkesat hyrëse për të regjistruar një nyje në përputhje me FlexiRemap rindërton blloqe 4KB në zinxhirë sekuencialë, të cilët më pas shkruhen në SSD në mënyrën më të rehatshme për ta (regjistrimi sekuencial). Për më tepër, hosti merr një konfirmim regjistrimi vetëm pasi të dhënat vendosen fizikisht në SSD, d.m.th. pa caching në RAM. Rezultati është një performancë shumë mbresëlënëse e shkrimit deri në 600K IOPS dhe leximit 1M+ IOPS (modeli H710).
Siç u përmend më herët, grupet e të dhënave sinkronizohen në kohë reale nëpërmjet ndërfaqes InfiniBand 56G, e cila ka xhiro të lartë dhe vonesë të ulët. Për të përdorur sa më efikas kanalin e komunikimit gjatë transmetimit të paketave të vogla. Sepse ekziston vetëm një kanal komunikimi, një lidhje e dedikuar 1 GbE për kontrollin shtesë të rrahjeve të zemrës. Vetëm rrahjet e zemrës transmetohen përmes saj, kështu që nuk ka kërkesa për karakteristikat e shpejtësisë.
Në rast të rritjes së kapacitetit të sistemit (deri në 400+TB) për shkak të ato janë gjithashtu të lidhura në çifte për të ruajtur konceptin "asnjë pikë e vetme e dështimit".
Për mbrojtjen e të dhënave shtesë (përveç faktit që AccelStor tashmë ka dy kopje), përdoret një algoritëm i veçantë i sjelljes në rast të dështimit të ndonjë SSD. Nëse SSD dështon, nyja do të fillojë të rindërtojë të dhënat në një nga disqet rezervë të nxehtë. Grupi FlexiRemap, i cili është në gjendje të degraduar, do të kalojë në modalitetin vetëm për lexim. Kjo është bërë për të eliminuar ndërhyrjen midis operacioneve të shkrimit dhe rindërtimit në diskun rezervë, i cili në fund të fundit përshpejton procesin e rikuperimit dhe zvogëlon kohën kur sistemi është potencialisht i cenueshëm. Pas përfundimit të rindërtimit, nyja kthehet në modalitetin normal të leximit-shkrimit.

Sigurisht, si sistemet e tjera, gjatë rindërtimit, performanca e përgjithshme zvogëlohet (në fund të fundit, një nga grupet FlexiRemap nuk funksionon për regjistrim). Por vetë procesi i rikuperimit ndodh sa më shpejt që të jetë e mundur, gjë që i dallon sistemet AccelStor nga zgjidhjet nga shitësit e tjerë.
Një veçori tjetër e dobishme e teknologjisë së arkitekturës Nothing Shared është funksionimi i nyjeve në të ashtuquajturin modaliteti i vërtetë aktiv-aktive. Ndryshe nga arkitektura "klasike", ku vetëm një kontrollues zotëron një vëllim/pool të caktuar, dhe i dyti thjesht kryen operacione I/O, në sisteme secila nyje punon me grupin e vet të të dhënave dhe nuk i transmeton kërkesa “fqinjës” së saj. Si rezultat, performanca e përgjithshme e sistemit është përmirësuar për shkak të përpunimit paralel të kërkesave I/O nga nyjet dhe aksesit në disqet. Gjithashtu, praktikisht nuk ekziston një gjë e tillë si dështimi, pasi thjesht nuk ka nevojë të transferoni kontrollin e vëllimeve në një nyje tjetër në rast të një dështimi.
Nëse e krahasojmë teknologjinë e arkitekturës Nothing Shared me dyfishimin e sistemit të ruajtjes së plotë, atëherë, në shikim të parë, do të jetë pak më inferior ndaj zbatimit të plotë të rimëkëmbjes nga fatkeqësitë në fleksibilitet. Kjo është veçanërisht e vërtetë për organizimin e një linje komunikimi midis sistemeve të ruajtjes. Kështu, në modelin H710 është e mundur të shpërndahen nyjet në një distancë deri në 100 m përmes përdorimit të kabllove optike aktive jo shumë të lira InfiniBand. Por edhe nëse krahasohet me zbatimin e zakonshëm të replikimit sinkron nga shitësit e tjerë përmes një FibreChannel të disponueshëm, edhe në distanca më të gjata, zgjidhja nga AccelStor do të jetë më e lirë dhe më e lehtë për t'u instaluar/operuar, sepse nuk ka nevojë të instaloni virtualizues të ruajtjes dhe/ose të integroheni me softuer (gjë që nuk është gjithmonë e mundur në parim). Plus, mos harroni se zgjidhjet AccelStor janë të gjitha grupet Flash me performancë më të lartë se ajo e sistemeve "klasike" të ruajtjes vetëm me SSD.

Kur përdorni arkitekturën Nothing Shared të AccelStor, është e mundur të arrihet disponueshmëria e sistemit të ruajtjes 99.9999% me një kosto shumë të arsyeshme. Së bashku me besueshmërinë e lartë të zgjidhjes, duke përfshirë përdorimin e dy kopjeve të të dhënave dhe performancën mbresëlënëse falë algoritmeve të pronarit , zgjidhje nga janë kandidatë të shkëlqyeshëm për pozicionet kyçe kur ndërtohet një qendër moderne e të dhënave.
Burimi: www.habr.com
