Reduktu malfunkciajn riskojn kun Shared Nothing-arkitekturo

La temo de misfunkciado en sistemoj de konservado de datumoj ĉiam estas grava, ĉar en nia epoko de disvastigita virtualigo kaj solidigo de rimedoj, stokaj sistemoj estas la ligo, kies malsukceso kondukos ne nur al ordinara akcidento, sed al longdaŭra malfunkcio de servoj. Tial, modernaj stokadsistemoj enhavas multajn duobligitajn komponentojn (eĉ regilojn). Sed ĉu tia protekto sufiĉas?

Reduktu malfunkciajn riskojn kun Shared Nothing-arkitekturo

Absolute ĉiuj vendistoj, kiam ili listigas la karakterizaĵojn de stokadsistemoj, ĉiam mencias la altan misfunkciadon de siaj solvoj, ĉiam aldonante la esprimon "sen ununura punkto de fiasko". Ni rigardu pli detale tipan stoksistemon. Por eviti malfunkcion en prizorgado, la stokada sistemo duobligas elektroprovizojn, malvarmigajn modulojn, enigajn/eligajn havenojn, diskojn (ni volas diri RAID) kaj, kompreneble, regilojn. Se vi rigardas atente ĉi tiun arkitekturon, vi rimarkos almenaŭ du eblajn malsukcesajn punktojn, kiuj estas modeste silentitaj:

  1. Havebleco de ununura fonplano
  2. Havante unu kopion de la datumoj

La malantaŭa aviadilo estas teknike kompleksa aparato, kiu devas suferi seriozajn provojn dum produktado. Kaj tial, estas ekstreme maloftaj kazoj kiam ĝi tute malsukcesas. Tamen, eĉ en la kazo de partaj problemoj, kiel nefunkcianta stira fendo, ĝi devos esti anstataŭigita per kompleta malŝalto de la stokadsistemo.

Krei plurajn kopiojn de datumoj ankaŭ ne estas problemo unuavide. Ekzemple, la Klona funkcio en stokadsistemoj, kiu permesas vin ĝisdatigi kompletan kopion de datumoj je iuj intervaloj, estas sufiĉe disvastigita. Tamen, en kazo de problemoj kun la sama retroludo, la kopio estos same neatingebla kiel la originalo.

Tute evidenta solvo por venki ĉi tiujn mankojn estas reproduktado al alia stokadsistemo. Se ni fermas la okulojn al la atendata duobligo de la kosto de aparataro (ni ankoraŭ supozas, ke homoj elektantaj tian decidon pensas adekvate kaj akceptas ĉi tiun fakton anticipe), ankoraŭ estos eblaj kostoj por organizado de reproduktado en formo de licencoj, pliaj. programaro kaj aparataro. Kaj plej grave, vi devos iel certigi la konsistencon de la reproduktitaj datumoj. Tiuj. konstrui stokan virtualigilon/vSAN/ktp., kiu ankaŭ postulas monon kaj temporimedojn.

AccelStor Kreante niajn sistemojn de Alta Havebleco, ni fiksas celon forigi la supre menciitajn mankojn. Jen kiel aperis la interpreto de Shared Nothing-teknologio, kiu malstreze tradukita signifas "sen la uzo de komunaj aparatoj".

Koncepto Dividita Nenio arkitekturo reprezentas la uzon de du sendependaj nodoj (regiloj), ĉiu el kiuj havas sian propran aron de datenoj. Sinkrona reproduktado okazas inter nodoj per la interfaco InfiniBand 56G, tute travidebla al la programaro funkcianta sur la stokadosistemo. Kiel rezulto, la uzo de stokadvirtualigiloj, programaraj agentoj ktp ne estas postulata.

Fizike, la du-noda solvo de AccelStor povas esti efektivigita en du modeloj:

  • H510 — surbaze de Ĝemelaj serviloj en 2U-kazo, se necesas modera rendimento kaj kapacito ĝis 22TB;
  • H710 — surbaze de individuaj 2U-serviloj, se necesas alta rendimento kaj granda kapablo (ĝis 57TB).

Reduktu malfunkciajn riskojn kun Shared Nothing-arkitekturo

Modelo H510 bazita sur Ĝemelo-servilo

Reduktu malfunkciajn riskojn kun Shared Nothing-arkitekturo

Modelo H710 bazita sur individuaj serviloj

La uzo de malsamaj formfaktoroj ŝuldiĝas al la bezono de malsamaj nombroj da SSD-oj por atingi antaŭfiksitan volumenon kaj efikecon. Plie, la Ĝemelo-platformo estas pli malmultekosta kaj permesas al vi proponi pli atingeblajn solvojn, kvankam kun iu kondiĉa "malavantaĝo" en la formo de ununura backplane. Ĉio alia, inkluzive de la funkciaj principoj, estas tute identa por ambaŭ modeloj.

La datumaro por ĉiu nodo havas du grupojn FlexiRemap, plus 2 varmaj rezervaĵoj. Ĉiu grupo kapablas elteni la fiaskon de unu SSD. Ĉiuj envenantaj petoj registri nodon konforme al ideologio FlexiRemap rekonstruas 4KB-blokojn en sinsekvajn ĉenojn, kiuj poste estas skribitaj al la SSD en la plej komforta reĝimo por ili (sinsekva registrado). Plie, la gastiganto ricevas registradkonfirmon nur post kiam la datumoj estas fizike metitaj sur la SSD, t.e. sen kaŝmemoro en RAM. La rezulto estas tre impona rendimento de ĝis 600K IOPS-skribo kaj 1M+ IOPS-legado (modelo H710).

Kiel menciite antaŭe, datumoj aroj estas sinkronigitaj en reala tempo per la interfaco InfiniBand 56G, kiu havas altan trairon kaj malaltan latentecon. Por fari la plej efikan uzon de la komunika kanalo dum elsendado de malgrandaj pakaĵoj. Ĉar Ekzistas nur unu komunika kanalo; dediĉita 1GbE-ligo estas uzata por plia korfrekvenca kontrolo. Nur korbato estas transdonita per ĝi, do ne estas postuloj por rapidecaj trajtoj.

En kazo de kreskanta sistema kapablo (ĝis 400+TB) pro ekspansiaj bretoj ili ankaŭ estas ligitaj en paroj por konservi la koncepton "neniu ununura punkto de fiasko".

Por plia protekto de datumoj (krom la fakto, ke AccelStor jam havas du kopiojn), speciala kondut-algoritmo estas uzata en la okazo de malsukceso de iu SSD. Se la SSD malsukcesas, la nodo komencos rekonstrui datumojn sur unu el la varmaj rezervaj diskoj. La grupo FlexiRemap, kiu estas en la degradita stato, ŝanĝos al nurlega reĝimo. Ĉi tio estas farita por forigi interferon inter skribaj kaj rekonstruaj operacioj sur la rezerva disko, kiu finfine akcelas la reakivan procezon kaj reduktas la tempon kiam la sistemo estas eble vundebla. Post kompletigo de la rekonstruo, la nodo revenas al normala lego-skriba reĝimo.

Reduktu malfunkciajn riskojn kun Shared Nothing-arkitekturo

Kompreneble, kiel aliaj sistemoj, dum rekonstruado la ĝenerala rendimento malpliiĝas (post ĉio, unu el la FlexiRemap-grupoj ne funkcias por registrado). Sed la reakiro mem okazas kiel eble plej rapide, kio distingas AccelStor-sistemojn de solvoj de aliaj vendistoj.

Alia utila posedaĵo de la Nothing Shared arkitekturteknologio estas la funkciado de nodoj en la tielnomita vera aktiva-aktiva reĝimo. Male al la "klasika" arkitekturo, kie nur unu regilo posedas specifan volumenon/naĝejon, kaj la dua simple elfaras I/O-operaciojn, en sistemoj. AccelStor ĉiu nodo funkcias kun sia propra aro de datumoj kaj ne transdonas petojn al sia "najbaro". Kiel rezulto, la totala sistema rendimento estas plibonigita pro la paralela pretigo de I/O-petoj per nodoj kaj aliro al veturadoj. Ankaŭ ekzistas preskaŭ nenia afero kiel malsukceso, ĉar simple ne necesas transdoni kontrolon de volumoj al alia nodo en la okazo de fiasko.

Se ni komparas la arkitekturteknologion Nothing Shared kun plenrajta konservada sistemo-duobligo, tiam, unuavide, ĝi estos iomete pli malalta ol la plena efektivigo de katastrofa reakiro en fleksebleco. Ĉi tio validas precipe por organizado de komunika linio inter stokaj sistemoj. Tiel, en la modelo H710 eblas disvastigi nodojn sur distanco de ĝis 100m per la uzo de ne tre malmultekostaj aktivaj optikaj kabloj InfiniBand. Sed eĉ se kompare kun la kutima efektivigo de sinkrona reproduktado de aliaj vendistoj per disponebla FibreChannel, eĉ sur pli longaj distancoj, la solvo de AccelStor estos pli malmultekosta kaj pli facile instalebla/funkciebla, ĉar ne necesas instali stokadvirtualigilojn kaj/aŭ integri kun programaro (kio principe ne ĉiam eblas). Plie, ne forgesu, ke AccelStor-solvoj estas All Flash-aroj kun rendimento pli alta ol tiu de "klasikaj" stokadsistemoj kun SSD nur.

Reduktu malfunkciajn riskojn kun Shared Nothing-arkitekturo

Kiam vi uzas la Nothing Shared-arkitekturon de AccelStor, eblas atingi 99.9999%-disponeblecon de stokadsistemo je tre akceptebla kosto. Kune kun la alta fidindeco de la solvo, inkluzive per la uzo de du kopioj de datumoj, kaj impresa agado danke al proprietaj algoritmoj FlexiRemap, solvoj de AccelStor estas bonegaj kandidatoj por ŝlosilaj postenoj dum konstruado de moderna datumcentro.

fonto: www.habr.com

Aldoni komenton