Cluster ta 'żewġ nodi - l-devil huwa fid-dettalji

Ħej Habr! Nippreżenta għall-attenzjoni tiegħek it-traduzzjoni tal-artiklu "Żewġ Nodi - Ix-Xitan jinsab fid-Dettalji" minn Andrew Beekhof.

Ħafna nies jippreferu raggruppamenti b'żewġ nodi għaliex jidhru kunċettwalment aktar sempliċi u huma wkoll 33% orħos mill-kontropartijiet tagħhom bi tliet nodi. Għalkemm huwa pjuttost possibbli li jitqiegħed flimkien raggruppament tajjeb ta 'żewġ nodi, fil-biċċa l-kbira tal-każijiet, minħabba xenarji mhux ikkunsidrati, konfigurazzjoni bħal din toħloq ħafna problemi mhux ovvji.

L-ewwel pass biex tinħoloq kwalunkwe sistema ta’ disponibbiltà għolja huwa li ssib u tipprova telimina punti individwali ta’ falliment, ħafna drabi mqassra bħala SPoF (punt uniku ta' falliment).

Ta 'min iżomm f'moħħu li huwa impossibbli li jiġu eliminati r-riskji kollha possibbli ta' waqfien fi kwalunkwe sistema. Dan joħroġ mill-fatt li difiża tipika kontra r-riskju hija li tintroduċi xi redundancy, li twassal għal żieda fil-kumplessità tas-sistema u l-emerġenza ta 'punti ġodda ta' falliment. Għalhekk, inizjalment nagħmlu kompromess u niffukaw fuq avvenimenti assoċjati ma 'punti individwali ta' falliment, u mhux fuq ktajjen ta 'avvenimenti relatati u, għalhekk, dejjem inqas probabbli.

Minħabba l-kompromessi, aħna mhux biss infittxu SPoF, iżda wkoll nibbilanċjaw ir-riskji u l-konsegwenzi, li b'riżultat tagħhom il-konklużjoni ta 'dak li hu kritiku u dak li mhux jista' jkun differenti għal kull skjerament.

Mhux kulħadd għandu bżonn fornituri alternattivi tal-elettriku b'linji tal-elettriku indipendenti. Għalkemm il-paranojja ħallset għal mill-inqas klijent wieħed meta l-monitoraġġ tagħhom skopra transformer difettuż. Il-klijent għamel telefonati biex jipprova javża lill-kumpanija tal-enerġija sakemm sploda t-transformer difettuż.

Punt tat-tluq naturali huwa li jkun hemm aktar minn nodu wieħed fis-sistema. Madankollu, qabel ma s-sistema tkun tista' tmexxi s-servizzi lejn in-nodu superstiti wara falliment, ġeneralment jeħtieġ li tiżgura li s-servizzi li qed jiġu mċaqalqa ma jkunux attivi x'imkien ieħor.

M'hemm l-ebda żvantaġġ għal cluster b'żewġ nodi jekk falliment jirriżulta fiż-żewġ nodi li jservu l-istess websajt statika. Madankollu, l-affarijiet jinbidlu jekk ir-riżultat ikun li ż-żewġ partijiet jimmaniġġjaw b'mod indipendenti kju ta' xogħol kondiviż jew jipprovdu aċċess għall-kitba mhux ikkoordinat għal database replikata jew sistema ta' fajl kondiviża.

Għalhekk, biex tiġi evitata l-korruzzjoni tad-dejta bħala riżultat ta 'falliment ta' nodu wieħed - niddependu fuq xi ħaġa msejħa "dissoċjazzjoni" (fencing).

Il-prinċipju tad-dissoċjazzjoni

Fil-qalba tal-prinċipju ta' dissoċjazzjoni hemm il-mistoqsija: nodu li jikkompeti jista' jikkawża korruzzjoni tad-dejta? Fil-każ li l-korruzzjoni tad-dejta hija xenarju probabbli, soluzzjoni tajba tkun li jiġi iżolat in-node kemm minn talbiet li jidħlu kif ukoll minn ħażna persistenti. L-aktar approċċ komuni għad-disassoċjazzjoni huwa li skonnettja n-nodi difettużi.

Hemm żewġ kategoriji ta 'metodi ta' dissoċjazzjoni, li se nsejjaħ dritta и indiretta, iżda jistgħu jissejħu bl-istess mod attiv и passiv. Il-metodi diretti jinkludu azzjonijiet min-naħa ta’ sħabhom superstiti, bħall-interazzjoni ma’ apparat IPMI (Intelligent Platform Management Interface) jew iLO (mekkaniżmu għall-immaniġġjar ta’ servers fin-nuqqas ta’ aċċess fiżiku għalihom), filwaqt li l-metodi indiretti jiddependu fuq it-tagħmir fallut. node biex b'xi mod jagħraf li jinsab fi stat mhux tajjeb għas-saħħa (jew għall-inqas jipprevjeni membri oħra milli jirkupraw) u sinjal għassies tal-ħardwer dwar il-ħtieġa li skonnettja n-nodu fallut.

Il-kworum jgħin meta tuża metodi kemm diretti kif ukoll indiretti.

Dissoċjazzjoni diretta

Fil-każ ta 'dissoċjazzjoni diretta, nistgħu nużaw il-kworum biex nipprevjenu tlielaq ta' dissoċjazzjoni fil-każ ta 'falliment tan-netwerk.

Bil-kunċett ta 'kworum, hemm biżżejjed informazzjoni fis-sistema (anke mingħajr konnessjoni ma' sħabha) biex in-nodi jkunu jafu awtomatikament jekk għandhomx jibdew id-dissoċjazzjoni u/jew l-irkupru.

Mingħajr kworum, iż-żewġ naħat ta 'firda tan-netwerk se jassumu bir-raġun li n-naħa l-oħra hija mejta u se tfittex li tiddiżassoċja lill-oħra. Fl-agħar każ, iż-żewġ partijiet jirnexxielhom jagħlqu l-cluster kollu. Xenarju alternattiv huwa deathmatch, loop bla tarf ta 'nodi li jbid, ma jarawx lil sħabhom, jerġgħu jibdew, u jibdew l-irkupru biss biex jerġgħu jibdew meta l-pari tagħhom isegwi l-istess loġika.

Il-problema bid-disassoċjazzjoni hija li l-apparati l-aktar użati komunement isiru mhux disponibbli minħabba l-istess avvenimenti ta 'falliment li rridu nimmiraw għall-irkupru. Il-biċċa l-kbira tal-kards IPMI u iLO huma installati fuq l-hosts li jikkontrollaw u, b'mod awtomatiku, jużaw l-istess netwerk, li jġiegħel lill-hosts fil-mira jemmnu li hosts oħra huma offline.

Sfortunatament, il-karatteristiċi operattivi tal-apparati IPMI u iLo rarament jitqiesu fil-ħin tax-xiri tat-tagħmir.

Dissoċjazzjoni indiretta

Il-kworum huwa importanti wkoll għall-ġestjoni tad-diżassoċjazzjoni indiretta; jekk isir b'mod korrett, il-kworum jista' jippermetti lis-superstiti jassumu li n-nodi mitlufa se jgħaddu għal stat sigur wara ċertu perjodu ta' żmien.

B'din il-konfigurazzjoni, il-watchdog timer tal-ħardwer jiġi reset kull N sekondi jekk il-kworum ma jintilifx. Jekk it-tajmer (ġeneralment diversi multipli ta 'N) jiskadi, allura l-apparat iwettaq qawwa ungraceful down (mhux għeluq).

Dan l-approċċ huwa effettiv ħafna, iżda mingħajr kworum m'hemmx biżżejjed informazzjoni fi ħdan il-cluster biex jimmaniġġjah. Mhuwiex faċli li tgħid id-differenza bejn qtugħ tan-netwerk u falliment tan-nodu tal-pari. Ir-raġuni li din hija importanti hija li mingħajr il-ħila li tiddistingwi bejn iż-żewġ każijiet, inti sfurzat li tagħżel l-istess imġieba fiż-żewġ każijiet.

Il-problema bl-għażla ta 'modalità waħda hija li m'hemm l-ebda kors ta' azzjoni li timmassimizza d-disponibbiltà u tipprevjeni t-telf tad-dejta.

  • Jekk tagħżel li tassumi li peer node huwa attiv iżda fil-fatt ifalli, il-cluster se jwaqqaf bla bżonn is-servizzi li jkunu qed jaħdmu biex jikkumpensaw għat-telf tas-servizzi min-nodu peer fallut.
  • Jekk tiddeċiedi li tassumi li node huwa mwaqqaf, iżda kien biss falliment tan-netwerk u fil-fatt in-nodu remot huwa funzjonali, allura fl-aħjar mod qed tiffirma għal xi rikonċiljazzjoni manwali futura tas-settijiet tad-dejta li jirriżultaw.

Irrispettivament minn liema euristiku tuża, huwa trivjali li toħloq falliment li jew jikkawża li ż-żewġ naħat ifallu jew iġġiegħel lill-cluster jagħlaq in-nodi superstiti. Li ma tużax il-kworum tassew iċaħħad lill-grupp minn waħda mill-aktar għodod b'saħħithom fl-armament tiegħu.

Jekk ma jkunx hemm alternattiva oħra, l-aħjar approċċ huwa li tissagrifika d-disponibbiltà (hawnhekk l-awtur jirreferi għat-teorema tal-PAK). Id-disponibbiltà għolja ta’ data korrotta ma tgħin lil ħadd, u r-rikonċiljazzjoni manwalment ta’ settijiet ta’ data differenti lanqas mhu pjaċevoli.

Kworum

Kworum ħsejjes kbir, hux?

L-uniku żvantaġġ huwa li sabiex ikollha fi cluster b'N membri, jeħtieġ li jkollok konnessjoni bejn N/2 + 1 tan-nodi tiegħek li fadal. Li mhux possibbli fi cluster ta 'żewġ nodi wara li node wieħed ifalli.

Li finalment iwassalna għall-problema fundamentali b'żewġ nodi:
Il-kworum ma jagħmilx sens f'żewġ clusters ta' nodi, u mingħajru huwa impossibbli li jiġi ddeterminat b'mod affidabbli l-kors ta' azzjoni li timmassimizza d-disponibbiltà u tipprevjeni t-telf tad-dejta.
Anke f'sistema ta 'żewġ nodi konnessi b'kejbil crossover, huwa impossibbli li ssir distinzjoni definittiva bejn qtugħ tan-netwerk u falliment tan-nodu l-ieħor. Id-diżattivazzjoni tarf wieħed (li l-probabbiltà tiegħu hija, ovvjament, proporzjonali għad-distanza bejn in-nodi) tkun biżżejjed biex tinvalida kwalunkwe suppożizzjoni li s-saħħa tal-link hija ugwali għas-saħħa tan-nodu msieħeb.

Nagħmlu xogħol cluster b'żewġ nodi

Xi drabi l-klijent ma jistax jew ma jridx jixtri t-tielet nodu, u aħna sfurzati nfittxu alternattiva.

Għażla 1 - Metodu ta' dissoċjazzjoni duplikat

L-apparat iLO jew IPMI ta' node jirrappreżenta punt ta' falliment għaliex, jekk ifalli, is-superstiti ma jistgħux jużawh biex iġibu n-nodu fi stat sigur. F'grupp ta '3 nodi jew aktar, nistgħu nimmitikaw dan billi nikkalkulaw il-kworum u nużaw ħardwer watchdog (mekkaniżmu ta' disassoċjazzjoni indirett, kif diskuss qabel). Fil-każ ta 'żewġ nodi, irridu nużaw unitajiet ta' distribuzzjoni tal-enerġija tan-netwerk (PDUs) minflok.

Wara falliment, is-superstiti l-ewwel jipprova jikkuntattja l-apparat primarju ta’ disassoċjazzjoni (iLO inkorporat jew IPMI). Jekk dan jirnexxi, l-irkupru jkompli bħas-soltu. Huwa biss jekk l-apparat iLO/IPMI jonqos jiġi aċċessat il-PDU; jekk l-aċċess jirnexxi, l-irkupru jista 'jkompli.

Kun żgur li tpoġġi l-PDU fuq netwerk differenti mit-traffiku tal-cluster, inkella falliment wieħed tan-netwerk jimblokka l-aċċess kemm għall-apparati ta 'disassoċjazzjoni u jimblokka r-restawr tas-servizzi.

Hawnhekk tista' tistaqsi - il-PDU huwa punt wieħed ta' falliment? Għaliha t-tweġiba hija, ovvjament.

Jekk dan ir-riskju huwa sinifikanti għalik, m'intix waħdek: għaqqad iż-żewġ nodi ma' żewġ PDUs u għid lis-softwer tal-clustering biex juża t-tnejn meta jixgħel u jitfi n-nodi. Il-cluster issa jibqa' attiv jekk PDU wieħed imut, u t-tieni falliment jew tal-PDU l-ieħor jew tal-apparat IPMI se jkun meħtieġ biex jimblokka l-irkupru.

Għażla 2 - Żieda ta' Arbitru

F'xi xenarji, filwaqt li l-metodu ta' disassoċjazzjoni duplikat huwa teknikament possibbli, huwa politikament diffiċli. Ħafna kumpaniji jixtiequ jkollhom xi separazzjoni bejn l-amministraturi u s-sidien tal-applikazzjonijiet, u amministraturi tan-netwerk konxji tas-sigurtà mhux dejjem ikunu entużjasti dwar il-qsim tas-settings tal-aċċess tal-PDU ma 'xi ħadd.

F'dan il-każ, l-alternattiva rakkomandata hija li tinħoloq parti terza newtrali li tista' tissupplimenta l-kalkolu tal-kworum.

F'każ ta' falliment, node għandu jkun jista' jara l-mewġ tal-pari jew tal-arbitru tiegħu sabiex jirrestawra s-servizzi. L-arbitru jinkludi wkoll funzjoni ta 'skonnettjar jekk iż-żewġ nodi jistgħu jaraw l-arbitru iżda ma jistgħux jaraw lil xulxin.

Din l-għażla għandha tintuża flimkien ma 'metodu ta' disassoċjazzjoni indirett, bħal arloġġ tal-ħardwer watchdog, li huwa kkonfigurat biex joqtol magna jekk titlef il-konnessjoni man-node peer u arbiter tagħha. Għalhekk, superstiti jista 'raġonevolment jassumi li n-nodu peer tiegħu se jkun fi stat sigur wara li jiskadi l-arloġġ tal-ħardwer watchdog.

Id-differenza prattika bejn arbitru u t-tielet nodu hija li arbitru jeħtieġ ħafna inqas riżorsi biex jopera u jista 'potenzjalment iservi aktar minn cluster wieħed.

Għażla 3 - Fattur uman

L-approċċ finali huwa li s-superstiti jkomplu jmexxu kwalunkwe servizzi li kienu diġà qed iħaddmu, iżda ma jibdewx oħrajn ġodda sakemm jew il-problema ssolvi ruħha (restawr tan-netwerk, reboot tan-node) jew persuna tieħu r-responsabbiltà li tikkonferma manwalment li n-naħa l-oħra hija mejta.

Għażla ta' bonus

Semmejt li tista 'żżid it-tielet node?

Żewġ xtillieri

Għall-finijiet tal-argument, ejja nippretendu li kkonvinċejtek mill-merti tat-tielet node, issa rridu nikkunsidraw l-arranġament fiżiku tan-nodi. Jekk ikunu miżmuma (u mħaddma) fl-istess rack, dan jikkostitwixxi wkoll SPoF, u wieħed li ma jistax jiġi solvut billi żżid it-tieni rack.

Jekk dan huwa sorprendenti, ikkunsidra x'jiġri jekk ixtilliera b'żewġ nodi falliet, u kif in-nodu superstiti jiddistingwi bejn dak u falliment tan-netwerk.

It-tweġiba qasira hija li mhux possibbli, u għal darb'oħra qed nittrattaw il-problemi kollha fil-każ ta 'żewġ nodi. Jew superstiti:

  • jinjora kworum u jipprova b'mod żbaljat li jibda r-restawr waqt qtugħ tan-netwerk (l-abbiltà li titlesta d-dissoċjazzjoni hija storja differenti u tiddependi fuq jekk il-PDU huwiex involut u jekk jaqsmux is-setgħa ma' xi xtillieri), jew
  • jirrispetta kworum u jiskonnettja lilu nnifsu qabel iż-żmien meta jfalli n-nodu tal-pari tiegħu

Fi kwalunkwe każ, żewġ xtillieri mhumiex aħjar minn wieħed, u n-nodi għandhom jew jirċievu provvisti ta 'enerġija indipendenti jew jitqassmu fi tliet xtillieri (jew aktar, skont kemm għandek nodi).

Żewġ ċentri tad-dejta

F'dan il-punt, il-qarrejja li m'għadhomx avversarji għar-riskju jistgħu jkunu jridu jikkunsidraw l-irkupru minn diżastru. X'jiġri meta asteroid jolqot l-istess ċentru tad-dejta bit-tliet nodi tagħna mifruxa fuq tliet xtillieri differenti? Ovvjament Affarijiet Ħżiena, iżda skond il-bżonnijiet tiegħek, iż-żieda tat-tieni ċentru tad-dejta tista 'ma tkunx biżżejjed.

Jekk isir b'mod korrett, it-tieni ċentru tad-dejta jipprovdilek (u raġonevolment hekk) kopja aġġornata u konsistenti tas-servizzi tiegħek u d-dejta tagħhom. Madankollu, bħal f'xenarji b'żewġ nodi, b'żewġ xtillieri, m'hemmx biżżejjed informazzjoni fis-sistema biex tiżgura disponibbiltà massima u tevita l-korruzzjoni (jew diskrepanzi fis-sett tad-dejta). Anke bi tliet nodi (jew xtillieri), id-distribuzzjoni tagħhom f'żewġ ċentri tad-dejta biss tħalli lis-sistema ma tkunx tista' tieħu d-deċiżjoni t-tajba b'mod affidabbli fil-każ ta 'avveniment (issa ħafna aktar probabbli) li ż-żewġ partijiet ma jistgħux jikkomunikaw.

Dan ma jfissirx li soluzzjoni ta 'ċentru tad-dejta doppju qatt ma hija adattata. Kumpaniji ħafna drabi jridu li persuna tkun konxja qabel ma tieħu l-pass straordinarju li tiċċaqlaq għal ċentru tad-data backup. Żomm f'moħħok li jekk trid tawtomatizza l-qtugħ, ser ikollok bżonn jew it-tielet ċentru tad-dejta biex il-kworum jagħmel sens (jew direttament jew permezz ta' arbitru), jew issib mod biex tagħlaq id-dejta kollha b'mod affidabbli. ċentru.

Sors: www.habr.com

Żid kumment