AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

Hello, Habr readers! Sa miaging artikulo, naghisgot kami bahin sa usa ka yano nga paagi sa pagbawi sa katalagman sa mga sistema sa pagtipig sa AERODISK ENGINE - pagkopya. Niini nga artikulo, mag-dive kami sa usa ka mas komplikado ug makapaikag nga hilisgutan - ang metrocluster, nga mao, usa ka paagi sa automated nga pagpanalipod sa katalagman alang sa duha nga mga sentro sa datos, nga gitugotan ang mga sentro sa datos nga molihok sa aktibo nga aktibo nga mode. Isulti namo kanimo, ipakita kanimo, gub-on kini ug ayohon kini.

Sama sa naandan, theory una

Ang metrocluster usa ka cluster nga mikaylap sa daghang mga site sulod sa usa ka siyudad o rehiyon. Ang pulong nga "cluster" tin-aw nga nagpahibalo kanamo nga ang komplikado awtomatiko, nga mao, ang pagbalhin sa mga cluster node kung adunay mga kapakyasan nga awtomatikong mahitabo.

Dinhi naa ang panguna nga kalainan tali sa usa ka metrocluster ug regular nga pagkopya. Automation sa mga operasyon. Kana mao, kung adunay pipila nga mga insidente (pagkapakyas sa sentro sa datos, nabuak nga mga kanal, ug uban pa), ang sistema sa pagtipig independente nga magbuhat sa kinahanglan nga mga aksyon aron mapadayon ang pagkaanaa sa datos. Kung naggamit ug regular nga mga replika, kini nga mga aksyon gihimo sa tibuuk o bahin nga mano-mano sa tagdumala.

Unsa man ini?

Ang panguna nga katuyoan nga gitinguha sa mga kostumer kung gigamit ang pipila nga mga pagpatuman sa metrocluster mao ang pagminus sa RTO (Tumong sa Oras sa Pagbawi). Sa ato pa, aron maminusan ang oras sa pagbawi sa mga serbisyo sa IT pagkahuman sa pagkapakyas. Kung mogamit ka ug regular nga replikasyon, ang oras sa pagbawi kanunay nga mas taas kaysa sa oras sa pagbawi nga adunay metrocluster. Ngano man? Simple kaayo. Ang tagdumala kinahanglan nga naa sa iyang lamesa ug mano-mano ang pagbalhin sa replikasyon, ug awtomatiko kini nga buhaton sa metrocluster.

Kung wala kay dedikado nga administrador nga nag-duty nga dili matulog, dili mokaon, dili manigarilyo o masakit, ug motan-aw sa kahimtang sa sistema sa pagtipig 24 oras sa usa ka adlaw, nan walay paagi sa paggarantiya nga ang administrador mag mahimong magamit alang sa manual switch sa panahon sa usa ka kapakyasan.

Tungod niini, ang RTO kung wala ang metrocluster o usa ka imortal nga admin sa ika-99 nga lebel sa serbisyo sa katungdanan sa administrador mahimong katumbas sa kantidad sa oras sa pagbalhin sa tanan nga mga sistema ug ang labing taas nga yugto sa panahon nga pagkahuman gigarantiyahan ang tagdumala nga magsugod sa pagtrabaho. uban sa mga sistema sa pagtipig ug mga may kalabutan nga sistema.

Busa, nakaabot kami sa dayag nga konklusyon nga ang metrocluster kinahanglan gamiton kung ang gikinahanglan alang sa RTO mga minuto, dili mga oras o mga adlaw. Kana mao, kung sa panghitabo sa pinakagrabe nga pagkapakyas sa data center, ang departamento sa IT kinahanglan nga maghatag sa negosyo sa panahon aron mapasig-uli ang pag-access sa mga serbisyo sa IT sulod sa mga minuto, o bisan mga segundo.

Unsang paagi kini sa trabaho?

Sa ubos nga lebel, ang metrocluster naggamit usa ka mekanismo alang sa dungan nga pagkopya sa datos, nga among gihulagway sa miaging artikulo (tan-awa. link). Tungod kay ang pagkopya dungan, ang mga kinahanglanon alang niini katumbas, o labi pa:

  • optical fiber ingon pisika, 10 gigabit Ethernet (o mas taas);
  • ang gilay-on tali sa mga sentro sa datos dili molapas sa 40 kilometro;
  • optical channel delay tali sa data centers (tali sa storage system) kay sa 5 milliseconds (optimally 2).

Ang tanan nga kini nga mga kinahanglanon mga advisory sa kinaiyahan, nga mao, ang metrocluster molihok bisan kung kini nga mga kinahanglanon wala matuman, apan kinahanglan naton masabtan nga ang mga sangputanan sa dili pagsunod sa kini nga mga kinahanglanon parehas sa usa ka paghinay sa operasyon sa duha nga mga sistema sa pagtipig sa ang metrocluster.

Busa, ang usa ka dungan nga replika gigamit sa pagbalhin sa datos tali sa mga sistema sa pagtipig, ug sa unsang paagi ang mga replika awtomatikong magbalhin ug, labing importante, unsaon paglikay sa split-utok? Aron mahimo kini, sa mas taas nga lebel, usa ka dugang nga entidad ang gigamit - usa ka arbiter.

Giunsa pagtrabaho ang usa ka arbitrator ug unsa ang iyang tahas?

Ang arbiter usa ka gamay nga virtual machine o hardware cluster nga kinahanglang ilunsad sa ikatulo nga site (pananglitan, sa usa ka opisina) ug maghatag ug access sa storage system pinaagi sa ICMP ug SSH. Pagkahuman sa paglansad, kinahanglan nga itakda sa arbiter ang IP, ug dayon gikan sa kilid sa pagtipig ipakita ang adres niini, dugang ang mga adres sa mga hilit nga controller nga miapil sa metrocluster. Human niini, ang referee andam na sa pagtrabaho.

Ang arbiter kanunay nga nag-monitor sa tanan nga mga sistema sa pagtipig sa metrocluster ug kung ang usa ka partikular nga sistema sa pagtipig dili magamit, pagkahuman sa pagkumpirma nga dili magamit gikan sa lain nga miyembro sa cluster (usa sa mga "live" nga sistema sa pagtipig), nakahukom siya nga ilunsad ang pamaagi alang sa pagbalhin sa mga lagda sa pagkopya. ug pagmapa.

Usa ka hinungdanon kaayo nga punto. Ang arbitrator kinahanglan kanunay nga nahimutang sa usa ka site nga lahi sa kung diin nahimutang ang mga sistema sa pagtipig, nga mao, dili sa sentro sa datos 1, kung diin gi-install ang sistema sa pagtipig 1, ni sa sentro sa datos 2, kung diin gi-install ang sistema sa pagtipig 2.

Ngano man? Tungod kay mao kini ang bugtong paagi nga ang usa ka arbitrator, uban sa tabang sa usa sa mga buhi nga sistema sa pagtipig, mahimo nga klaro ug tukma nga mahibal-an ang pagkahulog sa bisan unsang duha nga mga site diin ang mga sistema sa pagtipig na-install. Ang bisan unsang ubang mga pamaagi sa pagbutang sa usa ka arbiter mahimong moresulta sa usa ka split-utok.

Karon atong susihon ang mga detalye sa trabaho sa arbitrator.

Ang arbiter nagpadagan sa daghang mga serbisyo nga kanunay nga nagsusi sa tanan nga mga tigkontrol sa pagtipig. Kung ang resulta sa poll lahi sa nauna (anaa/dili magamit), nan kini girekord sa usa ka gamay nga database, nga nagtrabaho usab sa arbiter.

Atong tan-awon ang lohika sa buhat sa arbitrator sa mas detalyado.

Lakang 1: Tinoa ang dili magamit. Ang usa ka panghitabo sa pagkapakyas sa sistema sa pagtipig mao ang pagkawala sa ping gikan sa duha nga mga controller sa parehas nga sistema sa pagtipig sulod sa 5 segundos.

Lakang 2. Sugdi ang switching procedure. Human maamgohan sa arbiter nga ang usa sa mga sistema sa pagtipig dili magamit, nagpadala siya og usa ka hangyo ngadto sa "buhi" nga sistema sa pagtipig aron sa pagsiguro nga ang "patay" nga sistema sa pagtipig patay gayud.

Human makadawat sa ingon nga usa ka sugo gikan sa arbiter, ang ikaduha (live) nga sistema sa pagtipig dugang nga nagsusi sa pagkaanaa sa nahulog nga unang sistema sa pagtipig ug, kung wala kini, nagpadala ug kumpirmasyon sa arbiter sa iyang pagtag-an. Ang sistema sa pagtipig sa tinuud dili magamit.

Human madawat ang ingon nga kumpirmasyon, ang arbiter naglunsad og usa ka hilit nga pamaagi alang sa pagbalhin sa replikasyon ug pagpataas sa mapping sa mga replika nga aktibo (panguna) sa nahulog nga sistema sa pagtipig, ug nagpadala usa ka mando sa ikaduhang sistema sa pagtipig aron usbon kini nga mga replika gikan sa sekondarya ngadto sa panguna ug ipataas ang mapping. Aw, ang ikaduha nga sistema sa pagtipig, sumala niana, naghimo niini nga mga pamaagi, ug dayon naghatag og access sa nawala nga mga LUN gikan sa iyang kaugalingon.

Ngano nga gikinahanglan ang dugang nga pag-verify? Para sa korum. Sa ato pa, ang kadaghanan sa kinatibuk-ang katingad-an (3) nga gidaghanon sa mga miyembro sa cluster kinahanglan nga mokumpirma sa pagkahulog sa usa sa mga cluster node. Unya ra gyud nga husto ang kini nga desisyon. Kini mao ang gikinahanglan aron sa paglikay sa sayop nga pagbalhin ug, sumala niana, split-utok.

Ang lakang sa oras 2 mokabat sa gibana-bana nga 5 - 10 segundos, sa ingon, gikonsiderar ang oras nga gikinahanglan aron mahibal-an ang dili magamit (5 segundos), sa sulod sa 10 - 15 segundo pagkahuman sa aksidente, ang mga LUN gikan sa nahulog nga sistema sa pagtipig mahimong awtomatiko nga magamit aron magtrabaho kauban ang live sistema sa pagtipig.

Klaro nga aron malikayan ang pagkawala sa mga koneksyon sa mga host, kinahanglan usab nimo nga mag-amping sa husto nga pag-configure sa mga timeout sa mga host. Ang girekomendar nga timeout labing menos 30 segundos. Makapugong kini sa host nga maputol ang koneksyon sa sistema sa pagtipig sa panahon sa pagbalhin sa load kung adunay katalagman ug makasiguro nga wala’y mga pagkabalda sa I/O.

Paghulat usa ka segundo, kini nahimo nga kung ang tanan maayo kaayo sa metrocluster, ngano nga kinahanglan naton kanunay nga pagkopya?

Sa pagkatinuod, ang tanan dili kaayo yano.

Atong tagdon ang mga bentaha ug disbentaha sa metrocluster

Mao nga, nahibal-an namon nga ang klaro nga mga bentaha sa metrocluster kumpara sa naandan nga pagkopya mao ang:

  • Bug-os nga automation, pagsiguro sa gamay nga oras sa pagbawi kung adunay katalagman;
  • Mao ra :-).

Ug karon, pagtagad, ang mga kontra:

  • Gasto sa solusyon. Bisan kung ang metrocluster sa mga sistema sa Aerodisk wala magkinahanglan dugang nga lisensya (ang parehas nga lisensya gigamit alang sa replika), ang gasto sa solusyon mas taas pa kaysa sa paggamit sa kadungan nga pagkopya. Kinahanglan nimo nga ipatuman ang tanan nga mga kinahanglanon alang sa usa ka dungan nga replika, dugang ang mga kinahanglanon alang sa metrocluster nga adunay kalabotan sa dugang nga pagbalhin ug dugang nga site (tan-awa ang pagplano sa metrocluster);
  • Komplikado sa solusyon. Ang metrocluster labi ka komplikado kaysa usa ka regular nga kopya, ug nanginahanglan labi pa nga atensyon ug paningkamot alang sa pagplano, pag-configure ug dokumentasyon.

Sa kadugayan. Ang Metrocluster sigurado nga usa ka abante kaayo nga teknolohiya ug maayo nga solusyon kung kinahanglan nimo nga maghatag RTO sa mga segundo o minuto. Apan kung wala’y ingon nga buluhaton, ug ang RTO sa mga oras OK alang sa negosyo, nan wala’y kapuslanan ang pagpusil sa mga goryon gikan sa usa ka kanyon. Ang naandan nga replikasyon sa mamumuo-mag-uuma igo na, tungod kay ang usa ka kumpol sa metro magpahinabog dugang nga gasto ug komplikasyon sa imprastraktura sa IT.

Pagplano sa Metrocluster

Kini nga seksyon wala mag-angkon nga usa ka komprehensibo nga giya sa disenyo sa metrocluster, apan nagpakita lamang sa mga nag-unang direksyon nga kinahanglan buhaton kung magdesisyon ka nga magtukod sa ingon nga sistema. Busa, kung aktwal nga nagpatuman sa usa ka metrocluster, siguruha nga iapil ang tiggama sa sistema sa pagtipig (nga mao, kami) ug uban pang mga may kalabutan nga sistema alang sa mga konsultasyon.

Mga lugar

Sama sa giingon sa ibabaw, ang usa ka metrocluster nanginahanglan labing gamay nga tulo nga mga site. Duha ka mga sentro sa datos diin ang mga sistema sa pagtipig ug mga may kalabutan nga sistema molihok, ingon man usa ka ikatulo nga site diin ang arbitrator molihok.

Ang girekomenda nga distansya tali sa mga sentro sa datos dili molapas sa 40 kilometros. Ang usa ka mas dako nga gilay-on lagmit nga hinungdan sa dugang nga mga paglangan, nga sa kaso sa usa ka metrocluster labi ka dili gusto. Pahinumdum kami kanimo nga ang mga paglangan kinahanglan hangtod sa 5 milliseconds, bisan kung girekomenda nga itago kini sa sulod sa 2.

Girekomenda nga susihon ang mga paglangan usab sa panahon sa proseso sa pagplano. Ang bisan unsang mas daghan o dili kaayo hamtong nga tighatag nga naghatag og optical fiber taliwala sa mga sentro sa datos mahimo’g mag-organisar usa ka pagsusi sa kalidad nga dali.

Sama sa alang sa mga paglangan sa atubangan sa arbitrator (nga mao, tali sa ikatulo nga site ug sa unang duha), ang girekomendar nga paglangan threshold mao ang ngadto sa 200 milliseconds, nga mao, ang usa ka regular nga corporate VPN koneksyon sa Internet mao ang angay.

Pagbalhin ug Networking

Dili sama sa laraw sa pagkopya, diin igo na ang pagkonektar sa mga sistema sa pagtipig gikan sa lainlaing mga site, ang laraw sa metrocluster nanginahanglan pagkonekta sa mga host sa duha nga mga sistema sa pagtipig sa lainlaing mga site. Aron mas klaro kung unsa ang kalainan, ang duha nga mga laraw gipakita sa ubos.

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

Ingon sa makita gikan sa diagram, ang among site 1 host nagtan-aw sa duha nga sistema sa pagtipig 1 ug sistema sa pagtipig 2. Usab, sa kasukwahi, ang mga host sa site 2 nagtan-aw sa duha nga sistema sa pagtipig 2 ug sistema sa pagtipig 1. Kana mao, ang matag host nakakita sa duha nga mga sistema sa pagtipig. Kini usa ka kinahanglanon alang sa operasyon sa metrocluster.

Siyempre, dili kinahanglan nga ikonektar ang matag host gamit ang usa ka optical cord sa lain nga sentro sa datos; walay mga pantalan o mga pisi nga igo. Kining tanan nga mga koneksyon kinahanglang himoon pinaagi sa Ethernet 10G+ o FibreChannel 8G+ switch (FC kay para lang sa pagkonektar sa mga host ug storage system para sa IO, ang replication channel kay available lang pinaagi sa IP (Ethernet 10G+).

Karon ang pipila ka mga pulong mahitungod sa network topology. Ang usa ka hinungdanon nga punto mao ang husto nga pag-configure sa mga subnet. Kinahanglan nga ipasabut dayon ang daghang mga subnet alang sa mga musunud nga tipo sa trapiko:

  • Ang subnet nga replikasyon diin ang datos i-synchronize tali sa mga sistema sa pagtipig. Mahimong adunay daghan niini, sa kini nga kaso dili kini igsapayan, kini tanan nagdepende sa kasamtangan (gipatuman na) nga topology sa network. Kung adunay duha niini, nan klaro nga ang pag-ruta kinahanglan nga ma-configure sa taliwala nila;
  • Mga subnet sa pagtipig diin ang mga host maka-access sa mga kahinguhaan sa pagtipig (kung kini iSCSI). Kinahanglan adunay usa ka subnet sa matag data center;
  • Kontrola ang mga subnet, nga mao, tulo ka mga routable subnet sa tulo ka mga site diin ang mga sistema sa pagtipig gidumala, ug ang arbiter nahimutang usab didto.

Wala namo gikonsiderar ang mga subnet alang sa pag-access sa mga kapanguhaan sa host dinhi, tungod kay nagsalig kaayo sila sa mga buluhaton.

Ang pagbulag sa lain-laing mga trapiko ngadto sa lain-laing mga subnets mao ang hilabihan ka importante (kini mao ang ilabi na nga importante sa pagbulag sa replika gikan sa I/O), tungod kay kon imong sagolon ang tanan nga trapiko ngadto sa usa ka "baga" nga subnet, nan kini nga trapiko mahimong imposible sa pagdumala, ug sa ang mga kondisyon sa duha ka mga sentro sa datos mahimo pa kini nga hinungdan sa lainlaing mga kapilian sa pagbangga sa network. Dili kami mag-usisa pag-ayo sa kini nga isyu sa sulud sa kini nga artikulo, tungod kay mabasa nimo ang bahin sa pagplano sa usa ka network nga gilaraw taliwala sa mga sentro sa datos sa mga kahinguhaan sa mga tiggama sa kagamitan sa network, diin kini gihulagway sa daghang detalye.

Konfigurasyon sa arbiter

Ang arbiter kinahanglang maghatag ug access sa tanang management interface sa storage system pinaagi sa ICMP ug SSH protocols. Kinahanglan mo usab nga hunahunaon ang failsafe sa arbiter. Adunay usa ka nuance dinhi.

Arbiter failover mao ang kaayo nga tilinguhaon, apan dili gikinahanglan. Unsa ang mahitabo kung ang referee nahagsa sa dili husto nga oras?

  • Ang operasyon sa metrocluster sa normal nga mode dili mausab, tungod kay Ang arbtir hingpit nga walay epekto sa operasyon sa metrocluster sa normal nga mode (ang tahas niini mao ang pagbalhin sa load tali sa mga sentro sa datos sa tukmang panahon)
  • Dugang pa, kung ang arbiter sa usa ka rason o sa lain mahulog ug "natulog pinaagi sa" usa ka aksidente sa data center, nan walay pagbalhin nga mahitabo, tungod kay walay usa nga mohatag sa gikinahanglan nga switching commands ug mag-organisar sa usa ka korum. Sa kini nga kaso, ang metrocluster mahimong usa ka regular nga laraw nga adunay replikasyon, nga kinahanglan nga mano-mano nga ibalhin sa panahon sa usa ka katalagman, nga makaapekto sa RTO.

Unsay nagsunod niini? Kung kinahanglan gyud nimo nga masiguro ang usa ka minimum nga RTO, kinahanglan nimo nga sigurohon nga ang arbiter matugoton sa sayup. Adunay duha ka kapilian alang niini:

  • Ilunsad ang usa ka virtual machine nga adunay usa ka arbiter sa usa ka fault-tolerant hypervisor, maayo na lang ang tanan nga hamtong nga hypervisor nagsuporta sa fault tolerance;
  • Kung sa ikatulo nga site (sa usa ka naandan nga opisina) tapolan ka kaayo nga mag-install sa usa ka normal nga kumpol ug wala’y naglungtad nga kumpol nga hypervozor, nan naghatag kami usa ka bersyon sa hardware sa arbiter, nga gihimo sa usa ka kahon nga 2U diin duha ka ordinaryo. Ang mga x-86 server nagtrabaho ug nga makalahutay sa usa ka lokal nga kapakyasan.

Girekomenda namon nga masiguro ang pagtugot sa sayup sa arbiter, bisan pa sa kamatuoran nga ang metrocluster wala magkinahanglan niini sa normal nga mode. Apan sama sa gipakita sa teorya ug praktis, kung magtukod ka usa ka tinuud nga kasaligan nga imprastraktura nga wala’y katalagman, nan mas maayo nga dulaon kini nga luwas. Mas maayo nga panalipdan ang imong kaugalingon ug ang imong negosyo gikan sa "balaod sa pagkadaotan," nga mao, gikan sa kapakyasan sa arbitrator ug usa sa mga site diin nahimutang ang sistema sa pagtipig.

Solusyon nga arkitektura

Gikonsiderar ang mga kinahanglanon sa ibabaw, nakuha namon ang mosunud nga arkitektura sa kinatibuk-ang solusyon.

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

Ang mga LUN kinahanglan nga parehas nga ipang-apod-apod sa duha ka lugar aron malikayan ang grabe nga overload. Sa parehas nga oras, kung ang pag-size sa duha nga mga sentro sa datos, kinahanglan nimo nga ilakip dili lamang ang doble nga gidaghanon (nga gikinahanglan aron dungan nga pagtipig sa datos sa duha nga mga sistema sa pagtipig), apan doble usab nga pasundayag sa IOPS ug MB / s aron malikayan ang pagkadaot sa aplikasyon sa ang panghitabo sa pagkapakyas sa usa sa mga sentro sa datos.

Gilain, among namatikdan nga sa tukma nga pamaagi sa pag-size (kana mao, kung gihatag namon ang husto nga taas nga limitasyon sa IOPS ug MB / s, ingon man ang kinahanglan nga mga kapanguhaan sa CPU ug RAM), kung usa sa mga sistema sa pagtipig sa napakyas ang metro cluster, wala'y seryoso nga pagkunhod sa performance ubos sa mga kondisyon nga temporaryo nga trabaho sa usa ka storage system.

Gipatin-aw kini sa kamatuoran nga kung ang duha ka mga site naglihok nga dungan, ang dungan nga pagkopya "nagkaon" sa katunga sa pasundayag sa pagsulat, tungod kay ang matag transaksyon kinahanglan isulat sa duha nga mga sistema sa pagtipig (susama sa RAID-1/10). Busa, kung ang usa sa mga sistema sa pagtipig mapakyas, ang impluwensya sa pagkopya temporaryo (hangtod ang napakyas nga sistema sa pagtipig) mawala, ug makakuha kami usa ka doble nga pagtaas sa pasundayag sa pagsulat. Human ma-restart ang LUN sa napakyas nga storage system sa working storage system, kining duha ka pilo nga pagtaas mawala tungod sa kamatuoran nga ang load makita gikan sa LUNs sa laing storage system, ug mibalik kami sa samang lebel sa performance nga naa namo sa wala pa ang "pagkahulog", apan sulod lamang sa gambalay sa usa ka site.

Sa tabang sa takos nga pagsukod, mahimo nimong masiguro ang mga kondisyon diin ang mga tiggamit dili makabati sa kapakyasan sa usa ka tibuuk nga sistema sa pagtipig. Apan gisubli namon pag-usab, nanginahanglan kini nga mabinantayon nga pagsukod, diin, sa tinuud, mahimo ka makontak kanamo nga libre :-).

Pagbutang ug metrocluster

Ang pag-set up sa usa ka metrocluster susama kaayo sa pag-set up sa regular nga replikasyon, nga among gihulagway sa miaging artikulo. Busa, mag-focus lang kita sa mga kalainan. Nagbutang kami og usa ka bangko sa laboratoryo base sa arkitektura sa ibabaw, sa gamay ra nga bersyon: duha ka sistema sa pagtipig nga konektado pinaagi sa 10G Ethernet, duha ka 10G switch ug usa ka host nga nagtan-aw sa mga switch sa duha nga mga sistema sa pagtipig nga adunay 10G nga mga pantalan. Ang arbiter nagdagan sa usa ka virtual nga makina.

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

Kung gi-configure ang mga virtual IP (VIP) alang sa usa ka replika, kinahanglan nimo nga pilion ang tipo sa VIP - alang sa metrocluster.

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

Naghimo kami og duha ka link sa replikasyon alang sa duha ka LUN ug giapod-apod kini sa duha ka sistema sa pagtipig: LUN TEST Primary sa storage system 1 (METRO link), LUN TEST2 Primary para sa storage system 2 (METRO2 link).

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

Alang kanila, among gi-configure ang duha ka managsama nga mga target (sa among kaso iSCSI, apan gisuportahan usab ang FC, parehas ang logic sa pag-setup).

Sistema sa pagtipig 1:

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

Sistema sa pagtipig 2:

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

Alang sa mga koneksyon sa pagkopya, gihimo ang mga mapa sa matag sistema sa pagtipig.

Sistema sa pagtipig 1:

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

Sistema sa pagtipig 2:

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

Gipahimutang namo ang multipath ug gipresentar kini sa host.

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

Pagbutang ug arbitrator

Dili nimo kinahanglan nga buhaton ang bisan unsang espesyal sa arbiter mismo; kinahanglan nimo nga himuon kini sa ikatulo nga site, hatagan kini usa ka IP ug i-configure ang pag-access niini pinaagi sa ICMP ug SSH. Ang pag-setup mismo gihimo gikan sa mga sistema sa pagtipig mismo. Sa kini nga kaso, igo na nga i-configure ang arbiter kausa sa bisan unsang mga tigpugong sa pagtipig sa metrocluster; kini nga mga setting ipang-apod-apod sa tanan nga mga controller awtomatiko.

Sa seksyon nga Remote replication>> Metrocluster (sa bisan unsang controller)>> ang "Configure" nga buton.

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

Gisulod namo ang IP sa arbiter, ingon man ang mga interface sa pagkontrol sa duha ka remote storage controllers.

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

Pagkahuman niini, kinahanglan nimo nga palihokon ang tanan nga mga serbisyo (ang "I-restart ang tanan" nga buton). Kung ma-configure pag-usab sa umaabot, ang mga serbisyo kinahanglan nga i-restart aron ang mga setting molihok.

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

Gisusi namon nga ang tanan nga mga serbisyo nagdagan.

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

Nakompleto niini ang pag-setup sa metrocluster.

Pagsulay sa pagbangga

Ang pagsulay sa pag-crash sa among kaso mahimong yano ug paspas, tungod kay ang pag-andar sa pagkopya (pagbalhin, pagkamakanunayon, ug uban pa) gihisgutan sa miaging artikulo. Busa, aron masulayan ang pagkakasaligan sa metrocluster, igo na alang kanamo nga susihon ang automation sa pagtuki sa kapakyasan, pagbalhin ug pagkawala sa mga pagkawala sa pagrekord (paghunong sa I / O).

Aron mahimo kini, among gisundog ang usa ka bug-os nga kapakyasan sa usa sa mga sistema sa pagtipig pinaagi sa pisikal nga pagpalong sa duha sa mga tigkontrol niini, nga nagsugod una sa pagkopya sa usa ka dako nga file sa LUN, nga kinahanglan nga ma-aktibo sa lain nga sistema sa pagtipig.

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

Pag-disable sa usa ka sistema sa pagtipig. Sa ikaduha nga sistema sa pagtipig makita namon ang mga alerto ug mga mensahe sa mga troso nga nawala ang koneksyon sa silingang sistema. Kung ang mga pahibalo pinaagi sa pagmonitor sa SMTP o SNMP gi-configure, ang tagdumala makadawat og katugbang nga mga pahibalo.

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

Eksaktong 10 segundos sa ulahi (makita sa duha ka screenshot), ang METRO replication connection (ang usa nga Primary sa napakyas nga storage system) awtomatikong nahimong Primary sa working storage system. Gamit ang kasamtangan nga mapping, ang LUN TEST nagpabilin nga magamit sa host, ang recording mius-os og gamay (sulod sa gisaad nga 10 porsyento), apan wala mabalda.

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

AERODISK Engine: Pagbawi sa katalagman. Bahin 2. Metrocluster

Malampuson nga nahuman ang pagsulay.

Sa pagtin-aw

Ang kasamtangan nga pagpatuman sa metrocluster sa AERODISK Engine N-series storage systems bug-os nga nagtugot sa pagsulbad sa mga problema diin gikinahanglan ang pagwagtang o pagminus sa downtime alang sa mga serbisyo sa IT ug pagsiguro sa ilang operasyon 24/7/365 nga adunay gamay nga gasto sa pagtrabaho.

Mahimo natong isulti, siyempre, nga kining tanan mao ang teorya, sulundon nga mga kondisyon sa laboratoryo, ug uban pa... PERO kita adunay ubay-ubay nga gipatuman nga mga proyekto diin atong gipatuman ang disaster-resilience functionality, ug ang mga sistema nagtrabaho sa hingpit. Usa sa among medyo inila nga mga kustomer, nga naggamit lang og duha ka sistema sa pagtipig sa usa ka disaster-proof configuration, miuyon na sa pagmantala sa impormasyon mahitungod sa proyekto, mao nga sa sunod nga bahin atong hisgutan ang pagpatuman sa combat.

Salamat, nagpaabut kami sa usa ka mabungahon nga diskusyon.

Source: www.habr.com

Idugang sa usa ka comment