AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Hello, Habr readers! Ang hilisgutan niini nga artikulo mao ang pagpatuman sa mga himan sa pagbawi sa katalagman sa mga sistema sa pagtipig sa AERODISK Engine. Sa sinugdanan, gusto namong magsulat sa usa ka artikulo mahitungod sa duha ka himan: replikasyon ug metrocluster, apan, sa kasubo, ang artikulo nahimong taas kaayo, mao nga gibahin namo ang artikulo sa duha ka bahin. Gikan sa yano hangtod sa komplikado. Niini nga artikulo, mag-set up kami ug sulayan ang dungan nga pagkopya - ihulog namon ang usa ka sentro sa datos, ug bungkagon usab ang channel sa komunikasyon tali sa mga sentro sa datos ug tan-awon kung unsa ang mahitabo.

Ang among mga kostumer kanunay nga mangutana kanamo sa lainlaing mga pangutana bahin sa pagkopya, mao nga sa wala pa magpadayon sa pag-set up ug pagsulay sa pagpatuman sa mga replika, isulti namon kanimo kung unsa ang pagkopya sa pagtipig.

Usa ka teoriya

Ang pagkopya sa mga sistema sa pagtipig usa ka padayon nga proseso sa pagsiguro sa identidad sa datos sa daghang mga sistema sa pagtipig nga dungan. Sa teknikal, ang pagkopya nahimo sa duha ka paagi.

Duyog nga replikasyon - kini ang pagkopya sa datos gikan sa nag-unang sistema sa pagtipig ngadto sa backup, nga gisundan sa mandatory nga kumpirmasyon gikan sa duha ka sistema sa pagtipig nga ang datos natala ug nakumpirma. Kini human sa pagkumpirma sa duha ka kilid (parehong mga sistema sa pagtipig) nga ang datos gikonsiderar nga natala ug mahimong magamit. Gisiguro niini ang garantiya nga identidad sa datos sa tanan nga mga sistema sa pagtipig nga nag-apil sa replika.

Ang mga bentaha niini nga pamaagi:

  • Ang datos kanunay nga managsama sa tanan nga mga sistema sa pagtipig

Kahinumduman:

  • Taas nga gasto sa solusyon (paspas nga mga channel sa komunikasyon, mahal nga optical fiber, long-wave transceiver, ug uban pa)
  • Mga pagdili sa distansya (sulod sa pipila ka napulo ka kilometro)
  • Wala’y panalipod batok sa korapsyon sa lohikal nga datos (kung ang datos nadaot (tinuyo o wala tuyoa) sa nag-unang sistema sa pagtipig, kini awtomatiko ug diha-diha dayon madaot sa backup, tungod kay ang datos kanunay parehas (mao kana ang paradox)

Asynchronous nga replikasyon - kini usab ang pagkopya sa datos gikan sa nag-unang sistema sa pagtipig ngadto sa backup nga usa, apan sa usa ka piho nga paglangan ug walay panginahanglan sa pagkumpirma sa pagsulat sa pikas nga bahin. Makatrabaho ka dayon sa datos pagkahuman sa pagrekord niini sa panguna nga sistema sa pagtipig, ug sa backup nga sistema sa pagtipig ang datos magamit pagkahuman sa pila ka oras. Ang identidad sa datos sa niini nga kaso, siyempre, dili masiguro sa tanan. Ang datos sa backup nga sistema sa pagtipig kanunay usa ka gamay nga "kaniadto."

Mga bentaha sa asynchronous replication:

  • Ubos nga gasto nga solusyon (bisan unsang mga channel sa komunikasyon, opsyonal nga optika)
  • Walay mga pagdili sa distansya
  • Sa backup nga sistema sa pagtipig, ang data dili madaot kung kini nadaot sa panguna (labing menos sa pipila ka panahon); kung ang datos madaot, mahimo nimo kanunay nga hunongon ang replika aron malikayan ang korapsyon sa datos sa backup nga sistema sa pagtipig

Kahinumduman:

  • Ang datos sa lainlaing mga sentro sa datos kanunay nga dili managsama

Sa ingon, ang pagpili sa mode sa pagkopya nagdepende sa mga katuyoan sa negosyo. Kung kini kritikal alang kanimo nga ang backup nga data center naglangkob sa eksakto nga parehas nga datos sa panguna nga sentro sa datos (pananglitan, kinahanglanon sa negosyo alang sa RPO = 0), nan kinahanglan nimo nga i-fork ang kwarta ug ibutang ang mga limitasyon sa usa ka kasabay. replika. Ug kung ang paglangan sa estado sa datos madawat o wala’y kuwarta, nan kinahanglan nimo nga gamiton ang asynchronous nga pamaagi.

Gilain usab nato nga i-highlight ang ingon nga mode (mas tukma, usa ka topology) isip usa ka metrocluster. Sa metrocluster mode, ang synchronous replication gigamit, apan, dili sama sa usa ka regular nga replica, ang metrocluster nagtugot sa duha ka storage system nga molihok sa active mode. Mga. wala ka'y ​​panagbulag tali sa aktibo ug standby nga mga sentro sa datos. Ang mga aplikasyon nagtrabaho dungan sa duha ka sistema sa pagtipig, nga pisikal nga nahimutang sa lainlaing mga sentro sa datos. Ang mga downtime sa panahon sa mga aksidente sa ingon nga topology gamay ra kaayo (RTO, kasagaran mga minuto). Niini nga artikulo dili namo tagdon ang among pagpatuman sa metrocluster, tungod kay kini usa ka dako ug lapad nga hilisgutan, mao nga among igahin ang usa ka bulag, sunod nga artikulo niini, sa pagpadayon niini.

Usab, kanunay, kung maghisgot kita bahin sa pagkopya gamit ang mga sistema sa pagtipig, daghang mga tawo ang adunay usa ka makatarunganon nga pangutana: > "Daghang mga aplikasyon adunay ilang kaugalingon nga mga himan sa pagkopya, ngano nga gigamit ang pagkopya sa mga sistema sa pagtipig? Mas maayo ba o mas grabe?

Walay klaro nga tubag dinhi, mao nga ania ang mga argumento FOR ug CONS:

Mga argumento PARA sa replikasyon sa pagtipig:

  • Kayano sa solusyon. Uban sa usa ka himan, mahimo nimong kopyahon ang imong tibuuk nga set sa datos, bisan unsa pa ang klase sa pagkarga ug aplikasyon. Kung mogamit ka usa ka kopya gikan sa mga aplikasyon, kinahanglan nimo nga i-configure ang matag aplikasyon nga gilain. Kung adunay labaw pa sa 2 niini, nan kini labi ka kusog sa pagtrabaho ug mahal (ang replikasyon sa aplikasyon kasagaran nanginahanglan usa ka lahi ug dili libre nga lisensya alang sa matag aplikasyon. Apan labaw pa sa ubos).
  • Mahimo nimong kopyahon ang bisan unsang butang - bisan unsang aplikasyon, bisan unsang datos - ug kini kanunay nga makanunayon. Daghang (kadaghanan) nga aplikasyon ang wala’y kapabilidad sa pagkopya, ug ang mga replika gikan sa sistema sa pagtipig mao ra ang paagi aron mahatagan proteksyon gikan sa mga katalagman.
  • Dili kinahanglan nga mag-overpay para sa pagpaandar sa pagkopya sa aplikasyon. Ingon sa usa ka lagda, dili kini barato, sama sa mga lisensya alang sa replika sa sistema sa pagtipig. Apan kinahanglan ka nga magbayad alang sa usa ka lisensya alang sa pagkopya sa pagtipig kausa, ug usa ka lisensya alang sa replika sa aplikasyon kinahanglan mapalit sa matag aplikasyon nga gilain. Kung adunay daghang ingon nga mga aplikasyon, nan kini nagkantidad usa ka matahum nga sentimos ug ang gasto sa mga lisensya alang sa pagkopya sa pagtipig mahimong usa ka tinulo sa balde.

Mga argumento AGAINST storage replication:

  • Ang replika pinaagi sa mga aplikasyon adunay labi ka gamit gikan sa punto sa pagtan-aw sa mga aplikasyon mismo, ang aplikasyon mas nahibal-an ang datos niini (klaro), mao nga adunay daghang mga kapilian sa pagtrabaho kauban nila.
  • Ang mga tiggama sa pipila nga mga aplikasyon dili garantiya sa pagkamakanunayon sa ilang mga datos kung ang pagkopya gihimo gamit ang mga himan sa ikatulo nga partido. *

* - kontrobersyal nga thesis. Pananglitan, ang usa ka ilado nga tiggama sa DBMS opisyal nga nagpahayag sa dugay nga panahon nga ang ilang DBMS mahimo ra nga makopya sa kasagaran gamit ang ilang mga paagi, ug ang nahabilin nga replikasyon (lakip ang mga sistema sa pagtipig) "dili tinuod." Apan gipakita sa kinabuhi nga dili ingon niana. Lagmit (apan dili kini sigurado) dili kini ang labing matinud-anon nga pagsulay sa pagbaligya sa daghang mga lisensya sa mga kustomer.

Ingon usa ka sangputanan, sa kadaghanan nga mga kaso, ang pagkopya gikan sa sistema sa pagtipig mas maayo, tungod kay Kini usa ka yano ug dili kaayo mahal nga kapilian, apan adunay mga komplikado nga mga kaso kung gikinahanglan ang piho nga pag-andar sa aplikasyon, ug kinahanglan nga magtrabaho kauban ang lebel sa aplikasyon nga pagkopya.

Tapos na sa teorya, karon praktis

Atong i-configure ang replika sa atong lab. Sa mga kondisyon sa laboratoryo, gisundog namo ang duha ka mga sentro sa datos (sa pagkatinuod, duha ka kasikbit nga mga racks nga daw anaa sa lain-laing mga building). Ang baroganan naglangkob sa duha ka Engine N2 storage system, nga konektado sa usag usa pinaagi sa optical cables. Ang usa ka pisikal nga server nga nagpadagan sa Windows Server 2016 konektado sa duha nga sistema sa pagtipig gamit ang 10Gb Ethernet. Ang baruganan yano ra, apan wala kini magbag-o sa esensya.

Sa eskematiko kini tan-awon sama niini:

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Sa lohikal nga paagi, ang pagkopya giorganisar sama sa mosunod:

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Karon atong tan-awon ang replication functionality nga naa nato karon.
Duha ka mode ang gisuportahan: asynchronous ug synchronous. Makataronganon nga ang synchronous mode limitado sa gilay-on ug channel sa komunikasyon. Sa partikular, ang synchronous mode nagkinahanglan sa paggamit sa fiber ingon sa physics ug 10 Gigabit Ethernet (o mas taas).

Ang gisuportahan nga gilay-on alang sa synchronous replication mao ang 40 ka kilometro, ang delay value sa optical channel tali sa mga data center hangtod sa 2 milliseconds. Sa kinatibuk-an, kini molihok uban ang daghang mga paglangan, apan adunay kusog nga paghinay sa panahon sa pagrekord (nga makatarunganon usab), mao nga kung nagplano ka nga dungan nga pagkopya tali sa mga sentro sa datos, kinahanglan nimo nga susihon ang kalidad sa mga optika ug ang mga paglangan.

Ang mga kinahanglanon alang sa asynchronous replication dili kaayo seryoso. Sa mas tukma, wala sila didto. Ang bisan unsang nagtrabaho nga koneksyon sa Ethernet mahimo.

Sa pagkakaron, ang sistema sa pagtipig sa AERODISK ENGINE nagsuporta sa replikasyon alang sa mga block device (LUNs) pinaagi sa Ethernet protocol (over copper o optical). Alang sa mga proyekto diin gikinahanglan ang pagkopya pinaagi sa usa ka tela sa SAN sa Fiber Channel, sa pagkakaron kami nagdugang ug angay nga solusyon, apan dili pa kini andam, mao nga sa among kaso, Ethernet lamang.

Ang pagkopya mahimong molihok tali sa bisan unsang sistema sa pagtipig sa serye sa ENGINE (N1, N2, N4) gikan sa mga junior system hangtod sa mga tigulang ug vice versa.

Ang pag-andar sa duha nga mga mode sa pagkopya hingpit nga managsama. Sa ubos mao ang dugang nga mga detalye bahin sa kung unsa ang magamit:

  • Ang pagkopya "usa ngadto sa usa" o "usa ngadto sa usa", nga mao, ang klasiko nga bersyon nga adunay duha ka mga sentro sa datos, ang panguna ug ang backup
  • Ang pagkopya kay "usa ngadto sa daghan" o "usa ngadto sa daghan", i.e. ang usa ka LUN mahimong makopya sa daghang mga sistema sa pagtipig sa usa ka higayon
  • Pag-aktibo, pag-deactivate, ug "baligtad" nga replikasyon, matag usa, aron mahimo, pag-disable, o usbon ang direksyon sa pagkopya
  • Anaa ang replikasyon para sa RDG (Raid Distributed Group) ug DDP (Dynamic Disk Pool) pool. Bisan pa, ang mga LUN sa usa ka RDG pool mahimo ra nga makopya sa lain nga RDG. Parehas sa DDP.

Adunay daghan pang gagmay nga mga bahin, apan walay partikular nga punto sa paglista niini; hisgotan namo kini samtang among gipahimutang.

Pag-set up sa replikasyon

Ang proseso sa pag-setup yano ra ug adunay tulo ka yugto.

  1. Pag-ayo sa network
  2. Setup sa storage
  3. Pagpahimutang sa mga lagda (koneksyon) ug pagmapa

Ang usa ka hinungdanon nga punto sa pag-set up sa pagkopya mao nga ang una nga duha nga mga yugto kinahanglan nga gisubli sa hilit nga sistema sa pagtipig, ang ikatulo nga yugto - sa panguna lamang.

Pag-set up sa mga kapanguhaan sa network

Ang una nga lakang mao ang pag-configure sa mga pantalan sa network diin ang trapiko sa replikasyon ipadala. Aron mahimo kini, kinahanglan nimo nga i-enable ang mga pantalan ug itakda ang ilang mga IP address sa seksyon sa Front-end adapters.

Pagkahuman niini, kinahanglan namon nga maghimo usa ka pool (sa among kaso RDG) ug usa ka virtual IP alang sa pagkopya (VIP). Ang VIP usa ka naglutaw nga IP address nga gihigot sa duha ka "pisikal" nga mga adres sa mga tigdumala sa pagtipig (ang mga pantalan nga bag-o lang namon gi-configure). Kini ang mahimong panguna nga interface sa pagkopya. Mahimo ka usab nga mag-operate dili sa usa ka VIP, apan sa usa ka VLAN, kung kinahanglan nimo nga magtrabaho uban ang tag nga trapiko.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Ang proseso sa paghimo og VIP para sa usa ka replika dili kaayo lahi sa paghimo og VIP para sa I/O (NFS, SMB, iSCSI). Sa kini nga kaso, naghimo kami usa ka regular nga VIP (walay VLAN), apan siguruha nga ipakita nga kini alang sa pagkopya (kung wala kini nga pointer dili kami makadugang sa VIP sa lagda sa sunod nga lakang).

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Ang VIP kinahanglang anaa sa samang subnet sa mga IP port diin kini naglutaw.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Gisubli namon kini nga mga setting sa usa ka hilit nga sistema sa pagtipig, nga adunay lahi nga IP, siyempre.
Ang mga VIP gikan sa lainlaing mga sistema sa pagtipig mahimong naa sa lainlaing mga subnet, ang panguna nga butang mao nga adunay pag-ruta sa taliwala nila. Sa among kaso, kini nga pananglitan tukma nga gipakita (192.168.3.XX ug 192.168.2.XX)

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Nakompleto niini ang pag-andam sa bahin sa network.

Pag-set up sa storage

Ang pag-set up sa pagtipig alang sa usa ka replika lahi sa naandan lamang nga gihimo namon ang pagmapa pinaagi sa usa ka espesyal nga menu nga "Replication Mapping". Kung dili ang tanan parehas sa normal nga pag-setup. Karon, sa han-ay.

Sa kaniadto nga gihimo nga pool R02, kinahanglan nimo nga maghimo usa ka LUN. Himoon nato ug tawgon nga LUN1.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Kinahanglan usab nga maghimo kami sa parehas nga LUN sa usa ka hilit nga sistema sa pagtipig nga parehas ang gidak-on. Kami nagmugna. Aron malikayan ang kalibog, tawgon nato ang remote nga LUN LUN1R

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Kung kinahanglan namong mukuha ug LUN nga naglungtad na, unya samtang nag-set up sa replica, kinahanglan namong i-unmount kining produktibong LUN gikan sa host, ug maghimo lang ug walay sulod nga LUN nga parehas ug gidak-on sa remote storage system.

Kompleto na ang pag-setup sa pagtipig, magpadayon kita sa paghimo og lagda sa pagkopya.

Pag-set up sa mga lagda sa pagkopya o mga link sa pagkopya

Pagkahuman sa paghimo og mga LUN sa sistema sa pagtipig, nga mahimong panguna sa karon, gi-configure namon ang lagda sa pagkopya nga LUN1 sa sistema sa pagtipig 1 hangtod sa LUN1R sa sistema sa pagtipig 2.

Ang setting gihimo sa "Remote replication" menu

Magbuhat ta ug lagda. Aron mahimo kini, kinahanglan nimo nga ipiho ang nakadawat sa replika. Didto gibutang usab namo ang ngalan sa koneksyon ug ang matang sa replikasyon (synchronous o asynchronous).

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Sa field nga "hilit nga mga sistema" atong idugang ang atong storage system2. Aron madugangan, kinahanglan nimong gamiton ang pagdumala sa IP storage system (MGR) ug ang ngalan sa hilit nga LUN diin among himuon ang pagkopya (sa among kaso, LUN1R). Ang pagkontrol sa mga IP gikinahanglan lamang sa yugto sa pagdugang sa usa ka koneksyon; ang pagkopya sa trapiko dili ipasa pinaagi kanila; ang kanhi na-configure nga VIP ang gamiton alang niini.

Naa na sa kini nga yugto makadugang kami labaw sa usa ka hilit nga sistema alang sa "usa ngadto sa daghan" nga topology: i-klik ang "add node" nga buton, sama sa numero sa ubos.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Sa among kaso, adunay usa ra ka layo nga sistema, mao nga gilimitahan namon ang among kaugalingon niini.

Andam na ang lagda. Palihug timan-i nga kini awtomatikong idugang sa tanan nga mga partisipante sa pagkopya (sa among kaso adunay duha niini). Makahimo ka ug daghang mga lagda nga gusto nimo, alang sa bisan unsang gidaghanon sa LUN ug sa bisan unsang direksyon. Pananglitan, aron mabalanse ang load, mahimo natong kopyahon ang bahin sa LUNs gikan sa storage system 1 ngadto sa storage system 2, ug ang laing bahin, sa sukwahi, gikan sa storage system 2 ngadto sa storage system 1.

Sistema sa pagtipig1. Diha-diha dayon pagkahuman sa paglalang, nagsugod ang pag-synchronize.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Sistema sa pagtipig2. Nakita namon ang parehas nga lagda, apan ang pag-synchronize natapos na.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Ang LUN1 sa storage system 1 anaa sa Primary nga papel, nga mao, kini aktibo. Ang LUN1R sa storage system 2 anaa sa papel sa Secondary, sa ato pa, naka-standby kini kung mapakyas ang storage system 1.
Karon makonektar na nato ang atong LUN sa host.

Magkonektar kami pinaagi sa iSCSI, bisan kung mahimo usab kini pinaagi sa FC. Ang pag-set up sa pagmapa pinaagi sa iSCSI LUN sa usa ka replika halos walay kalainan sa naandan nga senaryo, busa dili nato kini tagdon sa detalye dinhi. Kung adunay bisan unsa, kini nga proseso gihulagway sa artikulo nga "Dali nga setup".

Ang bugtong kalainan mao nga naghimo kami og mapping sa menu nga "Replication Mapping".

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Gipahimutang namo ang mapping ug gihatag ang LUN sa host. Ang host nakakita sa LUN.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Giporma namo kini ngadto sa lokal nga sistema sa file.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Mao na, kompleto na ang setup. Ang mga pagsulay moabut sa sunod.

Pagsulay

Susihon nato ang tulo ka nag-unang mga senaryo.

  1. Regular nga pagbalhin sa papel Secondary > Primary. Ang regular nga pagbalhin sa papel gikinahanglan sa kaso, pananglitan, kinahanglan natong buhaton ang pipila ka mga preventive nga operasyon sa main data center ug niining panahona, aron magamit ang datos, atong ibalhin ang load ngadto sa backup data center.
  2. Pagbalhin sa papel sa emerhensiya Secondary > Primary (pagkapakyas sa data center). Kini ang nag-unang senaryo kung diin naglungtad ang replikasyon, nga makatabang nga mabuhi ang usa ka kompleto nga kapakyasan sa sentro sa datos nga wala’y paghunong sa kompanya sa usa ka taas nga panahon.
  3. Pagkaguba sa mga channel sa komunikasyon tali sa mga sentro sa datos. Pagsusi sa husto nga kinaiya sa duha ka mga sistema sa pagtipig sa mga kondisyon diin sa pipila ka rason ang komunikasyon nga channel tali sa mga data center dili magamit (pananglitan, ang usa ka excavator nagkalot sa sayop nga dapit ug gibuak ang ngitngit nga optika).

Una, magsugod kami sa pagsulat sa datos sa among LUN (pagsulat sa mga file nga adunay random nga datos). Nakita dayon namon nga ang channel sa komunikasyon tali sa mga sistema sa pagtipig gigamit. Kini dali masabtan kung imong ablihan ang pag-monitor sa pagkarga sa mga pantalan nga responsable sa pagkopya.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Ang duha nga mga sistema sa pagtipig karon adunay "mapuslanon" nga datos, mahimo naton sugdan ang pagsulay.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Sa kaso lang, atong tan-awon ang hash sums sa usa sa mga file ug isulat kini.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Regular nga pagbalhin sa papel

Ang operasyon sa pagbalhin sa mga tahas (pag-usab sa direksyon sa pagkopya) mahimo sa bisan unsang sistema sa pagtipig, apan kinahanglan nimo nga moadto sa duha, tungod kay kinahanglan nimo nga dili pagana ang pagmapa sa Primary, ug i-enable kini sa Secondary (nga mahimong Primary. ).

Tingali ang usa ka makatarunganon nga pangutana karon mitungha: ngano nga dili kini awtomatiko? Ang tubag mao: kini yano, ang pagkopya usa ka yano nga paagi sa kalig-on sa katalagman, nga gibase lamang sa mga manual nga operasyon. Aron ma-automate kini nga mga operasyon, adunay metrocluster mode; kini hingpit nga awtomatiko, apan ang pag-configure niini labi ka komplikado. Isulat namon ang bahin sa pag-set up sa usa ka metrocluster sa sunod nga artikulo.

Sa panguna nga sistema sa pagtipig, among gi-disable ang pagmapa aron masiguro nga mahunong ang pagrekord.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Unya sa usa sa mga sistema sa pagtipig (dili igsapayan, sa panguna o backup) sa menu nga "Remote replication", pilia ang among koneksyon REPL1 ug i-klik ang "Change role".

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Human sa pipila ka segundo, ang LUN1R (backup storage system) nahimong Primary.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Gimapa namo ang LUN1R nga adunay storage system2.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Pagkahuman niini, ang among E: drive awtomatik nga gilakip sa host, niining higayona kini "naabot" gikan sa LUN1R.

Sa kaso lang, atong itandi ang hash sums.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Parehas. Mipasar ang pagsulay.

Failover. Pagkapakyas sa data center

Sa pagkakaron, ang nag-unang sistema sa pagtipig human sa regular nga pagbalhin mao ang storage system 2 ug LUN1R, matag usa. Aron masundog ang usa ka aksidente, atong palongon ang kuryente sa duha ka storage controllers2.
Wala nay access niini.

Atong tan-awon kung unsa ang nahitabo sa sistema sa pagtipig 1 (ang backup sa karon).

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Atong nakita nga ang Primary LUN (LUN1R) dili magamit. Usa ka mensahe sa sayup ang nagpakita sa mga troso, sa panel sa impormasyon, ug usab sa lagda sa pagkopya mismo. Tungod niini, ang datos gikan sa host sa pagkakaron dili magamit.

Usba ang tahas sa LUN1 ngadto sa Primary.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Nagmapa ko sa host.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Siguroha nga ang drive E makita sa host.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Atong susihon ang hash.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Maayo ra ang tanan. Ang sistema sa pagtipig malampuson nga nakalahutay sa pagkahulog sa data center, nga aktibo. Ang gibanabana nga oras nga among gigugol sa pagkonektar sa replikasyon nga "pagbalik" ug pagkonektar sa LUN gikan sa backup data center mga 3 minuto. Klaro nga sa tinuud nga produksiyon ang tanan labi ka komplikado, ug dugang sa mga aksyon nga adunay mga sistema sa pagtipig, kinahanglan nimo nga himuon ang daghang mga operasyon sa network, sa mga host, sa mga aplikasyon. Ug sa kinabuhi kini nga yugto sa panahon mas taas pa.

Dinhi gusto nakong isulat nga ang tanan, ang pagsulay malampuson nga nahuman, apan dili kita magdali. Ang nag-unang sistema sa pagtipig mao ang "pagbakak", nahibal-an namon nga kung kini "nahulog", naa kini sa panguna nga papel. Unsa ang mahitabo kung kini kalit nga nag-on? Adunay duha ka Panguna nga tahas, nga katumbas sa korapsyon sa datos? Atong susihon kini karon.
Atong kalit nga i-on ang nagpahiping sistema sa pagtipig.

Nag-load kini sulod sa pipila ka minuto ug unya mobalik sa serbisyo pagkahuman sa usa ka mubo nga pag-synchronize, apan sa papel sa Secondary.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

OK ra tanan. Wala mahitabo ang split-brain. Naghunahuna kami bahin niini, ug kanunay pagkahuman sa pagkahulog ang sistema sa pagtipig mosaka sa papel sa Secondary, bisan unsa pa ang papel niini sa "panahon sa kinabuhi." Karon makaingon kita nga sigurado nga ang pagsulay sa kapakyasan sa data center malampuson.

Ang pagkapakyas sa mga agianan sa komunikasyon tali sa mga sentro sa datos

Ang nag-unang tahas niini nga pagsulay mao ang pagsiguro nga ang sistema sa pagtipig dili magsugod sa paglihok nga katingad-an kung kini temporaryo nga mawad-an sa mga agianan sa komunikasyon tali sa duha ka mga sistema sa pagtipig ug unya magpakita pag-usab.
Busa. Gidiskonekta namon ang mga wire sa taliwala sa mga sistema sa pagtipig (hunahunaa nga kini gikalot sa usa ka excavator).

Sa Primary atong makita nga walay koneksyon sa Secondary.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Sa Secondary atong makita nga walay koneksyon sa Primary.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Maayo ang tanan, ug nagpadayon kami sa pagsulat sa datos sa nag-unang sistema sa pagtipig, nga mao, sila gigarantiyahan nga lahi sa backup, nga mao, sila "nagbulag".

Sa pipila ka minuto among "giayo" ang channel sa komunikasyon. Sa diha nga ang mga sistema sa pagtipig magkita sa usag usa, ang pag-synchronize sa data awtomatik nga gi-aktibo. Walay gikinahanglan gikan sa tigdumala dinhi.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Human sa pipila ka panahon, ang pag-synchronize nahuman.

AERODISK Engine: Pagbatok sa kalamidad. Bahin 1

Ang koneksyon gipahiuli, ang pagkawala sa mga channel sa komunikasyon wala hinungdan sa bisan unsang mga emerhensya nga sitwasyon, ug pagkahuman sa pag-switch, ang pag-synchronize awtomatikong nahitabo.

kaplag

Gisusi namon ang teorya - kung unsa ang kinahanglan ug ngano, diin ang mga pro ug asa ang mga kontra. Pagkahuman gipahimutang namon ang dungan nga pagkopya tali sa duha nga mga sistema sa pagtipig.

Sunod, ang sukaranan nga mga pagsulay gihimo alang sa normal nga pagbalhin, pagkapakyas sa sentro sa data ug pagkapakyas sa channel sa komunikasyon. Sa tanan nga mga kaso, ang sistema sa pagtipig nagtrabaho og maayo. Wala’y pagkawala sa datos ug ang mga operasyon sa administratibo gitago sa labing gamay alang sa usa ka manual nga senaryo.

Sa sunod higayon nga komplikado ang sitwasyon ug ipakita kung giunsa ang tanan nga kini nga lohika molihok sa usa ka automated metrocluster sa aktibo-aktibo nga mode, nga mao, kung ang duha nga mga sistema sa pagtipig mao ang panguna, ug ang pamatasan kung adunay mga pagkapakyas sa sistema sa pagtipig hingpit nga awtomatiko.

Palihug pagsulat og mga komentaryo, malipay kami nga makadawat og maayong pagsaway ug praktikal nga tambag.

Sa sunod na pud.

Source: www.habr.com

Idugang sa usa ka comment