AERODISK Motor: Katastroph Resistenz. Deel 1

AERODISK Motor: Katastroph Resistenz. Deel 1

Moien, Habr Lieser! D'Thema vun dësem Artikel ass d'Implementatioun vun Katastrophen Erhuelung Tools an AERODISK Engine Stockage Systemer. Am Ufank wollte mir an engem Artikel iwwer béid Tools schreiwen: Replikatioun a Metrocluster, awer leider huet den Artikel ze laang erausgestallt, also hu mir den Artikel an zwee Deeler opgedeelt. Loosst eis vun einfach bis komplex goen. An dësem Artikel wäerte mir d'Synchron Replikatioun opstellen an testen - mir falen een Datenzenter, a briechen och de Kommunikatiounskanal tëscht den Datenzenteren a kucke wat geschitt.

Eis Clientë stellen eis dacks verschidde Froen iwwer Replikatioun, also ier Dir weider geet fir d'Ëmsetzung vu Repliken opzestellen an ze testen, wäerte mir Iech e bëssen iwwer wat Replikatioun an der Späichere soen.

E bësse vun der Theorie

Replikatioun a Späichersystemer ass e kontinuéierleche Prozess fir Datenidentitéit op verschiddene Späichersystemer gläichzäiteg ze garantéieren. Technesch gëtt Replikatioun op zwou Weeër erreecht.

Synchronesch Replikatioun - dëst kopéiert Daten vum Haaptspeichersystem an de Backup, gefollegt vun enger obligatorescher Bestätegung vu béide Späichersystemer datt d'Donnéeën opgeholl a bestätegt goufen. Et ass no Bestätegung op béide Säiten (béid Späichersystemer) datt d'Donnéeën als opgeholl ugesi ginn a kënne mat geschafft ginn. Dëst garantéiert eng garantéiert Datenidentitéit op all Späichersystemer, déi un der Replica deelhuelen.

D'Virdeeler vun dëser Method:

  • Daten sinn ëmmer identesch op all Späichersystemer

Muecht:

  • Héich Käschte vun der Léisung (schnell Kommunikatiounskanäl, deier optesch Faser, laangwelle Transceiver, etc.)
  • Distanzbeschränkungen (bannent e puer Zéng Kilometer)
  • Et gëtt kee Schutz géint logesch Datekorruptioun (wann d'Donnéeën (bewosst oder zoufälleg) am Haaptspeichersystem korrupt sinn, gëtt se automatesch an direkt op der Backup beschiedegt, well d'Donnéeën ëmmer identesch sinn (dat ass de Paradox)

Asynchrone Replikatioun - Dëst ass och d'Kopie vun Daten aus dem Haaptspeichersystem an de Backup, awer mat enger gewësser Verzögerung an ouni d'Notzung fir d'Schreiwen op der anerer Säit ze bestätegen. Dir kënnt direkt mat Daten schaffen nodeems Dir se an den Haaptspeichersystem opgeholl hutt, an am Backup-Speichersystem sinn d'Donnéeën no enger Zäit verfügbar. D'Identitéit vun den Donnéeën ass an dësem Fall natierlech guer net geséchert. D'Donnéeën um Backup-Späichersystem sinn ëmmer e bëssen "an der Vergaangenheet."

Virdeeler vun asynchroner Replikatioun:

  • Low-Cost Léisung (all Kommunikatiounskanäl, Optik fakultativ)
  • Keng Distanzbeschränkungen
  • Am Backupsatellitsystem verschlechtert d'Donnéeën net wann se op der Haaptsäit beschiedegt sinn (op d'mannst fir eng Zäit); wann d'Donnéeën beschiedegt ginn, kënnt Dir ëmmer d'Replica stoppen fir Datenkorruptioun am Backup-Späichersystem ze vermeiden

Muecht:

  • Daten a verschiddenen Rechenzentren sinn ëmmer net identesch

Also hänkt d'Wiel vum Replikatiounsmodus vu Geschäftsziler of. Wann et fir Iech kritesch ass datt de Backup-Datenzentrum genau déiselwecht Donnéeën enthält wéi den Haaptrechenzentrum (dh Geschäftsbedéngung fir RPO = 0), da musst Dir d'Suen ausginn an d'Limitatioune vun enger Synchron- replica. A wann d'Verspéidung am Datestaat akzeptabel ass oder et einfach keng Suen ass, da musst Dir definitiv d'asynchron Method benotzen.

Loosst eis och separat esou e Modus (méi präzis eng Topologie) als Metrocluster markéieren. Am Metrocluster Modus gëtt Synchron Replikatioun benotzt, awer, am Géigesaz zu enger regulärer Replik, erlaabt e Metrocluster béid Späichersystemer am aktive Modus ze bedreiwen. Déi. Dir hutt keng Trennung tëscht aktive a Standby-Datenzentren. D'Applikatioune funktionnéieren gläichzäiteg mat zwee Späichersystemer, déi kierperlech a verschiddenen Datenzenteren lokaliséiert sinn. Downtimes bei Accidenter an esou enger Topologie si ganz kleng (RTO, normalerweis Minutten). An dësem Artikel wäerte mir eis Implementatioun vum Metrocluster net berücksichtegen, well dëst e ganz grousst a grousst Thema ass, also wäerte mir en separaten nächsten Artikel an der Fortsetzung vun dësem widmen.

Och, ganz dacks, wa mir iwwer Replikatioun mat Späichersystemer schwätzen, hu vill Leit eng raisonnabel Fro: > "Vill Applikatiounen hunn hir eege Replikatiounsinstrumenter, firwat benotze Replikatioun op Späichersystemer? Ass et besser oder méi schlecht?

Et gëtt keng kloer Äntwert hei, also hei sinn d'Argumenter FIR a CONS:

Argumenter FIR Späicherreplikatioun:

  • Einfachheet vun der Léisung. Mat engem Tool kënnt Dir Äre ganzen Dateset replizéieren, onofhängeg vun der Laaschtart an der Uwendung. Wann Dir eng Replica vun Uwendungen benotzt, musst Dir all Applikatioun separat konfiguréieren. Wann et méi wéi 2 vun hinnen sinn, dann ass dat extrem Aarbechtsintensiv an deier (Applikatioun Replikatioun erfuerdert normalerweis eng separat an net gratis Lizenz fir all Applikatioun. Awer méi doriwwer hei ënnen).
  • Dir kënnt alles replizéieren - all Applikatioun, all Donnéeën - an et wäert ëmmer konsequent sinn. Vill (meescht) Uwendungen hunn keng Replikatiounsfäegkeeten, a Repliken aus dem Späichersystem sinn deen eenzege Wee fir Schutz vu Katastrophen ze bidden.
  • Et ass net néideg ze iwwerbezuelen fir Applikatiounsreplikatiounsfunktionalitéit. Als Regel, ass et net bëlleg, grad wéi Lizenzen fir Stockage System Replika. Mä Dir musst fir eng Lizenz fir Stockage Replikatioun eemol bezuelen, an eng Lizenz fir Applikatioun Replika muss fir all Applikatioun separat kaaft ginn. Wann et vill vun esou Applikatiounen sinn, da kascht et e schéinen Penny an d'Käschte vun Lizenzen fir Stockage Replikatioun gëtt e Tropfen am Ozean.

Argumenter GÉINT Stockage Replikatioun:

  • Replica duerch Uwendungen huet méi Funktionalitéit aus der Siicht vun den Uwendungen selwer, d'Applikatioun weess seng Donnéeën besser (natierlech), sou datt et méi Méiglechkeete gëtt fir mat hinnen ze schaffen.
  • Hiersteller vun e puer Uwendungen garantéieren net d'Konsistenz vun hiren Donnéeën wann d'Replikatioun mat Drëtt-Partei-Tools gemaach gëtt. *

* - kontrovers Dissertatioun. Zum Beispill, e bekannte DBMS Hiersteller huet fir eng ganz laang Zäit offiziell deklaréiert datt hir DBMS nëmme ka replizéiert ginn normalerweis mat hire Mëttelen, an de Rescht vun der Replikatioun (inklusiv Späichersystemer) ass "net wouer." Awer d'Liewen huet gewisen datt dëst net esou ass. Wahrscheinlech (awer dëst ass net sécher) ass dëst einfach net den éierlechste Versuch fir méi Lizenzen u Clienten ze verkafen.

Als Resultat ass an de meeschte Fäll Replikatioun vum Späichersystem besser, well Dëst ass eng méi einfach a manner deier Optioun, awer et gi komplexe Fäll wou spezifesch Applikatiounsfunktionalitéit gebraucht gëtt, an et ass néideg mat der Applikatiounsniveau Replikatioun ze schaffen.

Gemaach mat Theorie, elo Praxis

Mir konfiguréieren d'Replique an eisem Labo. A Laboratoire Konditiounen emuléiert mir zwee Daten Zentren (tatsächlech, zwee ugrenzend Racken déi an verschiddene Gebaier schéngen). De Stand besteet aus zwee Engine N2 Späichersystemer, déi mat opteschen Kabelen matenee verbonne sinn. E kierperleche Server mat Windows Server 2016 ass mat béide Späichersystemer mat 10Gb Ethernet ugeschloss. De Stand ass ganz einfach, awer dëst ännert d'Essenz net.

Schematesch gesäit et esou aus:

AERODISK Motor: Katastroph Resistenz. Deel 1

Logesch ass Replikatioun wéi follegt organiséiert:

AERODISK Motor: Katastroph Resistenz. Deel 1

Loosst eis elo d'Replikatiounsfunktionalitéit kucken, déi mir elo hunn.
Zwee Modi ginn ënnerstëtzt: asynchron a synchron. Et ass logesch datt de Synchronmodus duerch Distanz a Kommunikatiounskanal limitéiert ass. Besonnesch Synchronmodus erfuerdert d'Benotzung vu Glasfaser als Physik an 10 Gigabit Ethernet (oder méi héich).

D'ënnerstëtzt Distanz fir Synchron Replikatioun ass 40 Kilometer, de Verzögerungswäert vum optesche Kanal tëscht Datenzenteren ass bis zu 2 Millisekonnen. Am Allgemengen wäert et mat grousse Verspéidungen funktionnéieren, awer da gëtt et staark Verlängerungen während der Opnam (wat och logesch ass), also wann Dir Synchron Replikatioun tëscht Datenzenteren plangt, sollt Dir d'Qualitéit vun der Optik an d'Verzögerungen kontrolléieren.

D'Ufuerderunge fir asynchroner Replikatioun sinn net sou sérieux. Méi präzis sinn se guer net do. All Aarbecht Ethernet Verbindung wäert maachen.

De Moment ënnerstëtzt den AERODISK ENGINE Späichersystem Replikatioun fir Blockapparaten (LUNs) iwwer den Ethernet Protokoll (iwwer Kupfer oder optesch). Fir Projeten wou Replikatioun duerch e SAN Stoff iwwer Fiber Channel erfuerderlech ass, addéiere mir de Moment eng adequat Léisung, awer et ass nach net fäerdeg, also an eisem Fall nëmmen Ethernet.

Replikatioun kann tëscht all ENGINE Serie Stockage Systemer Aarbecht (N1, N2, N4) aus Junior Systemer ze eeler a Vize versa.

D'Funktionalitéit vu béide Replikatiounsmodi ass komplett identesch. Drënner sinn méi Detailer iwwer wat verfügbar ass:

  • Replikatioun "een op een" oder "een op een", dat heescht déi klassesch Versioun mat zwee Datenzenteren, den Haapt an de Backup
  • Replikatioun ass "een zu ville" oder "een op vill", d.h. eent LUN kann op e puer Stockage Systemer op eemol replizéiert ginn
  • Aktivéieren, deaktivéieren an "ëmgedréint" Replikatioun, respektiv, fir d'Richtung vun der Replikatioun z'aktivéieren, auszeschalten oder z'änneren
  • Replikatioun ass verfügbar fir béid RDG (Raid Distributed Group) an DDP (Dynamic Disk Pool) Pools. Wéi och ëmmer, LUNs vun engem RDG Pool kënnen nëmmen op eng aner RDG replizéiert ginn. Selwecht mat DDP.

Et gi vill méi kleng Features, awer et ass kee besonnesche Punkt fir se ze lëschten; mir wäerte se ernimmen wéi mir ageriicht hunn.

Replikatioun opsetzen

De Setupprozess ass ganz einfach a besteet aus dräi Etappen.

  1. Netzkonfiguratioun
  2. Stockage Setup
  3. Regelen astellen (Verbindungen) a Kartéierung

E wichtege Punkt bei der Opstellung vun der Replikatioun ass datt déi éischt zwou Etappen um Fernspeichersystem widderholl ginn, déi drëtt Stuf - nëmmen op der Haaptrei.

Astelle Ressourcen Ressourcen

Den éischte Schrëtt ass d'Netzwierk Ports ze konfiguréieren, duerch déi de Replikatiounsverkéier iwwerdroe gëtt. Fir dëst ze maachen, musst Dir d'Ports aktivéieren an hir IP Adressen an der Sektioun Front-End Adapter setzen.

Duerno musse mir e Pool (an eisem Fall RDG) an eng virtuell IP fir Replikatioun (VIP) erstellen. VIP ass eng schwiewend IP Adress déi un zwou "physesch" Adresse vu Späicherkontroller gebonnen ass (d'Ports déi mir just konfiguréiert hunn). Dëst wäert d'Haaptreplikatiounsinterface sinn. Dir kënnt och net mat engem VIP operéieren, mee mat engem VLAN, wann Dir mat markéierte Verkéier muss schaffen.

AERODISK Motor: Katastroph Resistenz. Deel 1

De Prozess fir e VIP fir eng Replica ze kreéieren ass net vill anescht wéi e VIP fir I / O (NFS, SMB, iSCSI) ze kreéieren. An dësem Fall erstellen mir e regelméisseg VIP (ouni VLAN), awer gitt sécher datt et fir Replikatioun ass (ouni dësen Indikator wäerte mir net an der nächster Schrëtt VIP op d'Regel addéieren).

AERODISK Motor: Katastroph Resistenz. Deel 1

De VIP muss am selwechte Subnet sinn wéi d'IP Ports tëscht deenen et schwëmmt.

AERODISK Motor: Katastroph Resistenz. Deel 1

Mir widderhuelen dës Astellungen op engem Fernspeichersystem, natierlech mat enger anerer IP.
VIPs vu verschiddene Späichersystemer kënnen a verschiddene Subnets sinn, den Haapt Saach ass datt et Routing tëscht hinnen ass. An eisem Fall gëtt dëst Beispill genee gewisen (192.168.3.XX an 192.168.2.XX)

AERODISK Motor: Katastroph Resistenz. Deel 1

Dëst fäerdeg d'Virbereedung vum Netzdeel.

Astelle Stockage

D'Opstellung vun der Späichere fir eng Replika ënnerscheet sech vun der normaler nëmmen an deem mir d'Mapping duerch e spezielle Menü "Replikatiounsmapping" maachen. Soss ass alles d'selwecht wéi mam normale Setup. Elo, an Uerdnung.

Am virdrun geschaf Pool R02, Dir musst eng LUN schafen. Loosst eis et erstellen an et LUN1 nennen.

AERODISK Motor: Katastroph Resistenz. Deel 1

Mir mussen och déiselwecht LUN op engem Fernspeichersystem vun der identescher Gréisst erstellen. Mir kreéieren. Fir Duercherneen ze vermeiden, ruffe mer d'Remote LUN LUN1R

AERODISK Motor: Katastroph Resistenz. Deel 1

Wa mir e LUN musse huelen, dee schonn existéiert, da musse mir beim Opbau vun der Replika dëse produktive LUN vum Host ofmontéieren, an einfach en eidelen LUN vun der identescher Gréisst am Fernspeichersystem erstellen.

De Späicheropbau ass fäerdeg, loosst eis weidergoen fir eng Replikatiounsregel ze kreéieren.

Replikatiounsregelen oder Replikatiounslinks opsetzen

Nodeems mir LUNs am Späichersystem erstallt hunn, deen am Moment de primäre wäert sinn, konfiguréiere mir d'Replikatiounsregel LUN1 um Späichersystem 1 op LUN1R um Späichersystem 2.

D'Astellung gëtt am Menü "Remote Replikatioun" gemaach

Loosst eis eng Regel erstellen. Fir dëst ze maachen, musst Dir den Empfänger vun der Replica uginn. Do setzen mir och den Numm vun der Verbindung an d'Aart vun der Replikatioun (synchron oder asynchron).

AERODISK Motor: Katastroph Resistenz. Deel 1

Am Feld "Fernsystemer" addéiere mir eise Späichersystem2. Fir ze addéieren, musst Dir d'Verwaltung IP-Späichersystemer (MGR) benotzen an den Numm vum Fern-LUN, an deem mir Replikatioun ausféieren (an eisem Fall, LUN1R). Kontroll IPs sinn nëmme gebraucht an der Bühn vun der Verbindung; Replikatiounsverkéier gëtt net duerch si iwwerdroen; de virdru konfiguréierte VIP gëtt dofir benotzt.

Schonn op dëser Etapp kënne mir méi wéi ee Fernsystem fir d'"One to Many" Topologie derbäi ginn: klickt op de "Add Node" Knäppchen, wéi an der Figur hei drënner.

AERODISK Motor: Katastroph Resistenz. Deel 1

An eisem Fall gëtt et nëmmen ee Fernsystem, sou datt mir eis dozou limitéieren.

D'Regel ass prett. Maacht weg datt et automatesch op all Replikatiounsparticipanten bäigefüügt gëtt (an eisem Fall sinn et zwee vun hinnen). Dir kënnt esou vill Reegelen erstellen wéi Dir wëllt, fir all Zuel vu LUNen an all Richtung. Zum Beispill, fir d'Laascht ze balanséieren, kënne mir en Deel vun de LUNs vum Späichersystem 1 op de Späichersystem 2 replizéieren, an den aneren Deel, am Géigendeel, vum Späichersystem 2 op de Späichersystem 1.

Stockage System 1. Direkt no der Schafung huet d'Synchroniséierung ugefaang.

AERODISK Motor: Katastroph Resistenz. Deel 1

Stockage System 2. Mir gesinn déi selwecht Regel, awer d'Synchroniséierung ass scho eriwwer.

AERODISK Motor: Katastroph Resistenz. Deel 1

LUN1 op Stockage System 1 ass an der Primärschoul Roll, dat ass, et ass aktiv. LUN1R um Späichersystem 2 ass an der Roll vum Secondaire, dat heescht, et ass am Standby am Fall wou de Späichersystem 1 fällt.
Elo kënne mir eise LUN mam Host verbannen.

Mir wäerten via iSCSI konnektéieren, obwuel et kann och via FC gemaach ginn. Mapping iwwer iSCSI LUN an enger Replik opzestellen ass praktesch net anescht wéi den übleche Szenario, also wäerte mir dëst net am Detail hei betruechten. Wann eppes ass, gëtt dëse Prozess am Artikel beschriwwen "Quick Ariichten".

Deen eenzegen Ënnerscheed ass datt mir Mapping am Menü "Replication Mapping" erstellen

AERODISK Motor: Katastroph Resistenz. Deel 1

Mir hunn d'Mapping opgestallt an de LUN dem Host ginn. De Host huet de LUN gesinn.

AERODISK Motor: Katastroph Resistenz. Deel 1

Mir formatéieren et an e lokale Dateiesystem.

AERODISK Motor: Katastroph Resistenz. Deel 1

Dat ass et, de Setup ass fäerdeg. Tester kommen nächst.

Testen

Mir wäerten dräi Haaptszenarie testen.

  1. Regelméisseg Rollewiessel Secondaire> Primär. Regelméisseg Rollewiessel ass néideg am Fall, zum Beispill, mir mussen e puer präventiv Operatiounen am Haaptrechenzentrum ausféieren a während dëser Zäit, fir datt d'Donnéeën verfügbar sinn, transferéiere mir d'Laascht an de Backup-Datenzentrum.
  2. Emergency Roll Switching Secondary> Primär (Datenzentrum Echec). Dëst ass den Haaptszenario fir deen d'Replikatioun existéiert, wat hëllefe kann e komplette Datenzenterfehler ze iwwerliewen ouni d'Firma fir eng laang Zäit ze stoppen.
  3. Decompte vun Kommunikatioun Channels tëscht Daten Zentren. Iwwerpréift dat richtegt Verhalen vun zwee Späichersystemer ënner Bedingungen, wou aus iergendengem Grond de Kommunikatiounskanal tëscht den Datenzenteren net verfügbar ass (zum Beispill e Bagger op der falscher Plaz gegruewen an d'donkel Optik gebrach huet).

Als éischt wäerte mir ufänken Daten op eis LUN ze schreiwen (Schreiwen Dateien mat zoufälleg Daten). Mir gesinn direkt datt de Kommunikatiounskanal tëscht de Späichersystemer benotzt gëtt. Dëst ass einfach ze verstoen wann Dir d'Laascht Iwwerwaachung vun den Ports opmaacht déi fir Replikatioun verantwortlech sinn.

AERODISK Motor: Katastroph Resistenz. Deel 1

Béid Späichersystemer hunn elo "nëtzlech" Donnéeën, mir kënnen den Test starten.

AERODISK Motor: Katastroph Resistenz. Deel 1

Just am Fall, loosst eis d'Hash-Zomme vun engem vun de Dateien kucken a se opschreiwen.

AERODISK Motor: Katastroph Resistenz. Deel 1

Regelméisseg Roll Wiessel

D'Operatioun vu Rollen ze wiesselen (d'Richtung vun der Replikatioun z'änneren) ka mat all Späichersystem gemaach ginn, awer Dir musst nach ëmmer op béid goen, well Dir musst d'Mapping op Primär auszeschalten, an et op Secondaire aktivéieren (wat Primär gëtt ).

Vläicht stellt sech elo eng raisonnabel Fro: Firwat dat net automatiséieren? D'Äntwert ass: et ass einfach, Replikatioun ass en einfacht Mëttel fir Katastrophenwidderstandsfäegkeet, baséiert eleng op manuell Operatiounen. Fir dës Operatiounen ze automatiséieren, gëtt et e Metrocluster Modus; et ass voll automatiséiert, awer seng Konfiguratioun ass vill méi komplizéiert. Mir schreiwen iwwer d'Opstellung vun engem Metrocluster am nächsten Artikel.

Am Haaptspeichersystem deaktivéiere mir d'Mapping fir sécherzestellen datt d'Opnahm stoppt.

AERODISK Motor: Katastroph Resistenz. Deel 1

Dann op ee vun de Späichersystemer (et ass egal, op der Haapt- oder Backup) am Menü "Remote Replikatioun" wielt eis Verbindung REPL1 a klickt op "Roll änneren".

AERODISK Motor: Katastroph Resistenz. Deel 1

No e puer Sekonnen, LUN1R (Backup Stockage System) gëtt Primärschoul.

AERODISK Motor: Katastroph Resistenz. Deel 1

Mir kartéieren LUN1R mat Späichersystem2.

AERODISK Motor: Katastroph Resistenz. Deel 1

Duerno gëtt eisen E: Drive automatesch un den Host befestegt, nëmmen dës Kéier ass et vum LUN1R "ukomm".

Just am Fall, mir vergläichen d'Hash Zommen.

AERODISK Motor: Katastroph Resistenz. Deel 1

Identesch. Test passéiert.

Failover. Datenzenter Echec

Am Moment ass den Haaptspeichersystem nom reguläre Wiessel de Späichersystem 2 respektiv LUN1R. Fir en Accident ze emuléieren, wäerte mir d'Kraaft op béide Späicherkontroller ausschalten2.
Et gëtt keen Zougang méi dozou.

Loosst d'gesinn wat op Stockage System geschitt 1 (de Backupsatellit am Moment).

AERODISK Motor: Katastroph Resistenz. Deel 1

Mir gesinn datt de Primär LUN (LUN1R) net verfügbar ass. Eng Fehlermeldung erschéngt an de Logbicher, am Informatiounspanel, an och an der Replikatiounsregel selwer. Deementspriechend sinn d'Donnéeë vum Host momentan net verfügbar.

Ännert d'Roll vum LUN1 op Primär.

AERODISK Motor: Katastroph Resistenz. Deel 1

Ech maachen Kartéierung zum Host.

AERODISK Motor: Katastroph Resistenz. Deel 1

Vergewëssert Iech datt Drive E am Host erschéngt.

AERODISK Motor: Katastroph Resistenz. Deel 1

Mir kontrolléieren den Hash.

AERODISK Motor: Katastroph Resistenz. Deel 1

Alles ass gutt. De Späichersystem huet de Fall vum Rechenzentrum erfollegräich iwwerlieft, deen aktiv war. Déi geschätzte Zäit déi mir verbruecht hunn d'Replikatioun "Reversal" ze verbannen an de LUN aus dem Backup-Datenzentrum ze verbannen war ongeféier 3 Minutten. Et ass kloer datt an der realer Produktioun alles vill méi komplizéiert ass, an zousätzlech zu Aktiounen mat Späichersystemer musst Dir vill méi Operatiounen am Netz, op Hosten, an Uwendungen ausféieren. An am Liewen wäert dës Zäit vill méi laang sinn.

Hei géif ech gär schreiwen datt alles, den Test erfollegräich ofgeschloss ass, awer loosst eis net presséieren. Den Haaptspeichersystem ass "léien", mir wëssen datt wann et "gefall ass", war et an der Primärroll. Wat geschitt wann et op eemol ageschalt ass? Et ginn zwou Primärrollen, wat gläicht Datekorruptioun? Loosst eis et elo kucken.
Loosst eis op eemol den ënnerierdesche Späichersystem ausschalten.

Et lued fir e puer Minutten an dann zréck op Service no enger kuerzer Synchroniséierung, mä an der Roll vun Secondaire.

AERODISK Motor: Katastroph Resistenz. Deel 1

Alles OK. Split-Gehir ass net geschitt. Mir hunn iwwer dëst geduecht, an ëmmer no engem Fall geet de Späichersystem op d'Roll vum Secondaire erop, egal wéi eng Roll et am "während Liewen" war. Elo kënne mir sécher soen datt den Datenzenter Echec Test erfollegräich war.

Feeler vun Kommunikatioun Channels tëscht Daten Zentren

D'Haaptaufgab vun dësem Test ass sécher ze stellen datt de Späichersystem net komesch ufänkt wann et temporär Kommunikatiounskanäl tëscht zwee Späichersystemer verléiert an dann erëm erschéngt.
Also. Mir trennen d'Drähten tëscht de Späichersystemer (loosst eis virstellen datt se vun engem Bagger gegruewen goufen).

Op Primär gesi mir datt et keng Verbindung mam Secondaire gëtt.

AERODISK Motor: Katastroph Resistenz. Deel 1

Um Secondaire gesi mir datt et keng Verbindung mam Primär ass.

AERODISK Motor: Katastroph Resistenz. Deel 1

Alles funktionnéiert gutt, a mir schreiwen weider Daten an den Haaptspeichersystem, dat heescht, si si garantéiert anescht wéi de Backup, dat heescht, si hunn "getrennt".

An e puer Minutten "reparéieren" mir de Kommunikatiounskanal. Soubal d'Späichersystemer sech gesinn, gëtt d'Datesynchroniséierung automatesch aktivéiert. Hei ass näischt vum Administrateur verlaangt.

AERODISK Motor: Katastroph Resistenz. Deel 1

No enger Zäit ass d'Synchroniséierung fäerdeg.

AERODISK Motor: Katastroph Resistenz. Deel 1

D'Verbindung gouf restauréiert, de Verloscht vu Kommunikatiounskanäl huet keng Noutsituatioun verursaacht, an nom Uschalten ass d'Synchroniséierung automatesch stattfonnt.

Conclusiounen

Mir hunn d'Theorie analyséiert - wat ass néideg a firwat, wou sinn d'Virdeeler a wou sinn d'Nodeeler. Duerno setze mir synchron Replikatioun tëscht zwee Späichersystemer op.

Als nächst goufen Basistester fir normal Schaltung, Datenzenterfehler a Kommunikatiounskanalfehler duerchgefouert. An alle Fäll huet de Späichersystem gutt geschafft. Et gëtt keen Dateverloscht an administrativ Operatioune ginn op e Minimum gehal fir e manuelle Szenario.

D'nächst Kéier wäerte mir d'Situatioun komplizéiere a weisen wéi all dës Logik an engem automatiséierte Metrocluster am aktive-aktive Modus funktionnéiert, dat heescht wann béid Späichersystemer primär sinn, an d'Verhalen am Fall vu Späichersystemfehler voll automatiséiert ass.

Schreift w.e.g. Kommentarer, mir wäerte frou sinn eng gutt Kritik a praktesch Berodung ze kréien.

Bis déi nächste Kéier.

Source: will.com

Setzt e Commentaire