Verdeelt DBMS fir d'Entreprise

De CAP-Theorem ass den Ecksteen vun der verdeelt Systemtheorie. Natierlech hĂ«lt d'Kontrovers ronderĂ«m net of: d'Definitioune dra sinn net kanonesch, an et gĂ«tt kee strikte Beweis ... Trotzdem, fest op d'Positioune vum alldeegleche gesonde MĂ«nscheverstandℱ, verstinn mir intuitiv datt den Theorem wouer ass.

Verdeelt DBMS fir d'Entreprise

Dat eenzegt wat net evident ass ass d'Bedeitung vum BrĂ©if "P". Wann de StĂ€rekoup opgedeelt ass, entscheet et ob net ze reagĂ©ieren bis e Quorum erreecht ass, oder d'DonnĂ©eĂ«n zrĂ©ckzeginn dĂ©i verfĂŒgbar sinn. OfhĂ€ngeg vun de Resultater vun dĂ«ser Wiel gĂ«tt de System entweder als CP oder als AP klassĂ©iert. Cassandra, zum Beispill, kann entweder ManĂ©ier behuelen, ofhĂ€ngeg net emol op de StĂ€rekoup Astellunge, mĂ€ op d'Parameteren vun all spezifesch Ufro. Awer wann de System net "P" ass an et trennt, wat dann?

D'Äntwert op dĂ«s Fro ass e bĂ«ssen onerwaart: e CA Cluster kann net opgedeelt ginn.
Wéi eng Cluster ass dëst deen net opdeelt?

E wesentlecht Attribut vun esou engem Cluster ass e gemeinsamt Datespeichersystem. An de meeschte FĂ€ll bedeit dat eng Verbindung iwwer e SAN, wat d'Benotzung vu CA-LĂ©isunge limitĂ©iert op grouss Entreprisen, dĂ©i fĂ€eg sinn, eng SAN-Infrastruktur ze verwalten. Fir datt verschidde Serveren Fir mat deene selwechten DonnĂ©eĂ«n ze schaffen, ass e Cluster-Dateisystem noutwendeg. Sou Dateisystemer sinn an de Portfolioen vun HPE (CFS), Veritas (VxCFS) an IBM (GPFS) verfĂŒgbar.

Oracle RAC

D'Optioun "Real Application Cluster" ass fir d'éischt am Joer 2001 mat der Verëffentlechung vun Oracle 9i opgetrueden. An esou engem Cluster kënnen e puer Instanzen ... Server mat der selwechter Datebank schaffen.
Oracle ka souwuel mat engem clusteréierte Dateiesystem wéi och mat senger eegener Léisung schaffen - ASM, Automatic Storage Management.

All Kopie hÀlt sÀin eegene Journal. D'Transaktioun gëtt duerch eng Instanz ausgefouert an engagéiert. Wann eng Instanz feelt, liest ee vun den iwwerliewende Clusternoden (Instanzen) sÀi Log a restauréiert déi verluer Donnéeën - doduerch d'Disponibilitéit garantéiert.

All Instanzen erhalen hiren eegene Cache, an déiselwecht SÀiten (Blöcke) kënnen an de Cache vu méi Instanzen zur selwechter ZÀit sinn. Ausserdeem, wann eng Instanz eng SÀit brauch an et ass am Cache vun enger anerer Instanz, kann se se vu sengem Noper kréien mat dem Cache Fusiounsmechanismus anstatt vun der Disk ze liesen.

Verdeelt DBMS fir d'Entreprise

Awer wat geschitt wann ee vun den Instanzen Daten muss Ànneren?

D'Besonderheet vum Oracle ass datt et keen dedizéierten Sperrservice huet: wann de Server eng Zeil spÀre wëllt, da gëtt de SpÀrrekord direkt op d'ErënnerungssÀit plazéiert wou déi gespaarten Zeil lÀit. Dank dëser Approche ass Oracle de Performance-Champion tëscht monolitheschen Datenbanken: de Sperrservice gëtt ni e Flaschenhals. Awer an enger Clusterkonfiguratioun kann sou eng Architektur zu intensiven Netzwierkverkéier an Deadlocks féieren.

Wann e Rekord gespaart ass, informĂ©iert eng Instanz all aner Instanzen datt d'SĂ€it dĂ©i dee Rekord spĂ€ichert en exklusive Empfang huet. Wann eng aner Instanz e Rekord op der selwechter SĂ€it muss Ă€nneren, muss et waarden bis d'Ännerunge vun der SĂ€it engagĂ©iert sinn, dat heescht, d'Ännerungsinformatioun gĂ«tt an e Journal op Disk geschriwwe (an d'Transaktioun ka weidergoen). Et kann och geschĂ©ien datt eng SĂ€it sequenziell duerch e puer Exemplare geĂ€nnert gĂ«tt, an dann wann Dir d'SĂ€it op Disk schreift, musst Dir erausfannen wien dĂ©i aktuell Versioun vun dĂ«ser SĂ€it spĂ€ichert.

ZoufÀlleg Aktualiséierung vun der selwechter SÀiten iwwer verschidden RAC Wirbelen verursaacht d'Datebankleistung dramatesch ze falen, op de Punkt wou d'Clusterleistung méi niddereg ka sinn wéi déi vun enger eenzeger Instanz.

Déi korrekt Notzung vum Oracle RAC ass d'Donnéeën kierperlech ze partitionéieren (zum Beispill mat engem partitionéierten Dëschmechanismus) an Zougang zu all Set vu Partitionen duerch en dedizéierten Node. Den Haaptzweck vum RAC war net horizontal Skaléieren, mee d'Feeltoleranz ze garantéieren.

Wann e Node ophÀlt op en HÀerzschlag ze reagéieren, da fÀnkt de Node deen et fir d'éischt eng Ofstëmmungsprozedur op der Disk un. Wann de fehlend Node net hei bemierkt ass, dann iwwerhëlt ee vun den Noden d'Verantwortung fir d'Datenerhuelung:

  • "afrĂ©iert" all SĂ€iten dĂ©i am Cache vum fehlenden Node waren;
  • liest d'Logbicher (Redo) vum fehlenden Node an applizĂ©iert d'Ännerungen, dĂ©i an dĂ«se Logbicher opgeholl goufen, glĂ€ichzĂ€iteg iwwerprĂ©ift ob aner Noden mĂ©i rezent Versioune vun de SĂ€iten hunn, dĂ©i geĂ€nnert ginn;
  • rullt zrĂ©ck op Transaktiounen.

Fir de Wiessel tëscht Noden ze vereinfachen, huet Oracle d'Konzept vun engem Service - eng virtuell Instanz. Eng Instanz kann verschidde Servicer déngen, an e Service kann tëscht Noden réckelen. Eng Applikatioun Instanz, déi e bestëmmten Deel vun der Datebank servéiert (zum Beispill, e Grupp vu Clienten) funktionnéiert mat engem Service, an de Service verantwortlech fir dësen Deel vun der Datebank bewegt sech op en aneren Node wann e Node feelt.

IBM Pure Data Systemer fir Transaktiounen

Eng ClusterlĂ©isung fir DBMS erschĂ©ngt am Blue Giant Portfolio am Joer 2009. Ideologesch ass et den Nofolger vum Parallel Sysplex StĂ€rekoup, gebaut op "regelmĂ©isseg" AusrĂŒstung. Am 2009 gouf DB2 pureScale als Software Suite verĂ«ffentlecht, an 2012 huet IBM en Apparat genannt Pure Data Systems for Transactions ugebueden. Et sollt net mat Pure Data Systems for Analytics verwiesselt ginn, wat nĂ€ischt mĂ©i ass wĂ©i en Ă«mbenannt Netezza.

Op den éischte Bléck ass d'pureScale-Architektur Àhnlech wéi d'Oracle RAC: op déiselwecht Manéier si verschidde Wirbelen mat engem gemeinsamen Datelagerungssystem verbonnen, an all Node leeft seng eege DBMS-Instanz mat hiren eegene GedÀchtnisberÀicher an Transaktiounsprotokoller. Awer, am Géigesaz zu Oracle, huet DB2 en dedizéierten Sperrservice representéiert duerch eng Rei vun db2LLM * Prozesser. An enger Clusterkonfiguratioun gëtt dëse Service op engem getrennten Node gesat, deen Kupplungsanlag (CF) am Parallel Sysplex genannt gëtt, an PowerHA an Pure Data.

PowerHA bitt déi folgend Servicer:

  • SpĂ€r Manager;
  • globale Puffer Cache;
  • Gebitt vun der Interprozesskommunikatioun.

Fir Daten aus PowerHA op d'Datebanknoden an zréck ze transferéieren, gëtt Remote Memory Access benotzt, sou datt de Cluster Interconnect den RDMA Protokoll ënnerstëtzen. PureScale ka souwuel Infiniband wéi och RDMA iwwer Ethernet benotzen.

Verdeelt DBMS fir d'Entreprise

Wann e Node eng SÀit brauch, an dës SÀit ass net am Cache, da freet de Node d'SÀit am globalen Cache, an nëmmen wann et net do ass, liest se vun der Disk. Am Géigesaz zu Oracle geet d'Ufro nëmmen un PowerHA, an net op Nopeschnoden.

Wann eng Instanz eng Zeil Ànnere wÀert, gespaart se am exklusive Modus, an d'SÀit wou d'Zeil am gemeinsame Modus lÀit. All Schleisen sinn am globale SpÀr Manager registréiert. Wann d'Transaktioun ofgeschloss ass, schéckt de Node e Message un de Sperrmanager, deen déi geÀnnert SÀit an de globale Cache kopéiert, d'SpÀren verëffentlecht an déi geÀnnert SÀit an de Cache vun aneren Noden ongëlteg mécht.

Wann d'SĂ€it an dĂ€r dĂ©i geĂ€nnert Zeil lĂ€it scho gespaart ass, da liest de SpĂ€rmanager dĂ©i geĂ€nnert SĂ€it aus der ErĂ«nnerung vum Node, deen d'Ännerung gemaach huet, de Sperre befreit, dĂ©i geĂ€nnert SĂ€it an de Cache vun anere Wirbelen ongĂ«lteg maachen, an gitt d'SĂ€itschloss un den Node deen et gefrot huet.

"Dirty", dat heescht geÀnnert, SÀiten kënnen op Scheif geschriwwe ginn souwuel vun engem normale Node wéi och vu PowerHA (castout).

Wann ee vun de pureScale Noden feelt, ass d'Erhuelung limitéiert op nëmmen déi Transaktiounen, déi nach net am Moment vum Echec ofgeschloss goufen: d'SÀiten, déi vun deem Node an ofgeschlossene Transaktioune geÀnnert goufen, sinn am globalen Cache op PowerHA. De Node restarts an enger reduzéierter Konfiguratioun op engem vun de Serveren am StÀrekoup, rullt pendend Transaktiounen zréck a verëffentlecht SpÀren.

PowerHA leeft op zwee Serveren an de Master Node replizéiert sÀin Zoustand synchron. Wann de primÀre PowerHA Node feelt, fiert de Cluster weider mam Backup Node.
Natierlech, wann Dir Zougang zu den Dateset duerch en eenzegen Node kritt, wÀert d'Gesamtleeschtung vum Cluster méi héich sinn. PureScale ka souguer bemierken datt e bestëmmte Gebitt vun Daten vun engem Node veraarbecht gëtt, an da ginn all SpÀren am Zesummenhang mat deem Gebitt lokal vum Node veraarbecht ouni mat PowerHA ze kommunizéieren. Awer soubal d'Applikatioun probéiert dës Donnéeën duerch en aneren Node ze kréien, gëtt d'zentraliséiert SpÀrveraarbechtung erëm op.

IBM's intern Tester op enger Aarbechtslaascht vun 90% Liesen an 10% Schreiwen, wat ganz Àhnlech wéi real-Welt Produktiounsaarbechtslaascht ass, weisen bal linear Skala bis zu 128 Noden. Testbedéngungen, leider, ginn net bekanntginn.

HPE NonStop SQL

Den Hewlett-Packard Enterprise Portfolio huet och seng eege hĂ©ich verfĂŒgbar Plattform. DĂ«st ass d'NonStop Plattform, dĂ©i am Joer 1976 vun Tandem Computers op de Maart verĂ«ffentlecht gouf. Am Joer 1997 gouf d'Firma vum Compaq kaaft, deen am Joer 2002 mat Hewlett-Packard fusionĂ©iert huet.

NonStop gĂ«tt benotzt fir kritesch Uwendungen ze bauen - zum Beispill HLR oder Bankkaartveraarbechtung. D'Plattform gĂ«tt a Form vun engem Software- an Hardwarekomplex (Apparat) geliwwert, deen Informatiknoden, en Datelagerungssystem a KommunikatiounsausrĂŒstung enthĂ€lt. De ServerNet Netzwierk (a modernen Systemer - Infiniband) dĂ©ngt souwuel fir den Austausch tĂ«scht Wirbelen a fir Zougang zum Datelagerungssystem.

Fréier Versioune vum System hunn propriétaire Prozessoren benotzt, déi matenee synchroniséiert goufen: all Operatioune goufen synchron vu verschiddene Prozessoren duerchgefouert, a soubal ee vun de Prozessoren e Feeler gemaach huet, gouf et ausgeschalt, an déi zweet huet weider geschafft. Méi spéit ass de System op konventionell Prozessoren gewiesselt (éischt MIPS, duerno Itanium a schliisslech x86), an aner Mechanismen hunn ugefaang fir d'Synchroniséierung ze benotzen:

  • Messagen: all Systemprozess huet e "Schatten" Zwilling, un deen den aktive Prozess periodesch Messagen iwwer sĂ€i Status schĂ©ckt; wann den Haaptprozess klappt, fĂ€nkt de Schattenprozess un ze schaffen aus dem Moment, deen duerch de leschte Message bestĂ«mmt gĂ«tt;
  • OfstĂ«mmung: de SpĂ€ichersystem huet e speziellen Hardwarekomponent, deen e puer identesch Zougang akzeptĂ©iert an se nĂ«mmen ausfĂ©iert wann d'ZougĂ€ng passen; Amplaz vu kierperlecher SynchronisĂ©ierung funktionnĂ©ieren d'Prozessoren asynchron, an d'Resultater vun hirer Aarbecht ginn nĂ«mme bei I / O Momenter verglach.

Zënter 1987 leeft eng relational DBMS op der NonStop Plattform - éischt SQL/MP, a spéider SQL/MX.

DĂ©i ganz Datebank ass an Deeler opgedeelt, an all Deel ass verantwortlech fir sĂ€in eegenen Data Access Manager (DAM) Prozess. Et bitt Datenopnam, Caching a Sperrmechanismus. D'Dateveraarbechtung gĂ«tt duerch Executor Server Prozesser duerchgefouert, dĂ©i op dĂ©iselwecht Noden lafen wĂ©i dĂ©i entspriechend Datemanager. De SQL / MX Scheduler deelt Aufgaben tĂ«scht Exekutoren an aggregĂ©iert d'Resultater. Wann et nĂ©ideg ass ausgemaach Ännerungen ze maachen, gĂ«tt den Zwee-Phase Verpflichtungsprotokoll zur VerfĂŒgung gestallt vun der TMF (Transaction Management Facility) BibliothĂ©ik benotzt.

Verdeelt DBMS fir d'Entreprise

NonStop SQL kann Prozesser prioritÀr maachen sou datt laang analytesch Ufroen net mat der Transaktiounsausféierung stéieren. Wéi och ëmmer, sÀin Zweck ass prÀzis d'Veraarbechtung vu kuerzen Transaktiounen, an net d'Analyse. Den Entwéckler garantéiert d'Disponibilitéit vum NonStop-Cluster um Niveau vu fënnef "néng", dat heescht, d'Downtime ass nëmme 5 Minutten pro Joer.

SAP-HANA

Déi éischt stabil Verëffentlechung vum HANA DBMS (1.0) ass am November 2010 stattfonnt, an de SAP ERP Package ass am Mee 2013 op HANA gewiesselt. D'Plattform baséiert op kaaft Technologien: TREX Sichmotor (Sich a Kolumnlager), P*TIME DBMS a MAX DB.

D'Wuert "HANA" selwer ass en Akronym, High Performance Analytical Appliance. DĂ«s DBMS gĂ«tt a Form vu Code geliwwert, deen op all x86 Server kann lafen, awer industriell Installatiounen sinn nĂ«mmen op zertifizĂ©ierter AusrĂŒstung erlaabt. LĂ©isunge verfĂŒgbar vun HP, Lenovo, Cisco, Dell, Fujitsu, Hitachi, NEC. E puer Lenovo Konfiguratiounen erlaben souguer Operatioun ouni SAN - d'Roll vun engem gemeinsame SpĂ€ichersystem gĂ«tt vun engem GPFS-Cluster op lokalen Disken gespillt.

Am Géigesaz zu den uewe genannte Plattformen ass HANA en In-Memory DBMS, dh dat primÀr Datebild gëtt am RAM gespÀichert, an nëmme Logbicher a periodesch Schnappschëss ginn op Disk geschriwwe fir Erhuelung am Fall vun enger Katastroph.

Verdeelt DBMS fir d'Entreprise

All HANA Cluster Node ass verantwortlech fir sÀin eegenen Deel vun den Donnéeën, an d'Datekaart gëtt an engem speziellen Komponent gespÀichert - Numm Server, um Koordinator Node. Daten ginn net tëscht Noden duplizéiert. SpÀrinformatioun gëtt och op all Node gespÀichert, awer de System huet e globalen Deadlock Detektor.

Wann en HANA Client un e StÀrekoup verbënnt, luet se seng Topologie erof a kann dann op all Node direkt zougrÀifen, jee no wéi enge Daten et brauch. Wann eng Transaktioun d'Donnéeën vun engem eenzegen Node beaflosst, da kann se lokal vun deem Node ausgefouert ginn, awer wann d'Date vu verschiddenen Noden Ànnert, kontaktéiert den initiéierende Node de Koordinator Node, deen déi verdeelt Transaktioun opmaacht a koordinéiert, engagéiert se mat engem optimiséiert Zwee-Phase Verpflichtungsprotokoll.

De Koordinator Node gëtt duplizéiert, also wann de Koordinator fÀllt, iwwerhëlt de Backup Node direkt. Awer wann en Node mat Daten feelt, dann ass deen eenzege Wee fir op seng Donnéeën ze kommen, den Node nei ze starten. In der Regel behalen HANA Cluster e Ersatzserver fir e verluerene Node sou séier wéi méiglech opzemaachen.

Source: will.com

Kaaft zouverlĂ€sseg Hosting fir Site mat DDoS Schutz, VPS VDS Server đŸ”„ Kaaft zouverlĂ©issegt WebsĂ€ithosting mat DDoS-Schutz, VPS VDS Server | ProHoster