Das Thema Fehlertoleranz in Datenspeichersystemen ist immer relevant, da Speichersysteme in unserem Zeitalter der weit verbreiteten Virtualisierung und Konsolidierung von Ressourcen das Bindeglied sind, dessen Ausfall nicht nur zu einem gewöhnlichen Unfall, sondern zu langfristigen Ausfallzeiten von Diensten fĂŒhrt. Daher enthalten moderne Speichersysteme viele doppelte Komponenten (sogar Controller). Aber reicht ein solcher Schutz aus?

Absolut alle Anbieter erwĂ€hnen bei der Auflistung der Eigenschaften von Speichersystemen stets die hohe Fehlertoleranz ihrer Lösungen und fĂŒgen stets den Begriff âohne Single Point of Failureâ hinzu. Schauen wir uns ein typisches Speichersystem genauer an. Um Ausfallzeiten bei der Wartung zu vermeiden, dupliziert das Speichersystem Netzteile, KĂŒhlmodule, Ein-/AusgabeanschlĂŒsse, Laufwerke (wir meinen RAID) und natĂŒrlich Controller. Wenn Sie sich diese Architektur genau ansehen, werden Sie mindestens zwei potenzielle Fehlerquellen bemerken, die bescheiden verschwiegen werden:
- VerfĂŒgbarkeit einer einzelnen Backplane
- Eine Kopie der Daten haben
Die Backplane ist ein technisch komplexes GerĂ€t, das wĂ€hrend der Produktion ernsthaften Tests unterzogen werden muss. Und deshalb gibt es Ă€uĂerst seltene FĂ€lle, in denen es völlig fehlschlĂ€gt. Aber auch bei Teilproblemen, wie etwa einem nicht funktionierenden Laufwerkssteckplatz, ist ein Austausch mit einer kompletten Abschaltung des Speichersystems erforderlich.
Auch das Erstellen mehrerer Kopien von Daten ist auf den ersten Blick kein Problem. Weit verbreitet ist beispielsweise die Clone-FunktionalitĂ€t in Speichersystemen, die es ermöglicht, in bestimmten AbstĂ€nden eine vollstĂ€ndige Kopie der Daten zu aktualisieren. Bei Problemen mit der gleichen Wiedergabe ist die Kopie jedoch genauso wenig verfĂŒgbar wie das Original.
Eine völlig naheliegende Lösung zur Behebung dieser MĂ€ngel ist die Replikation auf ein anderes Speichersystem. Wenn wir unsere Augen vor der erwarteten Verdoppelung der Hardwarekosten verschlieĂen (wir gehen immer noch davon aus, dass Menschen, die sich fĂŒr eine solche Entscheidung entscheiden, angemessen nachdenken und diese Tatsache im Voraus akzeptieren), fallen möglicherweise noch zusĂ€tzliche Kosten fĂŒr die Organisation der Replikation in Form von Lizenzen an Software und Hardware. Und am wichtigsten ist, dass Sie irgendwie die Konsistenz der replizierten Daten sicherstellen mĂŒssen. Diese. Erstellen Sie einen Speichervirtualisierung/vSAN/etc., was ebenfalls Geld und Zeitressourcen erfordert.
Bei der Erstellung unserer HochverfĂŒgbarkeitssysteme haben wir uns zum Ziel gesetzt, die oben genannten MĂ€ngel zu beseitigen. So entstand die Interpretation der Shared Nothing-Technologie, die frei ĂŒbersetzt âohne Nutzung gemeinsam genutzter GerĂ€teâ bedeutet.
Konzept Architektur stellt die Verwendung von zwei unabhĂ€ngigen Knoten (Controllern) dar, von denen jeder ĂŒber einen eigenen Datensatz verfĂŒgt. Die synchrone Replikation erfolgt zwischen Knoten ĂŒber die InfiniBand 56G-Schnittstelle, völlig transparent fĂŒr die Software, die auf dem Speichersystem lĂ€uft. Dadurch ist der Einsatz von Speichervirtualisierungen, Softwareagenten etc. nicht erforderlich.
Physikalisch kann die Zwei-Knoten-Lösung von AccelStor in zwei Modellen implementiert werden:
- â basierend auf Twin-Servern in einem 2U-GehĂ€use, wenn moderate Leistung und KapazitĂ€t bis zu 22 TB erforderlich sind;
- â basierend auf einzelnen 2U-Servern, wenn hohe Leistung und groĂe KapazitĂ€t (bis zu 57 TB) erforderlich sind.

Modell H510 basierend auf Twin-Server

Modell H710 basierend auf einzelnen Servern
Die Verwendung unterschiedlicher Formfaktoren ist darauf zurĂŒckzufĂŒhren, dass eine unterschiedliche Anzahl von SSDs erforderlich ist, um ein bestimmtes Volumen und eine bestimmte Leistung zu erreichen. AuĂerdem ist die Twin-Plattform gĂŒnstiger und ermöglicht es Ihnen, gĂŒnstigere Lösungen anzubieten, allerdings mit einem bedingten âNachteilâ in Form einer einzelnen Backplane. Alles andere, auch die Funktionsweise, ist bei beiden Modellen völlig identisch.
Der Datensatz fĂŒr jeden Knoten besteht aus zwei Gruppen , plus 2 Ersatzlaufwerke. Jede Gruppe kann den Ausfall einer SSD ĂŒberstehen. Alle eingehenden Anfragen zur Aufnahme eines Knotens gem FlexiRemap baut 4-KB-Blöcke in sequentielle Ketten um, die dann im fĂŒr sie bequemsten Modus (sequentielle Aufzeichnung) auf die SSD geschrieben werden. DarĂŒber hinaus erhĂ€lt der Host eine AufzeichnungsbestĂ€tigung erst, nachdem die Daten physisch auf der SSD abgelegt wurden, d. h. ohne Caching im RAM. Das Ergebnis ist eine beeindruckende Leistung von bis zu 600 IOPS beim Schreiben und ĂŒber 1 Mio. IOPS beim Lesen (Modell H710).
Wie bereits erwĂ€hnt, werden DatensĂ€tze in Echtzeit ĂŒber die InfiniBand 56G-Schnittstelle synchronisiert, die einen hohen Durchsatz und eine geringe Latenz aufweist. Um den Kommunikationskanal bei der Ăbertragung kleiner Pakete möglichst effizient zu nutzen. Weil Es gibt nur einen Kommunikationskanal; eine dedizierte 1-GbE-Verbindung wird fĂŒr die zusĂ€tzliche Herzfrequenzmessung verwendet. Es wird nur der Herzschlag ĂŒbertragen, daher gibt es keine Anforderungen an die Geschwindigkeitseigenschaften.
Im Falle einer Erhöhung der SystemkapazitĂ€t (bis zu 400+TB) aufgrund von Sie sind auĂerdem paarweise miteinander verbunden, um das Konzept âKein einziger Fehlerpunktâ aufrechtzuerhalten.
FĂŒr zusĂ€tzlichen Datenschutz (zusĂ€tzlich zu der Tatsache, dass AccelStor bereits ĂŒber zwei Kopien verfĂŒgt) wird ein spezieller Verhaltensalgorithmus bei Ausfall einer SSD verwendet. Wenn die SSD ausfĂ€llt, beginnt der Knoten mit der Wiederherstellung der Daten auf einem der Hot-Spare-Laufwerke. Die FlexiRemap-Gruppe, die sich im herabgestuften Zustand befindet, wechselt in den schreibgeschĂŒtzten Modus. Dies geschieht, um Interferenzen zwischen Schreib- und WiederherstellungsvorgĂ€ngen auf der Sicherungsfestplatte zu vermeiden, was letztendlich den Wiederherstellungsprozess beschleunigt und die Zeit verkĂŒrzt, in der das System potenziell anfĂ€llig ist. Nach Abschluss des Neuaufbaus kehrt der Knoten in den normalen Lese-/Schreibmodus zurĂŒck.

NatĂŒrlich nimmt, wie bei anderen Systemen auch, wĂ€hrend des Neuaufbaus die Gesamtleistung ab (schlieĂlich funktioniert eine der FlexiRemap-Gruppen nicht fĂŒr die Aufzeichnung). Der Wiederherstellungsprozess selbst erfolgt jedoch so schnell wie möglich, was AccelStor-Systeme von Lösungen anderer Anbieter unterscheidet.
Eine weitere nĂŒtzliche Eigenschaft der Nothing Shared-Architekturtechnologie ist der Betrieb von Knoten im sogenannten True Active-Active-Modus. Im Gegensatz zur âklassischenâ Architektur, bei der in Systemen nur ein Controller ein bestimmtes Volume/Pool besitzt und der zweite lediglich I/O-VorgĂ€nge ausfĂŒhrt Jeder Knoten arbeitet mit seinem eigenen Datensatz und ĂŒbermittelt keine Anfragen an seinen âNachbarnâ. Dadurch wird die Gesamtsystemleistung durch die parallele Verarbeitung von I/O-Anfragen durch Knoten und Zugriff auf Laufwerke verbessert. Es gibt auch praktisch kein Failover, da im Falle eines Ausfalls einfach keine Notwendigkeit besteht, die Kontrolle ĂŒber die Volumes an einen anderen Knoten zu ĂŒbertragen.
Wenn wir die Technologie der Nothing Shared-Architektur mit der vollstĂ€ndigen Duplizierung von Speichersystemen vergleichen, ist sie auf den ersten Blick der vollstĂ€ndigen Implementierung von Disaster Recovery in puncto FlexibilitĂ€t etwas unterlegen. Dies gilt insbesondere fĂŒr die Organisation einer Kommunikationsleitung zwischen Speichersystemen. So ist es beim H710-Modell möglich, Knoten ĂŒber eine Entfernung von bis zu 100 m zu verteilen, indem nicht ganz billige aktive optische InfiniBand-Kabel verwendet werden. Aber selbst im Vergleich zur ĂŒblichen Implementierung der synchronen Replikation anderer Anbieter ĂŒber einen verfĂŒgbaren FibreChannel ist die Lösung von AccelStor auch ĂŒber gröĂere Entfernungen gĂŒnstiger und einfacher zu installieren/betreiben, denn Es besteht keine Notwendigkeit, Speichervirtualisierungen zu installieren und/oder in Software zu integrieren (was grundsĂ€tzlich nicht immer möglich ist). Vergessen Sie auĂerdem nicht, dass es sich bei AccelStor-Lösungen um All-Flash-Arrays handelt, deren Leistung höher ist als die von âklassischenâ Speichersystemen nur mit SSD.

Durch den Einsatz der Nothing Shared-Architektur von AccelStor ist es möglich, eine SpeichersystemverfĂŒgbarkeit von 99.9999 % zu sehr vernĂŒnftigen Kosten zu erreichen. Hinzu kommt die hohe ZuverlĂ€ssigkeit der Lösung, unter anderem durch die Verwendung von zwei Datenkopien, und die beeindruckende Leistung dank proprietĂ€rer Algorithmen , Lösungen von sind hervorragende Kandidaten fĂŒr SchlĂŒsselpositionen beim Aufbau eines modernen Rechenzentrums.
Source: habr.com
