Riduci i rischi di inattività con l'architettura Shared Nothing

Il tema della tolleranza agli errori nei sistemi di archiviazione dati è sempre rilevante, poiché nella nostra epoca di virtualizzazione diffusa e consolidamento delle risorse, i sistemi di archiviazione sono l'anello il cui guasto porterà non solo a un normale incidente, ma a tempi di inattività a lungo termine dei servizi. Pertanto, i moderni sistemi di storage contengono molti componenti duplicati (persino i controller). Ma questa protezione è sufficiente?

Riduci i rischi di inattività con l'architettura Shared Nothing

Tutti i fornitori, quando elencano le caratteristiche dei sistemi di storage, menzionano sempre l'elevata tolleranza ai guasti delle loro soluzioni, aggiungendo sempre il termine "senza un singolo punto di guasto". Diamo uno sguardo più da vicino a un tipico sistema di storage. Per evitare tempi di inattività durante la manutenzione, il sistema di storage duplica alimentatori, moduli di raffreddamento, porte di ingresso/uscita, unità (intendiamo RAID) e, ovviamente, controller. Se osservi attentamente questa architettura, noterai almeno due potenziali punti di errore, che vengono modestamente taciuti:

  1. Disponibilità di un unico backplane
  2. Avere una copia dei dati

Il backplane è un dispositivo tecnicamente complesso che deve essere sottoposto a seri test durante la produzione. E quindi ci sono casi estremamente rari in cui fallisce completamente. Tuttavia, anche in caso di problemi parziali, come ad esempio uno slot del drive non funzionante, sarà necessario sostituirlo con lo spegnimento completo del sistema di storage.

Anche la creazione di più copie di dati non è un problema a prima vista. Abbastanza diffusa, ad esempio, è la funzionalità Clone nei sistemi di storage, che permette di aggiornare una copia completa dei dati ad intervalli determinati. Tuttavia, in caso di problemi con lo stesso backplay, la copia non sarà disponibile quanto l'originale.

Una soluzione del tutto ovvia per superare queste carenze è la replica su un altro sistema di storage. Se chiudiamo gli occhi di fronte al previsto raddoppio del costo dell'hardware (partendo ancora dal presupposto che le persone che prendono tale decisione pensino adeguatamente e accettino questo fatto in anticipo), ci saranno ancora possibili costi per l'organizzazione della replica sotto forma di licenze, ulteriori costi software e hardware. E, cosa più importante, dovrai in qualche modo garantire la coerenza dei dati replicati. Quelli. costruire un virtualizzatore di archiviazione/vSAN/ecc., che richiede anche risorse di denaro e tempo.

AccelStor Quando creiamo i nostri sistemi ad alta disponibilità, ci prefiggiamo l'obiettivo di eliminare le carenze sopra menzionate. È così che è apparsa l’interpretazione della tecnologia Shared Nothing, che tradotto liberamente significa “senza l’uso di dispositivi condivisi”.

Concetto Niente condiviso l'architettura rappresenta l'utilizzo di due nodi indipendenti (controller), ciascuno dei quali ha il proprio set di dati. La replica sincrona avviene tra i nodi tramite l'interfaccia InfiniBand 56G, completamente trasparente per il software in esecuzione sul sistema di storage. Di conseguenza, non è necessario l'uso di virtualizzatori di archiviazione, agenti software, ecc.

Fisicamente, la soluzione a due nodi di AccelStor può essere implementata in due modelli:

  • H510 — basato su server Twin in un case 2U, se sono richieste prestazioni moderate e capacità fino a 22TB;
  • H710 — basato su singoli server 2U, se sono necessarie prestazioni elevate e grande capacità (fino a 57 TB).

Riduci i rischi di inattività con l'architettura Shared Nothing

Modello H510 basato su server Twin

Riduci i rischi di inattività con l'architettura Shared Nothing

Modello H710 basato su server individuali

L'uso di fattori di forma diversi è dovuto alla necessità di un numero diverso di SSD per ottenere un determinato volume e prestazioni. Inoltre, la piattaforma Twin è più economica e consente di offrire soluzioni più convenienti, anche se con qualche "svantaggio" condizionale sotto forma di un unico backplane. Tutto il resto, compresi i principi di funzionamento, è completamente identico per entrambi i modelli.

Il set di dati per ciascun nodo ha due gruppi FlexiRemap, più 2 hot spare. Ogni gruppo è in grado di resistere al guasto di un SSD. Tutte le richieste in arrivo per registrare un nodo in conformità con ideologia FlexiRemap ricostruisce i blocchi da 4KB in catene sequenziali, che vengono poi scritte sull'SSD nella modalità per loro più comoda (registrazione sequenziale). Inoltre, l'host riceve una conferma di registrazione solo dopo che i dati sono stati fisicamente posizionati sull'SSD, cioè senza memorizzazione nella cache nella RAM. Il risultato sono prestazioni davvero impressionanti fino a 600 IOPS in scrittura e 1 milione e più di IOPS in lettura (modello H710).

Come accennato in precedenza, i set di dati vengono sincronizzati in tempo reale tramite l'interfaccia InfiniBand 56G, che ha un throughput elevato e una bassa latenza. Per sfruttare nel modo più efficiente il canale di comunicazione durante la trasmissione di piccoli pacchetti. Perché Esiste un solo canale di comunicazione; un collegamento 1GbE dedicato viene utilizzato per un ulteriore controllo della frequenza cardiaca. Attraverso di esso viene trasmesso solo il battito cardiaco, quindi non ci sono requisiti per le caratteristiche di velocità.

In caso di aumento della capacità del sistema (fino a 400+TB) a causa di ripiani di espansione sono inoltre collegati in coppia per mantenere il concetto di "nessun singolo punto di guasto".

Per un'ulteriore protezione dei dati (oltre al fatto che AccelStor ne ha già due copie), viene utilizzato uno speciale algoritmo di comportamento in caso di guasto di qualsiasi SSD. Se l'SSD si guasta, il nodo inizierà a ricostruire i dati su una delle unità hot spare. Il gruppo FlexiRemap, che si trova nello stato degradato, passerà alla modalità di sola lettura. Questo viene fatto per eliminare le interferenze tra le operazioni di scrittura e ricostruzione sul disco di backup, accelerando il processo di ripristino e riducendo il tempo in cui il sistema è potenzialmente vulnerabile. Al termine della ricostruzione, il nodo ritorna alla normale modalità di lettura-scrittura.

Riduci i rischi di inattività con l'architettura Shared Nothing

Naturalmente, come altri sistemi, durante la ricostruzione le prestazioni complessive diminuiscono (dopo tutto, uno dei gruppi FlexiRemap non funziona per la registrazione). Ma il processo di ripristino stesso avviene il più rapidamente possibile, il che distingue i sistemi AccelStor dalle soluzioni di altri fornitori.

Un'altra proprietà utile della tecnologia dell'architettura Nothing Shared è il funzionamento dei nodi nella cosiddetta modalità true active-active. A differenza dell’architettura “classica”, in cui solo un controller possiede uno specifico volume/pool e il secondo esegue semplicemente operazioni di I/O, nei sistemi AccelStor ogni nodo lavora con il proprio set di dati e non trasmette richieste al suo “vicino”. Di conseguenza, le prestazioni complessive del sistema migliorano grazie all'elaborazione parallela delle richieste I/O da parte dei nodi e dell'accesso alle unità. Inoltre, praticamente non esiste il failover, poiché semplicemente non è necessario trasferire il controllo dei volumi a un altro nodo in caso di guasto.

Se confrontiamo la tecnologia dell'architettura Nothing Shared con la duplicazione a tutti gli effetti del sistema di archiviazione, a prima vista sarà leggermente inferiore alla piena implementazione del ripristino di emergenza in termini di flessibilità. Ciò è particolarmente vero per l'organizzazione di una linea di comunicazione tra i sistemi di archiviazione. Così nel modello H710 è possibile estendere i nodi fino a 100 m di distanza utilizzando cavi ottici attivi InfiniBand non molto economici. Ma anche se confrontata con la consueta implementazione della replica sincrona di altri fornitori attraverso un FibreChannel disponibile, anche su distanze più lunghe, la soluzione di AccelStor sarà più economica e più facile da installare/utilizzare, perché non è necessario installare virtualizzatori di storage e/o integrarli con software (cosa che in linea di principio non è sempre possibile). Inoltre, non dimenticare che le soluzioni AccelStor sono array All Flash con prestazioni superiori a quelle dei sistemi di storage “classici” con solo SSD.

Riduci i rischi di inattività con l'architettura Shared Nothing

Quando si utilizza l'architettura Nothing Shared di AccelStor, è possibile ottenere una disponibilità del sistema di storage del 99.9999% a un costo molto ragionevole. Oltre all’elevata affidabilità della soluzione, anche attraverso l’utilizzo di due copie dei dati, e prestazioni impressionanti grazie ad algoritmi proprietari FlexiRemap, soluzioni da AccelStor sono ottimi candidati per posizioni chiave nella costruzione di un data center moderno.

Fonte: habr.com

Aggiungi un commento