Caratteristiche del tiering automatico nei sistemi di storage Qsan XCubeSAN

Continuare a considerare le tecnologie per accelerare le operazioni di I/O applicate ai sistemi di storage, avviato nel articolo precedente, non si può fare a meno di soffermarsi su un'opzione così popolare come il tiering automatico. Sebbene l'ideologia di questa funzione sia molto simile tra i vari produttori di sistemi di storage, esamineremo le caratteristiche dell'implementazione del tiering utilizzando un esempio Sistema di archiviazione Qsan.

Caratteristiche del tiering automatico nei sistemi di storage Qsan XCubeSAN

Nonostante la varietà dei dati archiviati sui sistemi di storage, questi stessi dati possono essere suddivisi in più gruppi in base alla loro richiesta (frequenza di utilizzo). È necessario accedere ai dati più popolari (“caldi”) il più rapidamente possibile, mentre i dati meno utilizzati (“freddi”) possono essere elaborati con una priorità inferiore.

Per organizzare tale schema, viene utilizzata la funzionalità di tiering. L'array di dati in questo caso non è costituito da dischi dello stesso tipo, ma da diversi gruppi di unità che formano livelli di archiviazione diversi. Utilizzando uno speciale algoritmo, i dati vengono spostati automaticamente tra i livelli per garantire le massime prestazioni complessive.

Caratteristiche del tiering automatico nei sistemi di storage Qsan XCubeSAN

Magazzinaggio Qsan supporta fino a tre livelli di archiviazione:

  • Livello 1: SSD, massime prestazioni
  • Livello 2: HDD SAS 10K/15K, prestazioni elevate
  • Livello 3: HDD NL-SAS 7.2K, capacità massima

Un pool di suddivisione automatica può contenere tutti e tre i livelli o solo due in qualsiasi combinazione. All'interno di ciascun livello, le unità vengono combinate in gruppi RAID familiari. Per la massima flessibilità, il livello RAID in ciascun livello può essere diverso. Cioè, ad esempio, nulla ti impedisce di organizzare una struttura come 4x SSD RAID10 + 6x HDD 10K RAID5 + 12 HDD 7.2K RAID6

Dopo aver creato i volumi (dischi virtuali) su Classificazione automatica pool su di esso inizia la raccolta in background di statistiche su tutte le operazioni di I/O. Per fare ciò, lo spazio viene “tagliato” in blocchi da 1GB (le cosiddette sub LUN). Ad ogni accesso a tale blocco, gli viene assegnato un coefficiente pari a 1. Poi, nel tempo, questo coefficiente diminuisce. Dopo 24 ore, se non ci sono richieste I/O a questo blocco, sarà già pari a 0.5 e continuerà a scendere ogni ora successiva.

Ad un certo punto nel tempo (per impostazione predefinita, ogni giorno a mezzanotte), i risultati raccolti vengono classificati in base all'attività della sub LUN in base ai relativi coefficienti. Sulla base di ciò, viene deciso quali blocchi spostare e in quale direzione. Dopodiché, infatti, avviene lo spostamento dei dati tra i livelli.

Caratteristiche del tiering automatico nei sistemi di storage Qsan XCubeSAN

Il sistema di storage Qsan implementa perfettamente la gestione del processo di tiering utilizzando numerosi parametri, che consentono di configurare in modo molto flessibile le prestazioni finali dell'array.

Per determinare la posizione iniziale dei dati e la direzione prioritaria del loro spostamento, vengono utilizzate policy impostate separatamente per ciascun volume:

  • Classificazione automatica – la politica di default, il posizionamento iniziale e la direzione dei movimenti sono determinati automaticamente, vale a dire I dati “caldi” tendono al livello più alto, mentre i dati “freddi” si spostano verso il basso. Il posizionamento iniziale viene selezionato in base allo spazio disponibile su ciascun livello. Ma devi capire che il sistema si sforza principalmente di sfruttare al massimo le unità più veloci. Pertanto, se c'è spazio libero, i dati verranno posizionati ai livelli superiori. Questa policy è adatta alla maggior parte degli scenari in cui la domanda di dati non può essere prevista in anticipo.
  • Inizia con Alto e poi Tiering automatico – la differenza rispetto al precedente è solo nella posizione iniziale dei dati (al livello più veloce)
  • Il livello più alto – i dati cercano sempre di occupare il livello più veloce. Se vengono spostati verso il basso durante il funzionamento, verranno spostati indietro il prima possibile. Questa politica è adatta per i dati che richiedono l'accesso più veloce possibile.
  • Livello minimo – i dati tendono sempre ad occupare il livello più basso. Questa policy è ottima per i dati utilizzati raramente (ad esempio, gli archivi).
  • Non muoversi – il sistema determina automaticamente la posizione originale dei dati e non li sposta. Tuttavia, le statistiche continuano a essere raccolte nel caso in cui sia successivamente necessario il loro ricollocamento.

Vale la pena notare che, sebbene le policy vengano definite al momento della creazione di ciascun volume, possono essere modificate ripetutamente al volo durante tutto il ciclo di vita del sistema.

Oltre alle policy per il meccanismo di tiering, vengono configurate anche la frequenza e il ritmo dello spostamento dei dati tra i livelli. È possibile impostare un tempo di viaggio specifico: giornaliero o in determinati giorni della settimana e anche ridurre l'intervallo di raccolta delle statistiche a diverse ore (frequenza minima - 2 ore). Se è necessario limitare il tempo necessario per completare un'operazione di spostamento dei dati, è possibile impostare un intervallo di tempo (finestra per lo spostamento). Inoltre, viene indicata anche la velocità di trasferimento: 3 modalità: veloce, media, lenta.

Caratteristiche del tiering automatico nei sistemi di storage Qsan XCubeSAN

Se è necessario un trasferimento immediato dei dati, è possibile eseguirlo manualmente in qualsiasi momento su comando dell'amministratore.

È chiaro che quanto più spesso e velocemente i dati vengono spostati tra i livelli, tanto più flessibile sarà il sistema di archiviazione per adattarsi alle attuali condizioni operative. Ma allo stesso tempo vale la pena ricordare che lo spostamento è un carico aggiuntivo (principalmente sui dischi), quindi non dovresti "guidare" i dati a meno che non sia assolutamente necessario. È meglio pianificare il movimento nei momenti di carico minimo. Se il funzionamento del sistema di storage richiede costantemente prestazioni elevate 24 ore su 7, XNUMX giorni su XNUMX, vale la pena ridurre al minimo il tasso di trasferimento.

L'abbondanza di impostazioni di scatto piacerà senza dubbio agli utenti avanzati. Tuttavia, per coloro che si avvicinano a tale tecnologia per la prima volta, non c’è nulla di cui preoccuparsi. È del tutto possibile fidarsi delle impostazioni predefinite (politica di tiering automatico, movimento alla massima velocità una volta al giorno di notte) e, man mano che le statistiche si accumulano, regolare determinati parametri per ottenere il risultato richiesto.

Confrontando lo strappo con una tecnologia altrettanto popolare per aumentare la produttività come Cache SSD, dovresti ricordare i diversi principi di funzionamento dei loro algoritmi.

Cache SSD
Classificazione automatica

Effetto velocità di insorgenza
Quasi istantaneamente. Ma l’effetto evidente si ha solo dopo che la cache è stata “riscaldata” (da minuti a ore)
Dopo aver raccolto le statistiche (da 2 ore, idealmente un giorno) più il tempo per spostare i dati

Durata dell'effetto
Fino a quando il dato non verrà soppiantato da una nuova porzione (minuti-ore)
Mentre i dati sono richiesti (XNUMX ore o più)

Indicazioni per l'uso
Guadagni prestazionali istantanei a breve termine (database, ambienti di virtualizzazione)
Aumento della produttività per un lungo periodo (file, web, server di posta)

Inoltre, una delle caratteristiche del tiering è la possibilità di utilizzarlo non solo per scenari come “SSD + HDD”, ma anche “HDD veloce + HDD lento” o anche per tutti e tre i livelli, cosa praticamente impossibile quando si utilizza la cache SSD.

Test

Per testare le prestazioni degli algoritmi di tiering, abbiamo condotto un semplice test. È stato creato un pool di due livelli SSD (RAID 1) + HDD 7.2K (RAID1), sul quale è stato posizionato un volume con policy di “livello minimo”. Quelli. I dati dovrebbero sempre trovarsi su dischi lenti.

Caratteristiche del tiering automatico nei sistemi di storage Qsan XCubeSAN

Caratteristiche del tiering automatico nei sistemi di storage Qsan XCubeSAN

L'interfaccia di gestione mostra chiaramente il posizionamento dei dati tra i livelli

Dopo aver riempito il volume con i dati, abbiamo modificato la policy di posizionamento in Tiering automatico ed eseguito il test IOmeter.

Caratteristiche del tiering automatico nei sistemi di storage Qsan XCubeSAN

Dopo diverse ore di test, quando il sistema è stato in grado di accumulare statistiche, è iniziato il processo di ricollocazione.

Caratteristiche del tiering automatico nei sistemi di storage Qsan XCubeSAN

Una volta completato lo spostamento dei dati, il nostro volume di test è stato completamente "strisciato" al livello più alto (SSD).

Caratteristiche del tiering automatico nei sistemi di storage Qsan XCubeSAN

Caratteristiche del tiering automatico nei sistemi di storage Qsan XCubeSAN

Вердикт

L'Auto Tiering è una meravigliosa tecnologia che consente di aumentare le prestazioni di un sistema di storage con costi minimi di materiale e tempo attraverso un uso più intensivo di unità ad alta velocità. Applicata ai Qsan l'unico investimento è una licenza, che viene acquistata una volta per tutte senza restrizioni su volume/numero di dischi/scaffali/ecc. Questa funzionalità è dotata di impostazioni così ricche da poter soddisfare quasi tutte le attività aziendali. E la visualizzazione dei processi nell'interfaccia ti consentirà di gestire in modo efficace il dispositivo.

Fonte: habr.com

Aggiungi un commento