Els algorismes RAID es van introduir al públic l'any 1987. Fins avui, segueixen sent la tecnologia més popular per protegir i accelerar l'accés a les dades en l'àmbit de l'emmagatzematge d'informació. Però l'era de la tecnologia informàtica, que ha superat els 30 anys, no és més aviat la maduresa, sinó la vellesa. El motiu és el progrés, que inexorablement aporta noves oportunitats. En un moment en què pràcticament no hi havia altres discs que no fossin els HDD, els algorismes RAID permetien fer un ús més eficient dels recursos d'emmagatzematge disponibles. Tanmateix, amb l'arribada dels SSD, la situació ha canviat radicalment. Ara RAID quan es treballa amb unitats d'estat sòlid ja és un "llaç" per al seu rendiment. Per tant, per desbloquejar tot el potencial de les característiques de velocitat SSD, simplement cal un enfocament completament diferent per treballar-hi.

A més de les òbvies diferències entre HDD i SSD en els principis de funcionament, aquest tipus de suports tenen una característica més important: qualsevol disc dur pot reescriure qualsevol dada amb una granularitat d'un bloc (avui en dia, la majoria de vegades és de 4KB). Per als SSD, el procés de reescriptura és un procediment molt més complex:
- Les dades modificades es copien a la nova ubicació. En aquest cas, la granularitat és el mateix bloc, però consta de diverses pàgines i té una mida de 256KB - 4MB. Aquells. en canviar els mateixos 4KB, cal copiar, entre altres coses, totes les pàgines adjacents que formen un sol bloc.
- Marqueu els blocs "vells" com a no utilitzats, de manera que després puguin ser esborrats pel Recollidor d'escombraries.

Escriptura/sobreescritura seqüencial a SSD
En el cas de l'escriptura/reescriptura seqüencial, aquesta característica de l'SSD no juga un paper important pel que fa al seu rendiment, perquè els blocs estan situats a prop, i el recol·lector d'escombraries fa força bé la seva feina al fons. Però a la vida real, i encara més al segment Enterprise, l'accés aleatori a les dades s'utilitza amb més freqüència per als SSD. I aquestes dades s'escriuen a ubicacions aleatòries de les unitats.
Com més dades s'escriuen a l'SSD, més difícil és que funcioni el col·lector d'escombraries, ja que la fragmentació augmenta molt. Com a resultat, arriba el moment en què el procés de neteja de la unitat deixa de ser "de fons": el rendiment de l'SSD disminueix significativament, perquè una part important és agafada per Garbage Collector.

Ubicació de dades reals a l'SSD durant l'ús diari
Per il·lustrar l'efecte del treball del col·lector d'escombraries, en funció del mode d'enregistrament de la unitat, podeu realitzar les proves més senzilles: escriptura seqüencial i aleatòria en blocs de 4KB en una unitat de 100 GB. (Font - empresa )

Rendiment d'escriptura seqüencial

Rendiment d'escriptura aleatòria
Com es pot veure a les proves, la caiguda de rendiment pot arribar a més de dues vegades. I això és només una unitat. Quan s'utilitza un SSD com a part d'un grup RAID, el nombre d'operacions de reescriptura augmenta molt a causa del treball amb paritat.
En general, a causa d'aquestes característiques del funcionament SSD, hi ha un paràmetre per a ells com l'amplificació d'escriptura. Aquesta és la relació entre la quantitat de dades escrites a la unitat i la quantitat de dades que l'amfitrió ha enviat realment. I per al RAID5 més popular aquest coeficient és ~3.5.
Com a resultat, els sistemes amb RAID clàssic utilitzen bàsicament els SSD només un 10% de la seva velocitat real i s'escalen malament quan el nombre de unitats augmenta a més d'una dotzena.
També observem que les operacions d'escriptura excessives no només redueixen el rendiment de l'SSD, sinó que també redueixen els seus recursos, lluny de ser infinits, escurçant així la vida útil de la unitat.
, que és el nucli de tots els productes AccelStor, està dissenyat precisament com una alternativa als algorismes RAID clàssics quan es treballa amb SSD. La innovació de la tecnologia es destaca tant per diverses patents i premis (inclòs a Flash Memory Summit 2016), com pels resultats de proves independents (per exemple, SPC1).
cor consisteix a convertir totes les peticions d'escriptura entrants, principalment de tipus aleatori, en un conjunt de blocs el més semblant possible al mode d'escriptura seqüencial des del punt de vista de la unitat. Com a resultat, la gravació a l'SSD es produeix en el mode més còmode per a ells, i el rendiment resultant supera qualsevol sistema amb RAID clàssic.
Tots els SSD dels sistemes AccelStor es divideixen en dos grups FlexiRemap® simètrics. La mida del grup depèn del model i oscil·la entre 5 i 11 unitats. Per a la tolerància a errors dins del grup, la paritat s'utilitza de manera similar a RAID5. Els dos grups s'utilitzen junts per formar un espai d'emmagatzematge comú. Per tant, la tolerància a errors resultant serà similar a una matriu RAID50 formada per dos grups: el sistema pot suportar la fallada de fins a dos SSD, però no més d'un a cada grup FlexiRemap®.

Totes les sol·licituds d'escriptura entrants es divideixen en blocs de 4 KB, que s'escriuen en mode round robin als dos grups FlexiRemap®. Al mateix temps, el sistema fa un seguiment constant de la demanda de blocs gravats, intentant gravar blocs similars el més a prop possible els uns dels altres quan canvien. Resulta ser un anàleg virtual de compartir, si s'expressa en termes de sistemes d'emmagatzematge. En aquest cas, el treball del recol·lector d'escombraries es facilita molt: després de tot, els blocs no utilitzats sempre estaran a prop.
Cal assenyalar que A diferència dels productes de la competència, no utilitzen la funcionalitat d'emmagatzemar a la memòria cau les sol·licituds entrants a la memòria RAM del controlador. Tots els blocs de dades entrants s'escriuen immediatament a l'SSD. L'amfitrió rep la confirmació de la gravació correcta només després que les dades es col·loquin físicament a les unitats. La memòria RAM només emmagatzema taules de col·locació de blocs a l'SSD per accelerar l'accés i determinar on escriure el següent bloc de dades. Per descomptat, per fiabilitat, les còpies d'aquestes taules es troben als mateixos mitjans. Com a resultat, els sistemes AccelStor no requereixen cap protecció de memòria cau en forma de bateria/condensador (no obstant això, la capacitat de comunicar-se amb un SAI està disponible per a un apagat "suau" en cas de problemes d'alimentació).
Gràcies a aquest enfocament per organitzar l'enregistrament, el recol·lector d'escombraries és capaç de treballar en segon pla sense afectar significativament la velocitat de les unitats, cosa que permet, en última instància, utilitzar fins al 90% del rendiment de l'SSD dins del sistema. Aquesta és precisament la raó de les altes taxes d'IOPS dels sistemes AccelStor en comparació amb All Flash, que es basen en algorismes RAID.
Una altra característica important de la tecnologia FlexiRemap® és la reducció significativa de les escriptures redundants als SSD. Així, el factor d'amplificació d'escriptura dels sistemes AccelStor és només 1.3, la qual cosa, traduït al llenguatge comú, significa un augment de la vida útil de les unitats en comparació amb RAID5 en més de 2.5 vegades!

Gràcies al seguiment constant del sistema de la política de col·locació de dades als SSD, totes les unitats es desgasten per igual. Aquest enfocament us permet predir la seva vida útil i enviar un senyal a l'administrador amb antelació sobre l'esgotament del recurs de gravació.
Està clar que els SSD poden fallar. En aquest cas, el sistema començarà immediatament a reconstruir-se en un dels discs de recanvi calent. Això fa que el grup FlexiRemap® en estat degradat sigui de només lectura i totes les sol·licituds d'escriptura es dirigeixin al segon grup. Aquest mecanisme de protecció es proporciona per accelerar l'operació de reconstrucció i reduir la probabilitat de fallada d'una altra unitat dins del mateix grup. No és cap secret que durant una reconstrucció, totes les unitats d'un grup experimenten un augment de la càrrega a causa de la interferència de les operacions de lectura, escriptura i restauració del recanvi calent. Això augmenta la probabilitat d'una altra fallada del disc. I com més operacions d'escriptura, més tardarà la reconstrucció.

Un cop s'hagi completat el procés de reparació i el grup FlexiRemap® torni a la normalitat, hi haurà una lleugera inclinació en el recurs d'escriptura entre els dos grups. Per tant, per alinear-lo, les operacions d'escriptura posteriors cauran més sovint sobre el grup restaurat (per descomptat, de tal manera que el rendiment final del sistema no pateix gaire).
No és possible augmentar el rendiment dels sistemes All Flash basats en algorismes RAID per sobre de determinats valors (~280K IOPS@4K d'escriptura aleatòria), fins i tot quan s'utilitzen sistemes de memòria cau complexos. La tecnologia FlexiRemap®, gràcies a un enfocament completament diferent per organitzar l'espai d'emmagatzematge, no només supera fàcilment aquesta barrera, sinó que alhora augmenta la vida útil dels SSD diverses vegades. Així els sistemes tenen avantatges importants entre les matrius All Flash en molts fronts (IOPS/$, GB/$, TCO, ROI), cosa que els converteix en candidats ideals per a llocs clau en centres de dades de clients per resoldre tasques que requereixen molts recursos.
Font: www.habr.com
