Compartimos nuestra experiencia, cómo funcionan los SSD en el marco de RAID y qué nivel de matriz es más rentable

В material pasado Ya hemos considerado la cuestión de "¿Aplicaremos RAID en SSD" usando el ejemplo de las unidades Kingston, pero lo hicimos solo dentro del nivel cero. En el artículo actual, analizaremos las opciones para usar soluciones NVMe profesionales y domésticas en los tipos más populares de arreglos RAID y hablaremos sobre la compatibilidad del controlador. Broadcom con discos Kingston.

Compartimos nuestra experiencia, cómo funcionan los SSD en el marco de RAID y qué nivel de matriz es más rentable

¿Por qué necesita RAID en un SSD?

Las ventajas de los arreglos de almacenamiento basados ​​en SSD sobre los arreglos de almacenamiento HDD incluyen tiempos de acceso más rápidos a los datos en el disco y un rendimiento de lectura/escritura superior. Sin embargo, un rendimiento ideal de RAID basado en SSD requiere una combinación óptima de procesador, caché, software y hardware. Cuando todos estos factores funcionan juntos a la perfección, un SSD RAID puede superar en gran medida a una configuración comparable que utiliza HDD tradicionales.

Una SSD típica consume menos energía que las HDD, por lo que cuando combina una gran cantidad de SSD en una matriz RAID, el ahorro de energía en comparación con una matriz RAID HDD también puede traducirse en costos más bajos en las facturas de energía corporativas.

Sin embargo, SSD RAID tiene limitaciones y desventajas, en particular, el precio más alto por gigabyte de espacio en comparación con los discos duros de capacidad comparable. Y el tiempo entre fallas de la memoria flash está limitado a una cierta cantidad de ciclos de reescritura. Es decir, las unidades SSD tienen una vida útil determinada, que depende de la operación: cuanta más información se sobrescriba, más rápido fallará la unidad. Por otro lado, los SSD empresariales tienen una vida útil decente comparable a los discos duros mecánicos.

Cómo viven los SSD de Kingston en modo RAID con controladores Broadcom

En los primeros días de las SSD, los diseños de RAID tenían muchos matices. Incluso debido al uso de discos duros menos tolerantes a fallas. Las unidades de estado sólido son mucho más confiables que sus contrapartes basadas en discos magnéticos. Como sabemos, las soluciones SSD no tienen piezas móviles, por lo que el daño mecánico se reduce a cero. La falla de las unidades de estado sólido debido a sobretensiones también es poco probable, dado que a nivel de una PC doméstica y cualquier servidor, UPS, protectores contra sobretensiones e incluso una fuente de alimentación lo protegen.

Al mismo tiempo, las unidades de estado sólido tienen otra ventaja significativa: incluso si las celdas de memoria están desgastadas para escribir, aún se pueden leer datos, pero si el disco magnético está dañado, por desgracia.

Compartimos nuestra experiencia, cómo funcionan los SSD en el marco de RAID y qué nivel de matriz es más rentable

Hoy en día, es una práctica bastante normal utilizar soluciones SSD en matrices RAID de diferentes niveles. Lo principal es elegir los SSD correctos, cuya latencia sea mínima. E idealmente, use SSD del mismo fabricante y el mismo modelo para que no termine con una mezcolanza de unidades que admiten diferentes tipos de cargas y están construidas sobre la base de diferentes tipos de memoria, controladores y otras tecnologías. Es decir, si decidimos comprar cuatro o 16 SSD NVMe de Kingston para crear una matriz RAID, sería mejor que todos fueran de la misma serie y gama de modelos.

Por cierto, en último artículo citamos los controladores Broadcom por una razón cuando hablamos de SSD NVMe de Kingston. El hecho es que los manuales de estos dispositivos prescriben de inmediato unidades compatibles (incluidas las soluciones del fabricante estadounidense de SSD mencionado anteriormente), con las que el controlador funcionará sin problemas. Se debe confiar en esta información al elegir un paquete de controlador-SSD para RAID.

Analizamos el trabajo de SSD Kingston en los tipos más populares de RAID: "1", "5", "10", "50"

Por lo tanto, el nivel de RAID "cero" no proporciona redundancia de datos, sino que solo aumenta el rendimiento. RAID 0 no proporciona ninguna protección de datos, por lo que no lo consideraremos dentro del segmento corporativo. RAID 1, por otro lado, brinda redundancia total pero solo ganancias de rendimiento modestas y, por lo tanto, debe tenerse en cuenta si las ganancias de rendimiento no son una consideración principal al construir una matriz SSD RAID.

RAID 1 basado en SSD de Kingston y controladores Broadcom

Por lo tanto, la matriz RAID de primer nivel basada en el controlador Broadcom MegaRAID 9460-16i combina de dos a 32 unidades Kingston, que son copias entre sí, y proporciona una redundancia completa. Si al usar HDD tradicionales, la velocidad de escritura y lectura de datos se mantuvo al nivel de este mismo HDD, entonces, al usar las soluciones NVMe SSD, obtenemos un rendimiento diez veces mayor. Especialmente en términos de tiempo de acceso a los datos. Por ejemplo, con dos SSD Kingston DC1000M U.2 NVMe en el servidor RAID 1, obtenemos 350 000 IOPS de lectura aleatoria y 75 000 IOPS de escritura.

Compartimos nuestra experiencia, cómo funcionan los SSD en el marco de RAID y qué nivel de matriz es más rentable

En términos de velocidad de lectura secuencial, los resultados coincidirán con las características de la unidad: 3200 MB / s. Pero dado que ambos SSD NVMe funcionan correctamente, se pueden leer datos de ellos al mismo tiempo, lo que hace que las operaciones de lectura sean bastante rápidas. Pero la velocidad de escritura (que se dice que es de 2000 MB / s) será más lenta, porque cada operación de escritura se realiza dos veces.

Compartimos nuestra experiencia, cómo funcionan los SSD en el marco de RAID y qué nivel de matriz es más rentable

RAID 1 es ideal para bases de datos pequeñas o cualquier otro entorno que requiera tolerancia a fallas pero poca capacidad. La duplicación de unidades es especialmente útil en escenarios de recuperación de desastres (el rendimiento se degrada ligeramente) porque proporciona una "resucitación" instantánea de datos importantes si falla una de las unidades de la matriz. Pero debido a que este nivel de protección requiere duplicar la capacidad de almacenamiento de los datos duplicados (100 TB requerirían 200 TB de almacenamiento), muchos sistemas empresariales utilizan opciones de almacenamiento más económicas: RAID 5 y RAID 6.

RAID 5 basado en SSD de Kingston y controladores Broadcom

Para organizar una matriz RAID de quinto nivel, necesitamos al menos tres unidades, cuyos datos se intercalan (se escriben cíclicamente en todas las unidades de la matriz), pero no se duplican. Al organizarlos, se debe tener en cuenta su estructura más compleja, ya que aquí aparece un concepto como "suma de control" (o "paridad"). Este concepto significa la función XOR algebraica lógica (también conocida como "OR" exclusivo), que dicta el uso de un mínimo de tres unidades en la matriz (máximo - 32). En este caso, la información de paridad se escribe en todos los "discos" de la matriz.

Compartimos nuestra experiencia, cómo funcionan los SSD en el marco de RAID y qué nivel de matriz es más rentable

Para una matriz de cuatro SSD Kingston DC500R SATA con una capacidad de 3,84 TB cada una, obtenemos 11,52 TB de espacio y 3,84 para sumas de verificación. Y si combina 16 unidades Kingston DC1000M U.2 NVMe con una capacidad de 7,68 TB en un RAID de nivel 115,2, aprenderemos 7,68 TB con una pérdida de 5 TB. Como puede ver, cuantas más unidades, mejor al final. También es mejor porque cuantas más unidades haya en RAID 0, mayor será el rendimiento general de escritura. Y la lectura lineal alcanzará el nivel de RAID XNUMX.

Compartimos nuestra experiencia, cómo funcionan los SSD en el marco de RAID y qué nivel de matriz es más rentable

Un grupo de discos RAID 5 proporciona un alto rendimiento (especialmente para archivos grandes) y redundancia con una mínima pérdida de energía. Este tipo de organización de matriz es más adecuada para redes que realizan muchas operaciones pequeñas de entrada/salida (E/S) al mismo tiempo. Pero no debe usarlo para tareas que requieran una gran cantidad de operaciones de escritura para bloques pequeños o pequeños.
Hay un matiz más: si al menos una de las unidades NVMe falla, RAID 5 entra en modo de degradación y la falla de otro dispositivo de almacenamiento puede volverse crítica para todos los datos. Si falla una unidad de la matriz, el controlador RAID usa la información de paridad para recrear los datos faltantes.

RAID 10 basado en SSD de Kingston y controladores Broadcom

Por lo tanto, RAID 0 nos brinda el doble de velocidad y tiempo de acceso, y RAID 1 brinda confiabilidad. Lo ideal sería combinarlos, y aquí RAID 10 (o 1+0) viene al rescate. "Diez" se ensambla a partir de cuatro unidades SATA SSD o NVMe (máximo - 32) e implica una matriz de "espejos", la cantidad de unidades en las que siempre debe ser un múltiplo de cuatro. Los datos de esta matriz se escriben utilizando particiones de bloques fijos (como en el caso de RAID 0) y segmentación entre unidades, distribuyendo copias entre las "unidades" en una matriz RAID 1. Y con la capacidad de acceder a múltiples grupos de unidades al mismo tiempo. Al mismo tiempo, RAID 10 muestra un alto rendimiento.

Compartimos nuestra experiencia, cómo funcionan los SSD en el marco de RAID y qué nivel de matriz es más rentable

Dado que RAID 10 es capaz de distribuir datos en varios pares duplicados, esto significa que puede tolerar la falla de una unidad en un par. Sin embargo, si ambos pares duplicados (es decir, las cuatro unidades) fallan, se producirá una pérdida de datos inevitable. Como resultado, también obtenemos una buena tolerancia a fallas y confiabilidad. Pero tenga en cuenta que, al igual que RAID 1, la matriz de décimo nivel utiliza solo la mitad de la capacidad total y, por lo tanto, es una solución costosa. Y también difícil de configurar.

RAID 10 es adecuado para su uso con almacenes de datos que requieren una redundancia del 100 % de los grupos de discos duplicados, así como el mayor rendimiento de E/S de RAID 0. Es la mejor solución para bases de datos medianas o cualquier entorno que requiera una mayor tolerancia a fallas. que RAID 5.

RAID 50 basado en SSD de Kingston y controladores Broadcom

Una matriz combinada similar a RAID de nivel 5, que es una matriz de nivel 50 creada a partir de matrices de nivel 5. Como antes, el objetivo principal de esta matriz es duplicar el rendimiento y mantener la confiabilidad de los datos en matrices RAID XNUMX. Al mismo tiempo, RAID XNUMX proporciona un mejor rendimiento de escritura y una mejor protección de datos que RAID XNUMX estándar en caso de falla de la unidad. , y también es capaz de una recuperación más rápida en caso de falla de una de las unidades.

Compartimos nuestra experiencia, cómo funcionan los SSD en el marco de RAID y qué nivel de matriz es más rentable

El grupo de unidades RAID 50 divide los datos en bloques más pequeños y luego los separa en cada arreglo RAID 5. El grupo de unidades RAID 5, a su vez, también divide los datos en bloques más pequeños, calcula la paridad, realiza una operación OR lógica en los bloques y luego realiza operaciones de escritura y paridad de bloques de datos para cada disco del grupo de discos.

Y aunque el rendimiento se degrada inevitablemente si una de las unidades falla, no es tan importante como en una matriz RAID 5, ya que una falla afecta solo a una de las matrices y deja a la otra completamente operativa. De hecho, RAID 50 puede sobrevivir hasta ocho fallas de unidades HDD/SSD/NVMe si cada "disco" fallido está en una matriz RAID 5 separada.

Compartimos nuestra experiencia, cómo funcionan los SSD en el marco de RAID y qué nivel de matriz es más rentable

RAID 50 se usa mejor para aplicaciones que requieren alta confiabilidad y deben procesar una gran cantidad de solicitudes mientras se mantienen altas tasas de transferencia de datos y menores costos de unidad que RAID 10. Sin embargo, dado que se requiere un mínimo de seis unidades para configurar una matriz RAID 50 , el costo no está completamente excluido como factor. Una desventaja de RAID 50 es que, como RAID 5, necesita un controlador complejo: como mencionado por nosotros en el ultimo articulo MegaRAID 9460-16i de Broadcom.

También vale la pena señalar que RAID 50 utiliza menos espacio en disco que RAID 5 debido a la asignación de capacidad para mantener registros de paridad. Sin embargo, todavía tiene más espacio utilizable que otros niveles de RAID, especialmente aquellos que usan duplicación. Con un requisito mínimo de seis unidades, RAID 50 puede ser una opción costosa, pero el espacio adicional en disco justifica el costo al proteger los datos corporativos. Este tipo de matriz se recomienda para datos que requieren alta confiabilidad de almacenamiento, altas tasas de solicitud, altas tasas de transferencia y alta capacidad de almacenamiento.

RAID 6 y RAID 60: tampoco nos hemos olvidado de ellos

Dado que hemos hablado de arreglos de los niveles quinto y quincuagésimo, sería un pecado no mencionar tipos de organización de arreglos como RAID 6 y RAID 60.

Compartimos nuestra experiencia, cómo funcionan los SSD en el marco de RAID y qué nivel de matriz es más rentable

El rendimiento de RAID 6 es similar al de RAID 5, pero aquí al menos dos unidades reciben paridad, lo que permite que la matriz sobreviva a la falla de dos unidades sin perder datos (en RAID 5, esta situación es altamente indeseable). Esto da como resultado una mayor fiabilidad. Por lo demás, todo es igual que en la matriz de quinto nivel: en caso de falla de uno o dos discos, el controlador RAID utiliza bloques de paridad para recrear toda la información que falta. Si fallan dos unidades, la recuperación no ocurre simultáneamente: primero, se reanima la primera unidad y luego la segunda. Por lo tanto, se realizan dos operaciones de recuperación de datos.

Compartimos nuestra experiencia, cómo funcionan los SSD en el marco de RAID y qué nivel de matriz es más rentable

Es fácil adivinar que si RAID 50 es una matriz de nivel 60 de matrices de nivel 6, entonces RAID 50 es una matriz de nivel 8 de matrices de nivel 16 de la que acabamos de hablar. Es decir, esta organización del almacenamiento RAID te permite sobrevivir a la pérdida de dos SSD en cada grupo de discos RAID XNUMX. El principio de funcionamiento es similar al que hablamos en la sección RAID XNUMX, pero la cantidad de fallas que un La matriz de nivel XNUMX puede soportar crecimientos de XNUMX a XNUMX unidades. Por lo general, estos arreglos se utilizan para el servicio al cliente en línea, lo que requiere una alta tolerancia a fallas.

Resumiendo:

Aunque la duplicación proporciona más tolerancia a fallas que RAID 50/60, también requiere mucho más espacio. Dado que la cantidad de datos se duplica, en realidad obtiene solo el 50% de la capacidad total de las unidades instaladas en el servidor para grabar y almacenar información. La elección entre RAID 50/60 y RAID 10 probablemente dependerá de los presupuestos disponibles, la capacidad del servidor y sus necesidades de protección de datos. Además, el costo pasa a primer plano cuando hablamos de soluciones SSD (tanto corporativas como de consumo).

Igual de importante, ahora sabemos con certeza que RAID basado en SSD es una solución completamente segura y una práctica normal para los negocios de hoy. Como parte del uso doméstico, también hay una razón para cambiar a NVMe, si el presupuesto lo permite. Y si todavía tiene una pregunta, ¿por qué es necesario todo esto? Vuelva al principio del artículo; ya lo hemos respondido en detalle.

Este artículo fue preparado con el apoyo de nuestros colegas de Broadcom, quienes proporcionan sus controladores a los ingenieros de Kingston para realizar pruebas con unidades SATA/SAS/NVMe de clase empresarial. Gracias a esta simbiosis amigable, los clientes no tienen que dudar de la confiabilidad y estabilidad de las unidades Kingston con controladores HBA y RAID de producción. Broadcom.

Puede encontrar más información sobre los productos de Kingston en el sitio web oficial compañía.

Fuente: habr.com

Añadir un comentario