Reduzca los riesgos de tiempo de inactividad con la arquitectura Shared Nothing

El tema de la tolerancia a fallos en los sistemas de almacenamiento de datos siempre es relevante, ya que en nuestra era de virtualización generalizada y consolidación de recursos, los sistemas de almacenamiento son el eslabón cuyo fallo conducirá no sólo a un accidente común, sino a una inactividad a largo plazo de los servicios. Por lo tanto, los sistemas de almacenamiento modernos contienen muchos componentes duplicados (incluso controladores). ¿Pero es suficiente esa protección?

Reduzca los riesgos de tiempo de inactividad con la arquitectura Shared Nothing

Absolutamente todos los proveedores, al enumerar las características de los sistemas de almacenamiento, siempre mencionan la alta tolerancia a fallos de sus soluciones, añadiendo siempre el término “sin un único punto de fallo”. Echemos un vistazo más de cerca a un sistema de almacenamiento típico. Para evitar tiempos de inactividad por mantenimiento, el sistema de almacenamiento duplica fuentes de alimentación, módulos de refrigeración, puertos de entrada/salida, unidades (nos referimos a RAID) y, por supuesto, controladores. Si observa de cerca esta arquitectura, notará al menos dos puntos potenciales de falla, que se mantienen modestamente en silencio:

  1. Disponibilidad de un único backplane
  2. Tener una copia de los datos.

El backplane es un dispositivo técnicamente complejo que debe someterse a pruebas exhaustivas durante su producción. Y por lo tanto, hay casos extremadamente raros en los que falla por completo. Sin embargo, incluso en el caso de problemas parciales, como una ranura de unidad que no funciona, será necesario reemplazarla con un apagado completo del sistema de almacenamiento.

Crear múltiples copias de datos tampoco es un problema a primera vista. Por ejemplo, la funcionalidad Clonar en los sistemas de almacenamiento, que permite actualizar una copia completa de los datos en determinados intervalos, está bastante extendida. Sin embargo, en caso de problemas con la misma reproducción, la copia no estará disponible como el original.

Una solución completamente obvia para superar estas deficiencias es la replicación a otro sistema de almacenamiento. Si cerramos los ojos ante la esperada duplicación del coste del hardware (todavía asumimos que las personas que eligen tal decisión piensan adecuadamente y aceptan este hecho de antemano), todavía habrá posibles costos para organizar la replicación en forma de licencias, adicionales software y hardware. Y lo más importante: deberá garantizar de alguna manera la coherencia de los datos replicados. Aquellos. cree un virtualizador de almacenamiento/vSAN/etc., lo que también requiere recursos de dinero y tiempo.

AccelStor Al crear nuestros sistemas de alta disponibilidad, nos fijamos el objetivo de eliminar las deficiencias mencionadas anteriormente. Así surgió la interpretación de la tecnología Shared Nothing, que en términos generales significa "sin el uso de dispositivos compartidos".

Concepto Nada compartido La arquitectura representa el uso de dos nodos independientes (controladores), cada uno de los cuales tiene su propio conjunto de datos. La replicación síncrona se produce entre nodos a través de la interfaz InfiniBand 56G, completamente transparente para el software que se ejecuta en la parte superior del sistema de almacenamiento. Como resultado, no es necesario el uso de virtualizadores de almacenamiento, agentes de software, etc.

Físicamente, la solución de dos nodos de AccelStor se puede implementar en dos modelos:

  • H510 — basado en servidores gemelos en una caja de 2U, si se requiere un rendimiento moderado y una capacidad de hasta 22 TB;
  • H710 — basado en servidores individuales de 2U, si se requiere alto rendimiento y gran capacidad (hasta 57 TB).

Reduzca los riesgos de tiempo de inactividad con la arquitectura Shared Nothing

Modelo H510 basado en servidor Twin

Reduzca los riesgos de tiempo de inactividad con la arquitectura Shared Nothing

Modelo H710 basado en servidores individuales

El uso de diferentes factores de forma se debe a la necesidad de diferentes números de SSD para lograr un volumen y rendimiento determinados. Además, la plataforma Twin es más barata y permite ofrecer soluciones más asequibles, aunque con alguna "desventaja" condicional en forma de un único backplane. Todo lo demás, incluidos los principios operativos, es completamente idéntico en ambos modelos.

El conjunto de datos para cada nodo tiene dos grupos. FlexiRemap, más 2 repuestos activos. Cada grupo es capaz de resistir la falla de un SSD. Todas las solicitudes entrantes para registrar un nodo de acuerdo con ideología FlexiRemap reconstruye bloques de 4 KB en cadenas secuenciales, que luego se escriben en el SSD en el modo que les resulte más cómodo (grabación secuencial). Además, el anfitrión recibe una confirmación de grabación solo después de que los datos se colocan físicamente en el SSD, es decir, sin almacenamiento en caché en RAM. El resultado es un rendimiento impresionante de hasta 600 1 IOPS de escritura y más de 710 millón de IOPS de lectura (modelo HXNUMX).

Como se mencionó anteriormente, los conjuntos de datos se sincronizan en tiempo real a través de la interfaz InfiniBand 56G, que tiene un alto rendimiento y baja latencia. Para hacer el uso más eficiente del canal de comunicación al transmitir paquetes pequeños. Porque Sólo hay un canal de comunicación; se utiliza un enlace dedicado de 1 GbE para comprobar la frecuencia cardíaca adicional. A través de él solo se transmiten los latidos del corazón, por lo que no existen requisitos de características de velocidad.

En caso de aumentar la capacidad del sistema (hasta más de 400 TB) debido a estantes de expansión también están conectados en pares para mantener el concepto de “ningún punto único de falla”.

Para una protección de datos adicional (además del hecho de que AccelStor ya tiene dos copias), se utiliza un algoritmo de comportamiento especial en caso de falla de cualquier SSD. Si el SSD falla, el nodo comenzará a reconstruir datos en una de las unidades de repuesto. El grupo FlexiRemap, que se encuentra en estado degradado, cambiará al modo de solo lectura. Esto se hace para eliminar la interferencia entre las operaciones de escritura y reconstrucción en el disco de respaldo, lo que en última instancia acelera el proceso de recuperación y reduce el tiempo en que el sistema es potencialmente vulnerable. Al finalizar la reconstrucción, el nodo vuelve al modo normal de lectura y escritura.

Reduzca los riesgos de tiempo de inactividad con la arquitectura Shared Nothing

Por supuesto, al igual que otros sistemas, durante la reconstrucción el rendimiento general disminuye (después de todo, uno de los grupos FlexiRemap no funciona para grabar). Pero el proceso de recuperación en sí ocurre lo más rápido posible, lo que distingue a los sistemas AccelStor de las soluciones de otros proveedores.

Otra propiedad útil de la tecnología de arquitectura Nothing Shared es el funcionamiento de los nodos en el llamado modo verdadero activo-activo. A diferencia de la arquitectura “clásica”, donde solo un controlador posee un volumen/grupo específico y el segundo simplemente realiza operaciones de E/S, en los sistemas AccelStor cada nodo trabaja con su propio conjunto de datos y no transmite solicitudes a su "vecino". Como resultado, el rendimiento general del sistema mejora debido al procesamiento paralelo de solicitudes de E/S por parte de los nodos y el acceso a las unidades. Además, prácticamente no existe la conmutación por error, ya que simplemente no hay necesidad de transferir el control de los volúmenes a otro nodo en caso de falla.

Si comparamos la tecnología de arquitectura Nothing Shared con la duplicación completa de un sistema de almacenamiento, entonces, a primera vista, será ligeramente inferior en flexibilidad a la implementación completa de la recuperación ante desastres. Esto es especialmente cierto para organizar una línea de comunicación entre sistemas de almacenamiento. Así, en el modelo H710 es posible distribuir nodos a una distancia de hasta 100 m mediante el uso de cables ópticos activos InfiniBand no muy económicos. Pero incluso si se compara con la implementación habitual de replicación síncrona de otros proveedores a través de un FibreChannel disponible, incluso en distancias más largas, la solución de AccelStor será más barata y más fácil de instalar/operar, porque no es necesario instalar virtualizadores de almacenamiento ni integrarlos con software (lo que, en principio, no siempre es posible). Además, no olvide que las soluciones AccelStor son matrices All Flash con un rendimiento superior al de los sistemas de almacenamiento “clásicos” solo con SSD.

Reduzca los riesgos de tiempo de inactividad con la arquitectura Shared Nothing

Cuando se utiliza la arquitectura Nothing Shared de AccelStor, es posible lograr una disponibilidad del sistema de almacenamiento del 99.9999% a un costo muy razonable. Además de la alta confiabilidad de la solución, incluso mediante el uso de dos copias de datos, y un rendimiento impresionante gracias a algoritmos propietarios FlexiRemap, soluciones de AccelStor son excelentes candidatos para puestos clave en la construcción de un centro de datos moderno.

Fuente: habr.com

Añadir un comentario