ProHoster > Blog > administración > Características de Auto Tiering en el sistema de almacenamiento Qsan XCubeSAN
Características de Auto Tiering en el sistema de almacenamiento Qsan XCubeSAN
Continuar considerando tecnologías para acelerar las operaciones de E/S aplicadas a los sistemas de almacenamiento, iniciadas en artículo anterior, uno no puede evitar insistir en una opción tan popular como el Auto Tiering. Aunque la ideología de esta función es muy similar entre varios fabricantes de sistemas de almacenamiento, consideraremos las características de la implementación de niveles usando un ejemplo. sistema de almacenamiento qsan.
A pesar de la variedad de datos almacenados en los sistemas de almacenamiento, estos mismos datos se pueden dividir en varios grupos en función de su demanda (frecuencia de uso). Es necesario acceder a los datos más populares (“calientes”) lo más rápido posible, mientras que los datos menos utilizados (“fríos”) pueden procesarse con menor prioridad.
Para organizar dicho esquema, se utiliza la funcionalidad de niveles. La matriz de datos en este caso no consta de discos del mismo tipo, sino de varios grupos de unidades que forman diferentes niveles de almacenamiento. Utilizando un algoritmo especial, los datos se mueven automáticamente entre niveles para garantizar el máximo rendimiento general.
Almacenamiento qsan Admite hasta tres niveles de almacenamiento:
Nivel 1: SSD, máximo rendimiento
Nivel 2: HDD SAS 10K/15K, alto rendimiento
Nivel 3: HDD NL-SAS 7.2K, capacidad máxima
Un grupo de Auto Tiering puede contener los tres niveles, o solo dos en cualquier combinación. Dentro de cada nivel, las unidades se combinan en grupos RAID familiares. Para lograr la máxima flexibilidad, el nivel RAID en cada nivel puede ser diferente. Es decir, por ejemplo, nada le impide organizar una estructura como 4x SSD RAID10 + 6x HDD 10K RAID5 + 12 HDD 7.2K RAID6
Después de crear volúmenes (discos virtuales) en Nivelación automática El grupo en él comienza la recopilación en segundo plano de estadísticas sobre todas las operaciones de E/S. Para ello, el espacio se “corta” en bloques de 1 GB (el llamado sub LUN). Cada vez que se accede a dicho bloque, se le asigna un coeficiente de 1. Luego, con el tiempo, este coeficiente disminuye. Después de 24 horas, si no hay solicitudes de E/S para este bloque, ya será igual a 0.5 y seguirá disminuyendo cada hora posterior.
En un momento determinado (de forma predeterminada, todos los días a medianoche), los resultados recopilados se clasifican por actividad de subLUN en función de sus coeficientes. En base a esto, se decide qué bloques moverse y en qué dirección. Después de lo cual, de hecho, se produce la reubicación de datos entre niveles.
El sistema de almacenamiento Qsan implementa perfectamente la gestión del proceso de niveles utilizando muchos parámetros, lo que le permite configurar de manera muy flexible el rendimiento final de la matriz.
Para determinar la ubicación inicial de los datos y la dirección prioritaria de su movimiento, se utilizan políticas que se establecen por separado para cada volumen:
Nivelación automática – la política predeterminada, la colocación inicial y la dirección de los movimientos se determinan automáticamente, es decir Los datos "calientes" tienden al nivel superior y los datos "fríos" bajan. La ubicación inicial se selecciona en función del espacio disponible en cada nivel. Pero es necesario comprender que el sistema se esfuerza principalmente por aprovechar al máximo las unidades más rápidas. Por tanto, si hay espacio libre, los datos se colocarán en los niveles superiores. Esta política es adecuada para la mayoría de escenarios en los que la demanda de datos no se puede predecir de antemano.
Comience con niveles altos y luego niveles automáticos – la diferencia con el anterior está solo en la ubicación inicial de los datos (en el nivel más rápido)
Nivel más alto – los datos siempre se esfuerzan por ocupar el nivel más rápido. Si se bajan durante el funcionamiento, se retroceden lo antes posible. Esta política es adecuada para datos que requieren el acceso más rápido posible.
Nivel mínimo – los datos siempre tienden a ocupar el nivel más bajo. Esta política es excelente para datos que se utilizan con poca frecuencia (por ejemplo, archivos).
Sin movimiento – el sistema determina automáticamente la ubicación original de los datos y no los mueve. Sin embargo, se siguen recopilando estadísticas por si posteriormente se requiere su reubicación.
Vale la pena señalar que, si bien las políticas se definen cuando se crea cada volumen, se pueden cambiar repetidamente sobre la marcha durante todo el ciclo de vida del sistema.
Además de las políticas para el mecanismo de niveles, también se configura la frecuencia y el ritmo del movimiento de datos entre niveles. Puede establecer un tiempo de viaje específico: diariamente o en ciertos días de la semana, y también reducir el intervalo de recopilación de estadísticas a varias horas (frecuencia mínima: 2 horas). Si necesita limitar el tiempo que lleva completar una operación de movimiento de datos, puede establecer un período de tiempo (ventana para el movimiento). Además, también se indica la velocidad de reubicación: 3 modos: rápido, medio, lento.
Si es necesario reubicar datos inmediatamente, es posible realizarlo manualmente en cualquier momento por orden del administrador.
Está claro que cuanto más a menudo y más rápido se muevan los datos entre niveles, más flexible será el sistema de almacenamiento para adaptarse a las condiciones operativas actuales. Pero al mismo tiempo, vale la pena recordar que mover es una carga adicional (principalmente en los discos), por lo que no debes "manejar" datos a menos que sea absolutamente necesario. Es mejor planificar el movimiento en momentos de carga mínima. Si el funcionamiento del sistema de almacenamiento requiere constantemente un alto rendimiento las 24 horas del día, los 7 días de la semana, entonces vale la pena reducir la tasa de reubicación al mínimo.
La abundancia de configuraciones de disparo sin duda complacerá a los usuarios avanzados. Sin embargo, aquellos que se topan con esta tecnología por primera vez no tienen nada de qué preocuparse. Es muy posible confiar en la configuración predeterminada (política de Auto Tiering, moverse a máxima velocidad una vez al día por la noche) y, a medida que se acumulan las estadísticas, ajustar ciertos parámetros para lograr el resultado requerido.
Comparando el desgarro con una tecnología igualmente popular para aumentar la productividad como Almacenamiento en caché SSD, conviene recordar los diferentes principios operativos de sus algoritmos.
Almacenamiento en caché SSD
Nivelación automática
Velocidad de inicio del efecto
Casi al instante. Pero el efecto perceptible es sólo después de que el caché se haya "calentado" (de minutos a horas)
Después de recopilar estadísticas (a partir de 2 horas, idealmente un día) más tiempo para mover los datos
Duración del efecto
Hasta que los datos sean suplantados por una nueva porción (minutos-horas)
Mientras los datos estén en demanda (XNUMX horas o más)
Indicaciones de uso
Ganancias instantáneas de rendimiento a corto plazo (bases de datos, entornos de virtualización)
Mayor productividad durante un largo período (archivos, web, servidores de correo)
Además, una de las características de la organización por niveles es la posibilidad de utilizarla no sólo para escenarios como “SSD + HDD”, sino también para “HDD rápido + HDD lento” o incluso los tres niveles, lo que es básicamente imposible cuando se utiliza el almacenamiento en caché SSD.
pruebas
Para probar el rendimiento de los algoritmos de niveles, realizamos una prueba sencilla. Se creó un pool de dos niveles SSD (RAID 1) + HDD 7.2K (RAID1), sobre el cual se colocó un volumen con una política de “nivel mínimo”. Aquellos. Los datos siempre deben ubicarse en discos lentos.
La interfaz de gestión muestra claramente la ubicación de los datos entre niveles.
Después de llenar el volumen con datos, cambiamos la política de ubicación a Auto Tiering y ejecutamos la prueba de IOmeter.
Después de varias horas de pruebas, cuando el sistema pudo acumular estadísticas, comenzó el proceso de reubicación.
Una vez completado el movimiento de datos, nuestro volumen de prueba "se arrastró" por completo hasta el nivel superior (SSD).
Veredicto
Auto Tiering es una tecnología maravillosa que le permite aumentar el rendimiento de un sistema de almacenamiento con costos mínimos de material y tiempo mediante un uso más intensivo de unidades de alta velocidad. Aplicado a qsan la única inversión es una licencia, que se compra de una vez por todas sin restricciones de volumen/número de discos/estanterías/etc. Esta funcionalidad está equipada con configuraciones tan ricas que pueden satisfacer casi cualquier tarea comercial. Y la visualización de procesos en la interfaz le permitirá gestionar eficazmente el dispositivo.