Fonctionnalités de la hiérarchisation automatique dans les systèmes de stockage Qsan XCubeSAN

Poursuivre l'étude des technologies permettant d'accélérer les opérations d'E/S appliquées aux systèmes de stockage, commencées en article précédent, on ne peut s'empêcher de s'attarder sur une option aussi populaire que la hiérarchisation automatique. Bien que l'idéologie de cette fonction soit très similaire chez les différents fabricants de systèmes de stockage, nous examinerons les caractéristiques de la mise en œuvre de la hiérarchisation à l'aide d'un exemple. Système de stockage Qsan.

Fonctionnalités de la hiérarchisation automatique dans les systèmes de stockage Qsan XCubeSAN

Malgré la variété des données stockées sur les systèmes de stockage, ces mêmes données peuvent être divisées en plusieurs groupes en fonction de leur demande (fréquence d'utilisation). Les données les plus populaires (« chaudes ») doivent être accessibles le plus rapidement possible, tandis que les données moins utilisées (« froides ») peuvent être traitées avec une priorité moindre.

Pour organiser un tel schéma, la fonctionnalité de hiérarchisation est utilisée. Dans ce cas, la matrice de données n'est pas constituée de disques du même type, mais de plusieurs groupes de lecteurs qui forment différents niveaux de stockage. À l'aide d'un algorithme spécial, les données sont automatiquement déplacées entre les niveaux pour garantir des performances globales maximales.

Fonctionnalités de la hiérarchisation automatique dans les systèmes de stockage Qsan XCubeSAN

Espace de rangement Qsan prend en charge jusqu'à trois niveaux de stockage :

  • Niveau 1 : SSD, performances maximales
  • Niveau 2 : disque dur SAS 10K/15K, hautes performances
  • Niveau 3 : disque dur NL-SAS 7.2K, capacité maximale

Un pool de hiérarchisation automatique peut contenir les trois niveaux, ou seulement deux dans n'importe quelle combinaison. Au sein de chaque niveau, les disques sont regroupés en groupes RAID familiers. Pour une flexibilité maximale, le niveau RAID de chaque niveau peut être différent. Autrement dit, rien ne vous empêche d'organiser une structure comme 4x SSD RAID10 + 6x HDD 10K RAID5 + 12 HDD 7.2K RAID6

Après avoir créé des volumes (disques virtuels) sur Hiérarchisation automatique Le pool dessus commence la collecte en arrière-plan de statistiques sur toutes les opérations d'E/S. Pour ce faire, l'espace est « découpé » en blocs de 1 Go (ce qu'on appelle le sous LUN). A chaque accès à un tel bloc, un coefficient de 1 lui est attribué. Puis, au fil du temps, ce coefficient diminue. Après 24 heures, s'il n'y a pas de requêtes d'E/S vers ce bloc, il sera déjà égal à 0.5 et continuera à baisser toutes les heures suivantes.

À un moment donné (par défaut, tous les jours à minuit), les résultats collectés sont classés par activité de sous-LUN en fonction de leurs coefficients. Sur cette base, une décision est prise quels blocs déplacer et dans quelle direction. Après quoi, en fait, la relocalisation des données entre les niveaux se produit.

Fonctionnalités de la hiérarchisation automatique dans les systèmes de stockage Qsan XCubeSAN

Le système de stockage Qsan met parfaitement en œuvre la gestion du processus de hiérarchisation à l'aide de nombreux paramètres, ce qui permet de configurer de manière très flexible les performances finales de la baie.

Pour déterminer l'emplacement initial des données et la direction prioritaire de leur mouvement, des politiques sont utilisées qui sont définies séparément pour chaque volume :

  • Hiérarchisation automatique – la politique par défaut, le placement initial et la direction des mouvements sont déterminés automatiquement, c'est-à-dire les données « chaudes » tendent vers le niveau supérieur et les données « froides » descendent. Le placement initial est sélectionné en fonction de l'espace disponible à chaque niveau. Mais vous devez comprendre que le système s'efforce avant tout d'utiliser au maximum les disques les plus rapides. Par conséquent, s’il y a de l’espace libre, les données seront placées aux niveaux supérieurs. Cette politique convient à la plupart des scénarios dans lesquels la demande de données ne peut pas être prévue à l'avance.
  • Commencez par High, puis Auto Tiering – la différence avec le précédent réside uniquement dans l’emplacement initial des données (au niveau le plus rapide)
  • Plus haut niveau – les données s’efforcent toujours d’occuper le niveau le plus rapide. S'ils sont abaissés pendant le fonctionnement, ils sont reculés dès que possible. Cette politique convient aux données qui nécessitent un accès le plus rapide possible.
  • Niveau minimum – les données ont toujours tendance à occuper le niveau le plus bas. Cette stratégie est idéale pour les données rarement utilisées (par exemple, les archives).
  • Pas de déménagement – le système détermine automatiquement l'emplacement d'origine des données et ne les déplace pas. Toutefois, des statistiques continuent d'être collectées au cas où leur relocalisation serait ultérieurement nécessaire.

Il convient de noter que même si les politiques sont définies lors de la création de chaque volume, elles peuvent être modifiées à plusieurs reprises à la volée tout au long du cycle de vie du système.

Outre les politiques relatives au mécanisme de hiérarchisation, la fréquence et le rythme du mouvement des données entre les niveaux sont également configurés. Vous pouvez définir une durée de trajet spécifique : quotidiennement ou certains jours de la semaine, et également réduire l'intervalle de collecte des statistiques à plusieurs heures (fréquence minimale - 2 heures). Si vous devez limiter le temps nécessaire pour effectuer une opération de déplacement de données, vous pouvez définir un délai (fenêtre de déplacement). De plus, la vitesse de relocalisation est également indiquée - 3 modes : rapide, moyen, lent.

Fonctionnalités de la hiérarchisation automatique dans les systèmes de stockage Qsan XCubeSAN

S'il est nécessaire de déplacer immédiatement les données, il est possible de l'effectuer manuellement à tout moment sur commande de l'administrateur.

Il est clair que plus les données sont déplacées souvent et rapidement entre les niveaux, plus le système de stockage sera flexible pour s'adapter aux conditions de fonctionnement actuelles. Mais en même temps, il convient de rappeler que le déplacement représente une charge supplémentaire (principalement sur les disques), vous ne devez donc pas « piloter » les données sauf en cas d'absolue nécessité. Il est préférable de planifier le mouvement à des moments de charge minimale. Si le fonctionnement du système de stockage nécessite constamment des performances élevées 24h/7 et XNUMXj/XNUMX, il vaut la peine de réduire le taux de relocalisation au minimum.

L'abondance des paramètres de prise de vue plaira sans aucun doute aux utilisateurs avancés. Cependant, pour ceux qui découvrent une telle technologie pour la première fois, il n’y a pas de quoi s’inquiéter. Il est tout à fait possible de se fier aux paramètres par défaut (politique d'Auto Tiering, déplacement à vitesse maximale une fois par jour la nuit) et, au fur et à mesure que les statistiques s'accumulent, d'ajuster certains paramètres pour obtenir le résultat souhaité.

En comparant le déchirement avec une technologie tout aussi populaire pour augmenter la productivité comme Mise en cache SSD, vous devez vous rappeler les différents principes de fonctionnement de leurs algorithmes.

Mise en cache SSD
Hiérarchisation automatique

Vitesse d'apparition de l'effet
Presque instantanément. Mais l’effet notable ne se produit qu’après que le cache ait été « réchauffé » (de quelques minutes à quelques heures).
Après avoir collecté les statistiques (à partir de 2 heures, idéalement une journée) plus le temps de déplacer les données

Durée de l'effet
Jusqu'à ce que les données soient supplantées par une nouvelle portion (minutes-heures)
Pendant que les données sont demandées (XNUMX heures ou plus)

Indications d'utilisation
Gains de performances instantanés à court terme (bases de données, environnements de virtualisation)
Productivité accrue sur une longue période (serveurs de fichiers, web, mail)

En outre, l'une des caractéristiques de la hiérarchisation est la possibilité de l'utiliser non seulement pour des scénarios tels que « SSD + HDD », mais également « HDD rapide + HDD lent » ou même les trois niveaux, ce qui est fondamentalement impossible lors de l'utilisation de la mise en cache SSD.

Test

Pour tester les performances des algorithmes de hiérarchisation, nous avons effectué un test simple. Un pool de deux niveaux SSD (RAID 1) + HDD 7.2K (RAID1) a été créé, sur lequel un volume avec une politique de « niveau minimum » a été placé. Ceux. Les données doivent toujours être situées sur des disques lents.

Fonctionnalités de la hiérarchisation automatique dans les systèmes de stockage Qsan XCubeSAN

Fonctionnalités de la hiérarchisation automatique dans les systèmes de stockage Qsan XCubeSAN

L'interface de gestion montre clairement le placement des données entre les niveaux

Après avoir rempli le volume avec des données, nous avons modifié la politique de placement en Auto Tiering et exécuté le test IOmeter.

Fonctionnalités de la hiérarchisation automatique dans les systèmes de stockage Qsan XCubeSAN

Après plusieurs heures de tests, lorsque le système a pu accumuler des statistiques, le processus de relocalisation a commencé.

Fonctionnalités de la hiérarchisation automatique dans les systèmes de stockage Qsan XCubeSAN

Une fois le déplacement des données terminé, notre volume de test a complètement « exploré » jusqu'au niveau supérieur (SSD).

Fonctionnalités de la hiérarchisation automatique dans les systèmes de stockage Qsan XCubeSAN

Fonctionnalités de la hiérarchisation automatique dans les systèmes de stockage Qsan XCubeSAN

Verdict

La hiérarchisation automatique est une technologie merveilleuse qui vous permet d'augmenter les performances d'un système de stockage avec des coûts de matériel et de temps minimes grâce à une utilisation plus intensive de disques à grande vitesse. Appliqué à Qsan le seul investissement est une licence, qui s'achète une fois pour toutes sans restrictions sur le volume/nombre de disques/étagères/etc. Cette fonctionnalité est dotée de paramètres si riches qu'elle peut satisfaire presque toutes les tâches professionnelles. Et la visualisation des processus dans l'interface vous permettra de gérer efficacement l'appareil.

Source: habr.com

Ajouter un commentaire