Recursos de hierarquização automática em sistemas de armazenamento Qsan XCubeSAN

Continuando a considerar tecnologias para acelerar operações de E/S aplicadas a sistemas de armazenamento, iniciadas em artigo anterior, não se pode deixar de insistir em uma opção tão popular como o Auto Tiering. Embora a ideologia desta função seja muito semelhante entre vários fabricantes de sistemas de armazenamento, consideraremos os recursos de implementação de camadas usando um exemplo Sistema de armazenamento Qsan.

Recursos de hierarquização automática em sistemas de armazenamento Qsan XCubeSAN

Apesar da variedade de dados armazenados nos sistemas de armazenamento, esses mesmos dados podem ser divididos em vários grupos com base na sua demanda (frequência de uso). Os dados mais populares (“quentes”) precisam ser acessados ​​o mais rápido possível, enquanto os dados menos utilizados (“frios”) podem ser processados ​​com uma prioridade mais baixa.

Para organizar tal esquema, a funcionalidade de camadas é usada. A matriz de dados, neste caso, não consiste em discos do mesmo tipo, mas em vários grupos de unidades que formam diferentes níveis de armazenamento. Usando um algoritmo especial, os dados são movidos automaticamente entre os níveis para garantir o máximo desempenho geral.

Recursos de hierarquização automática em sistemas de armazenamento Qsan XCubeSAN

Armazenar Qsan suporta até três níveis de armazenamento:

  • Camada 1: SSD, desempenho máximo
  • Camada 2: HDD SAS 10K/15K, alto desempenho
  • Camada 3: HDD NL-SAS 7.2K, capacidade máxima

Um pool de classificação automática por níveis pode conter todos os três níveis ou apenas dois em qualquer combinação. Dentro de cada camada, as unidades são combinadas em grupos RAID familiares. Para máxima flexibilidade, o nível de RAID em cada camada pode ser diferente. Ou seja, por exemplo, nada impede que você organize uma estrutura como 4x SSD RAID10 + 6x HDD 10K RAID5 + 12 HDD 7.2K RAID6

Depois de criar volumes (discos virtuais) em Hierarquização automática pool nele inicia a coleta de estatísticas em segundo plano sobre todas as operações de E/S. Para isso, o espaço é “cortado” em blocos de 1GB (os chamados sub LUN). Cada vez que tal bloco é acessado, é atribuído a ele um coeficiente de 1. Então, com o tempo, esse coeficiente diminui. Após 24 horas, se não houver solicitações de I/O para este bloco, ele já será igual a 0.5 e continuará caindo a cada hora subsequente.

Em um determinado momento (por padrão, todos os dias à meia-noite), os resultados coletados são classificados por atividade de subLUN com base em seus coeficientes. Com base nisso, é tomada uma decisão sobre quais blocos mover e em que direção. Depois disso, de fato, ocorre a realocação dos dados entre os níveis.

Recursos de hierarquização automática em sistemas de armazenamento Qsan XCubeSAN

O sistema de armazenamento Qsan implementa perfeitamente o gerenciamento do processo de hierarquização usando vários parâmetros, o que permite configurar com muita flexibilidade o desempenho final do array.

Para determinar a localização inicial dos dados e a direção prioritária de sua movimentação, são utilizadas políticas definidas separadamente para cada volume:

  • Hierarquização automática – a política padrão, a colocação inicial e a direção dos movimentos são determinadas automaticamente, ou seja, os dados “quentes” tendem para o nível superior e os dados “frios” descem. A colocação inicial é selecionada com base no espaço disponível em cada nível. Mas você precisa entender que o sistema se esforça principalmente para aproveitar ao máximo as unidades mais rápidas. Portanto, se houver espaço livre, os dados serão colocados nos níveis superiores. Esta política é adequada para a maioria dos cenários onde a procura de dados não pode ser prevista antecipadamente.
  • Comece com classificação alta e depois automática – a diferença do anterior está apenas na localização inicial dos dados (no nível mais rápido)
  • Mais alto nível – os dados sempre se esforçam para ocupar o nível mais rápido. Se eles forem movidos para baixo durante a operação, eles serão movidos para trás assim que possível. Esta política é adequada para dados que requerem o acesso mais rápido possível.
  • Nível mínimo – os dados tendem sempre a ocupar o nível mais baixo. Esta política é ótima para dados raramente usados ​​(por exemplo, arquivos).
  • Sem movimento – o sistema determina automaticamente a localização original dos dados e não os move. No entanto, as estatísticas continuam a ser recolhidas caso a sua relocalização seja posteriormente necessária.

Vale a pena notar que, embora as políticas sejam definidas quando cada volume é criado, elas podem ser alteradas repetidamente durante todo o ciclo de vida do sistema.

Além das políticas para o mecanismo de hierarquização, a frequência e o ritmo da movimentação de dados entre os níveis também são configurados. Você pode definir um tempo de viagem específico: diariamente ou em determinados dias da semana, e também reduzir o intervalo de coleta de estatísticas para várias horas (frequência mínima - 2 horas). Se precisar limitar o tempo necessário para concluir uma operação de movimentação de dados, você poderá definir um período de tempo (janela para movimentação). Além disso, também é indicada a velocidade de realocação - 3 modos: rápido, médio, lento.

Recursos de hierarquização automática em sistemas de armazenamento Qsan XCubeSAN

Caso haja necessidade de realocação imediata dos dados, é possível realizá-la manualmente a qualquer momento por comando do administrador.

É claro que quanto mais frequentemente e mais rapidamente os dados forem movidos entre os níveis, mais flexível será o sistema de armazenamento para se adaptar às condições operacionais atuais. Mas, ao mesmo tempo, vale lembrar que a movimentação é uma carga adicional (principalmente em discos), portanto você não deve “dirigir” dados a menos que seja absolutamente necessário. É melhor planejar o movimento em horários de carga mínima. Se a operação do sistema de armazenamento exigir constantemente alto desempenho 24 horas por dia, 7 dias por semana, vale a pena reduzir a taxa de realocação ao mínimo.

A abundância de configurações de fotografia certamente agradará os usuários avançados. Porém, para quem encontra essa tecnologia pela primeira vez, não há com o que se preocupar. É bem possível confiar nas configurações padrão (política de Auto Tiering, mover-se na velocidade máxima uma vez por dia à noite) e, à medida que as estatísticas se acumulam, ajustar certos parâmetros para alcançar o resultado desejado.

Comparando o tearing com uma tecnologia igualmente popular para aumentar a produtividade como Cache SSD, você deve se lembrar dos diferentes princípios operacionais de seus algoritmos.

Cache SSD
Hierarquização automática

Velocidade de início do efeito
Quase instantaneamente. Mas o efeito perceptível ocorre somente após o cache ter sido “aquecido” (minutos a horas)
Depois de coletar estatísticas (a partir de 2 horas, de preferência um dia) mais tempo para mover os dados

Duração do efeito
Até que os dados sejam substituídos por uma nova porção (minutos-horas)
Enquanto os dados estiverem em demanda (XNUMX horas ou mais)

Indicações de uso
Ganhos instantâneos de desempenho a curto prazo (bancos de dados, ambientes de virtualização)
Aumento da produtividade por um longo período (servidores de arquivos, web, e-mail)

Além disso, uma das características do tiering é a possibilidade de utilizá-lo não apenas para cenários como “SSD + HDD”, mas também “HDD rápido + HDD lento” ou mesmo todos os três níveis, o que é basicamente impossível ao usar o cache SSD.

Teste

Para testar o desempenho dos algoritmos de hierarquização, realizamos um teste simples. Foi criado um pool de SSD de dois níveis (RAID 1) + HDD 7.2K (RAID1), no qual foi colocado um volume com política de “nível mínimo”. Aqueles. Os dados devem sempre estar localizados em discos lentos.

Recursos de hierarquização automática em sistemas de armazenamento Qsan XCubeSAN

Recursos de hierarquização automática em sistemas de armazenamento Qsan XCubeSAN

A interface de gerenciamento mostra claramente o posicionamento dos dados entre os níveis

Depois de preencher o volume com dados, alteramos a política de posicionamento para Auto Tiering e executamos o teste IOmeter.

Recursos de hierarquização automática em sistemas de armazenamento Qsan XCubeSAN

Após várias horas de testes, quando o sistema conseguiu acumular estatísticas, o processo de realocação começou.

Recursos de hierarquização automática em sistemas de armazenamento Qsan XCubeSAN

Após a conclusão da movimentação de dados, nosso volume de teste “rastejou” completamente para o nível superior (SSD).

Recursos de hierarquização automática em sistemas de armazenamento Qsan XCubeSAN

Recursos de hierarquização automática em sistemas de armazenamento Qsan XCubeSAN

Veredicto

Auto Tiering é uma tecnologia maravilhosa que permite aumentar o desempenho de um sistema de armazenamento com custos mínimos de material e tempo por meio do uso mais intensivo de unidades de alta velocidade. Aplicado a Qsan o único investimento é uma licença, que é adquirida de uma vez por todas, sem restrições de volume/número de discos/prateleiras/etc. Essa funcionalidade está equipada com configurações tão ricas que pode satisfazer quase todas as tarefas de negócios. E a visualização dos processos na interface permitirá que você gerencie o dispositivo de forma eficaz.

Fonte: habr.com

Adicionar um comentário