Reduza os riscos de tempo de inatividade com a arquitetura Shared Nothing

O tema da tolerância a falhas em sistemas de armazenamento de dados é sempre relevante, pois em nossa era de virtualização generalizada e consolidação de recursos, os sistemas de armazenamento são o elo cuja falha levará não apenas a um acidente comum, mas a uma inatividade prolongada dos serviços. Portanto, os sistemas de armazenamento modernos contêm muitos componentes duplicados (até mesmo controladores). Mas será que tal proteção é suficiente?

Reduza os riscos de tempo de inatividade com a arquitetura Shared Nothing

Absolutamente todos os fornecedores, ao listarem as características dos sistemas de armazenamento, sempre mencionam a alta tolerância a falhas de suas soluções, acrescentando sempre o termo “sem um único ponto de falha”. Vamos dar uma olhada em um sistema de armazenamento típico. Para evitar tempo de inatividade na manutenção, o sistema de armazenamento duplica fontes de alimentação, módulos de refrigeração, portas de entrada/saída, unidades (queremos dizer RAID) e, claro, controladores. Se você olhar atentamente para esta arquitetura, notará pelo menos dois possíveis pontos de falha, que são modestamente mantidos em silêncio:

  1. Disponibilidade de um único backplane
  2. Ter uma cópia dos dados

O backplane é um dispositivo tecnicamente complexo que deve passar por testes sérios durante a produção. E, portanto, há casos extremamente raros em que falha completamente. No entanto, mesmo no caso de problemas parciais, como um slot de unidade que não funciona, será necessário substituí-lo com um desligamento completo do sistema de armazenamento.

Criar múltiplas cópias de dados também não é um problema à primeira vista. Por exemplo, a funcionalidade Clone em sistemas de armazenamento, que permite atualizar uma cópia completa dos dados em alguns intervalos, é bastante difundida. Porém, em caso de problemas com o mesmo backplay, a cópia ficará tão indisponível quanto o original.

Uma solução completamente óbvia para superar essas deficiências é a replicação para outro sistema de armazenamento. Se fecharmos os olhos à esperada duplicação do custo do hardware (ainda assumimos que as pessoas que escolhem tal decisão pensam adequadamente e aceitam este facto antecipadamente), ainda haverá custos possíveis para organizar a replicação na forma de licenças, adicionais software e hardware. E o mais importante, você precisará garantir de alguma forma a consistência dos dados replicados. Aqueles. construir um virtualizador de armazenamento/vSAN/etc., que também requer recursos de dinheiro e tempo.

AccelStor Ao criar nossos sistemas de alta disponibilidade, estabelecemos uma meta para eliminar as deficiências mencionadas acima. Foi assim que surgiu a interpretação da tecnologia Shared Nothing, que traduzida livremente significa “sem o uso de dispositivos compartilhados”.

Conceito Nada compartilhado A arquitetura representa o uso de dois nós independentes (controladores), cada um dos quais possui seu próprio conjunto de dados. A replicação síncrona ocorre entre nós por meio da interface InfiniBand 56G, completamente transparente para o software executado no sistema de armazenamento. Como resultado, o uso de virtualizadores de armazenamento, agentes de software, etc. não é necessário.

Fisicamente, a solução de dois nós da AccelStor pode ser implementada em dois modelos:

  • H510 — baseado em servidores Twin em um gabinete 2U, se for necessário desempenho moderado e capacidade de até 22 TB;
  • H710 — baseado em servidores individuais de 2U, se for necessário alto desempenho e grande capacidade (até 57 TB).

Reduza os riscos de tempo de inatividade com a arquitetura Shared Nothing

Modelo H510 baseado em servidor Twin

Reduza os riscos de tempo de inatividade com a arquitetura Shared Nothing

Modelo H710 baseado em servidores individuais

O uso de diferentes formatos se deve à necessidade de diferentes números de SSDs para atingir um determinado volume e desempenho. Além disso, a plataforma Twin é mais barata e permite oferecer soluções mais acessíveis, embora com alguma “desvantagem” condicional na forma de um único backplane. Todo o resto, incluindo os princípios operacionais, é completamente idêntico para ambos os modelos.

O conjunto de dados para cada nó possui dois grupos FlexiRemap, mais 2 peças sobressalentes. Cada grupo é capaz de resistir à falha de um SSD. Todas as solicitações recebidas para registrar um nó de acordo com ideologia FlexiRemap reconstrói blocos de 4 KB em cadeias sequenciais, que são então gravadas no SSD no modo mais confortável para eles (gravação sequencial). Além disso, o host recebe uma confirmação de gravação somente depois que os dados são colocados fisicamente no SSD, ou seja, sem cache na RAM. O resultado é um desempenho impressionante de gravação de até 600 mil IOPS e leitura de mais de 1 milhão de IOPS (modelo H710).

Conforme mencionado anteriormente, os conjuntos de dados são sincronizados em tempo real por meio da interface InfiniBand 56G, que possui alto rendimento e baixa latência. Para fazer o uso mais eficiente do canal de comunicação na transmissão de pequenos pacotes. Porque há apenas um canal de comunicação; um link dedicado de 1 GbE é usado para verificação adicional da frequência cardíaca. Apenas os batimentos cardíacos são transmitidos através dele, portanto não há requisitos para características de velocidade.

Em caso de aumento da capacidade do sistema (até 400+ TB) devido a prateleiras de expansão eles também estão conectados em pares para manter o conceito de “nenhum ponto único de falha”.

Para proteção adicional dos dados (além do AccelStor já possuir duas cópias), um algoritmo de comportamento especial é utilizado em caso de falha de algum SSD. Se o SSD falhar, o nó começará a reconstruir os dados em uma das unidades sobressalentes. O grupo FlexiRemap, que está no estado degradado, mudará para o modo somente leitura. Isso é feito para eliminar a interferência entre as operações de gravação e reconstrução no disco de backup, o que acelera o processo de recuperação e reduz o tempo em que o sistema fica potencialmente vulnerável. Após a conclusão da reconstrução, o nó retorna ao modo normal de leitura e gravação.

Reduza os riscos de tempo de inatividade com a arquitetura Shared Nothing

É claro que, como outros sistemas, durante a reconstrução, o desempenho geral diminui (afinal, um dos grupos FlexiRemap não funciona para gravação). Mas o próprio processo de recuperação ocorre o mais rápido possível, o que distingue os sistemas AccelStor das soluções de outros fornecedores.

Outra propriedade útil da tecnologia de arquitetura Nothing Shared é a operação de nós no chamado modo ativo-ativo verdadeiro. Ao contrário da arquitetura “clássica”, onde apenas um controlador possui um volume/pool específico, e o segundo simplesmente executa operações de E/S, em sistemas AccelStor cada nó trabalha com seu próprio conjunto de dados e não transmite solicitações ao seu “vizinho”. Como resultado, o desempenho geral do sistema é melhorado devido ao processamento paralelo de solicitações de E/S pelos nós e ao acesso aos drives. Também praticamente não existe failover, já que simplesmente não há necessidade de transferir o controle dos volumes para outro nó no caso de uma falha.

Se compararmos a tecnologia da arquitetura Nothing Shared com a duplicação completa do sistema de armazenamento, então, à primeira vista, será ligeiramente inferior à implementação completa da recuperação de desastres em termos de flexibilidade. Isto é especialmente verdadeiro para organizar uma linha de comunicação entre sistemas de armazenamento. Assim, no modelo H710 é possível espalhar nós em uma distância de até 100m através do uso de cabos ópticos ativos InfiniBand não muito baratos. Mas mesmo se comparada com a implementação habitual de replicação síncrona de outros fornecedores através de um FibreChannel disponível, mesmo em distâncias maiores, a solução da AccelStor será mais barata e mais fácil de instalar/operar, porque não há necessidade de instalar virtualizadores de armazenamento e/ou integração com software (o que nem sempre é possível em princípio). Além disso, não esqueça que as soluções AccelStor são arrays All Flash com desempenho superior ao dos sistemas de armazenamento “clássicos” apenas com SSD.

Reduza os riscos de tempo de inatividade com a arquitetura Shared Nothing

Ao usar a arquitetura Nothing Shared do AccelStor, é possível atingir 99.9999% de disponibilidade do sistema de armazenamento a um custo bastante razoável. Juntamente com a alta confiabilidade da solução, inclusive através do uso de duas cópias de dados, e desempenho impressionante graças a algoritmos proprietários FlexiRemap, soluções de AccelStor são excelentes candidatos para posições-chave na construção de um data center moderno.

Fonte: habr.com

Adicionar um comentário