Sistemas de armazenamento definidos por software ou o que matou os dinossauros?

Sistemas de armazenamento definidos por software ou o que matou os dinossauros?

Eles já ocuparam o topo da cadeia alimentar. Por milhares de anos. E então aconteceu o impensável: o céu ficou coberto de nuvens e elas deixaram de existir. Do outro lado do mundo ocorreram acontecimentos que mudaram o clima: aumentou a nebulosidade. Os dinossauros tornaram-se demasiado grandes e demasiado lentos: as suas tentativas de sobreviver estavam fadadas ao fracasso. Os principais predadores governaram a Terra por 100 milhões de anos, tornando-se maiores e mais fortes. Eles evoluíram para o que parecia ser um ser perfeito no topo da cadeia alimentar, mas o universo mudou repentinamente a face do nosso planeta.

Ironicamente, foram as nuvens que exterminaram os dinossauros há 66 milhões de anos. Da mesma forma, as nuvens hoje estão destruindo os sistemas clássicos de armazenamento de dados no topo da cadeia alimentar. Em ambos os casos, o problema não eram as nuvens em si, mas a capacidade de adaptação a um mundo em mudança. No caso dos dinossauros, tudo aconteceu rapidamente: o efeito destrutivo das nuvens ocorreu dias ou semanas após a queda do meteorito (ou erupção vulcânica – a escolha da teoria é sua). No caso dos data warehouses clássicos, o processo leva anos, mas é, obviamente, irreversível.

Período Triássico: a idade do grande ferro e o surgimento de aplicações migratórias

Então o que aconteceu? O ecossistema existente incluía sistemas de armazenamento de nível básico e médio, sistemas de nível empresarial e armazenamento de conexão direta (DAS). Essas categorias foram determinadas por analistas e tinham volumes de mercado próprios, indicadores de custo, confiabilidade, desempenho e escalabilidade. E então algo estranho aconteceu.

O advento das máquinas virtuais significou que vários aplicativos poderiam ser executados simultaneamente em um único servidor, provavelmente entre vários proprietários – uma mudança que imediatamente questionou o futuro do armazenamento de conexão direta. Então, os proprietários das maiores infraestruturas de hiperescala (hiperescaladores): Facebook, Google, eBay, etc., cansados ​​de pagar grandes quantias de dinheiro por sistemas de armazenamento, desenvolveram seus próprios aplicativos que garantiam a disponibilidade de dados em servidores regulares em vez de grandes armazenamentos de “hardware”. sistemas. Então a Amazon introduziu algo estranho no mercado chamado Simple Storage Service, ou S3. Não é um bloco, não é um arquivo, mas algo fundamentalmente novo: tornou-se impossível comprar um sistema, tornou-se possível comprar apenas um serviço. Espere um minuto, o que é essa luz brilhante visível no céu? Outro asteróide?

Jurássico: a era dos “saurs bons o suficiente”

Entramos na fase de desenvolvimento do armazenamento com a ideologia de “bom o suficiente”. Os clientes de armazenamento, percebendo o que os hiperescaladores haviam feito, começaram a questionar a justiça dos custos adicionais dez ou até cem vezes maiores que o hardware que pagavam pelos seus sistemas de armazenamento corporativo. Os arrays de nível médio começaram a ganhar participação de mercado em relação aos sistemas de nível superior. Produtos como HPE3PAR apresentou rápido crescimento. O EMC Symmetrix, o array de classe empresarial que já foi dominante, ainda detinha algum território, mas estava diminuindo rapidamente. Muitos usuários começaram a migrar seus dados para a AWS.

Por outro lado, os inovadores de armazenamento começaram a tomar emprestadas ideias de hiperescaladores, usando tecnologias de sistemas distribuídos e escaláveis ​​horizontalmente – uma ideologia oposta ao escalonamento vertical. Espera-se que o novo software de armazenamento seja capaz de rodar em servidores regulares, assim como os hiperescaladores. Não mais de 10 a 100 vezes o custo do próprio equipamento. Em teoria, você pode usar qualquer servidor - a escolha depende das suas preferências. A era do armazenamento definido por software (SDS) começou: as nuvens obscureceram os céus, as temperaturas caíram e a população de predadores de ponta começou a diminuir.

O período Cretáceo: o início da evolução dos sistemas de armazenamento definidos por software

Os primeiros dias do armazenamento definido por software foram inebriantes. Muito foi prometido, mas pouco foi entregue. Ao mesmo tempo, ocorreu uma importante mudança tecnológica: a memória flash tornou-se a alternativa moderna à ferrugem giratória (HDD). Este foi um período de muitas startups de armazenamento e dinheiro de capital de risco fácil de manusear. Tudo seria ótimo se não fosse por um problema: o armazenamento de dados requer uma consideração séria. Acontece que os clientes adoram seus dados. Se eles perderem o acesso a ele, ou se alguns bits ruins forem encontrados em terabytes de dados, eles se preocuparão e se preocuparão muito. A maioria das startups não sobreviveu. Os clientes receberam funcionalidades interessantes, mas nem tudo deu certo com as ferramentas básicas. Receita ruim.

Período Cenozóico: maciços de armazenamento dominam

Poucas pessoas falam sobre o que aconteceu depois, porque não é muito interessante - os clientes continuam comprando os mesmos storage arrays clássicos. É claro que aqueles que migraram seus aplicativos para as nuvens também migraram seus dados para lá. Mas para a grande maioria dos clientes que não desejam migrar completamente para a nuvem, ou não desejam migrar de forma alguma, a mesma Hewlett Packard Enterprise continuou a oferecer arrays clássicos.

Estamos em 2019, então por que ainda existe um negócio de armazenamento multibilionário baseado na tecnologia Y2K? Porque eles funcionam! Simplificando, os requisitos das aplicações de missão crítica não estavam sendo atendidos pelos produtos criados na onda do hype. Produtos como o HPE 3PAR continuam sendo as melhores opções para clientes corporativos, e a nova evolução da arquitetura HPE 3PAR é HPE First – isso apenas confirma isso.

Por sua vez, as capacidades dos sistemas de armazenamento definidos por software eram excelentes: escalabilidade horizontal, utilização de servidores padrão... Mas o preço para isso foi: disponibilidade instável, desempenho imprevisível e regras específicas de escalabilidade.

A complexidade dos requisitos do cliente é que eles nunca ficam mais simples. Ninguém dirá que a perda de integridade dos dados ou o aumento do tempo de inatividade é aceitável. É por isso que uma arquitetura que atenda simultaneamente aos requisitos dos data centers modernos em rápida evolução e que, na busca por um compromisso, não seja desprovida das principais características dos sistemas de armazenamento de classe empresarial, é tão importante para os sistemas de armazenamento.

Período terciário: surgimento de novas formas de vida

Vamos tentar descobrir como um dos recém-chegados ao mercado de armazenamento - Datera - conseguiu lidar com uma mistura tão difícil de requisitos historicamente estabelecidos e novos para sistemas de armazenamento. Em primeiro lugar, através da implementação de uma arquitetura focada na resolução do dilema acima descrito. É impossível modificar uma arquitetura legada para enfrentar os desafios de um data center moderno, assim como é impossível modificar uma arquitetura média de armazenamento definida por software para atender aos requisitos de sistemas de classe empresarial: os dinossauros não se tornaram mamíferos porque a temperatura derrubado.

Construir uma solução que atenda aos requisitos de armazenamento de nível empresarial e, ao mesmo tempo, aproveitar ao máximo a agilidade do data center moderno não é uma tarefa fácil, mas foi exatamente isso que a Datera se propôs a fazer. Os especialistas da Datera têm trabalhado nisso há cinco anos e encontraram uma receita para “preparar” o armazenamento definido por software de classe empresarial.

A principal dificuldade que o Datera encontrou foi que ele teve que usar o operador lógico "AND" em vez do muito mais simples "OR". Disponibilidade consistente, E desempenho previsível, E escalabilidade arquitetônica, E orquestração como código, E hardware padronizado, E aplicação de políticas, E flexibilidade, E gerenciamento orientado por análises, “E” segurança, “E” integração com ecossistemas abertos. O operador lógico “AND” tem um caractere a mais que “OR” - esta é a principal diferença.

Período quaternário: data centers modernos e mudanças climáticas repentinas predeterminam o desenvolvimento de sistemas de armazenamento definidos por software

Então, como a Datera criou uma arquitetura que atende às demandas do armazenamento empresarial tradicional e, ao mesmo tempo, atende às demandas do data center moderno? Tudo se resume àquele incômodo operador “AND” novamente.

Não fazia sentido abordar os requisitos individuais um por um. A soma de tais elementos não se tornará um todo único. Como em qualquer sistema complexo, era importante considerar cuidadosamente todo o complexo de compromissos equilibrados. Ao desenvolver, os especialistas da Datera foram guiados por três princípios principais:

  • gerenciamento específico de aplicativos;
  • um mecanismo unificado para garantir a flexibilidade dos dados;
  • alto desempenho devido à redução de custos indiretos.

A característica comum desses princípios é a simplicidade. Gerencie facilmente seu sistema, gerencie seus dados facilmente com um mecanismo único e elegante e forneça desempenho previsível (e alto) enquanto reduz custos. Por que a simplicidade é tão importante? Profissionais experientes do mundo do armazenamento sabem que atender aos requisitos de armazenamento do data center dinâmico atual não pode ser alcançado apenas com gerenciamento granular, múltiplas ferramentas de gerenciamento de dados e hiperotimização para ganhos de desempenho. O complexo de tais técnicas já nos é familiar como sistema de armazenamento de dinossauros.

A familiaridade com esses princípios serviu bem à Datera. A arquitetura que desenvolveram tem, por um lado, a disponibilidade, o desempenho e a escalabilidade de um moderno sistema de armazenamento de classe empresarial e, por outro lado, a flexibilidade e a velocidade necessárias para um data center moderno definido por software.

Disponibilidade de Datera na Rússia

Datera é um parceiro tecnológico global da Hewlett Packard Enterprise. Os produtos Datera são testados quanto à compatibilidade e desempenho com vários modelos de servidor HPE ProLiant.

Você pode aprender mais sobre a arquitetura Datera em Webinar sobre HPE 31 outubro.

Fonte: habr.com

Adicionar um comentário