É hora de revelar detalhes sobre os novos roteadores de classe operadora Huawei NetEngine 8000 - sobre a base de hardware e soluções de software que permitem construir conexões ponta a ponta com uma taxa de transferência de 400 Gbps e monitorar a qualidade dos serviços de rede no nível de subsegundos.
O que determina quais tecnologias são necessárias para soluções de rede
Os requisitos para os equipamentos de rede mais recentes são agora determinados por quatro tendências principais:
- a difusão da banda larga móvel 5G;
- crescimento das cargas de nuvem em data centers públicos e privados;
- expansão do mundo IoT;
- crescente demanda por inteligência artificial.
Durante a pandemia, surgiu outra tendência geral: os cenários onde a presença física é reduzida tanto quanto possível em favor de uma presença virtual estão a tornar-se mais atraentes. Isto inclui, entre outras coisas, serviços de realidade virtual e aumentada, bem como soluções baseadas em redes Wi-Fi 6. Todas estas aplicações requerem canais de alta qualidade. O NetEngine 8000 foi projetado para fornecê-lo.
Família NetEngine 8000
Os dispositivos incluídos na família NetEngine 8000 estão divididos em três séries principais. Marcados com a letra X, estes são modelos emblemáticos de alto desempenho para operadoras de telecomunicações ou para data centers de alta carga. A série M foi projetada para acomodar vários cenários metropolitanos. E os dispositivos com índice F destinam-se principalmente à implementação de cenários comuns de DCI (Data Center Interconnect). A maioria dos “oito mil” pode fazer parte de túneis ponta a ponta com taxa de transferência de 400 Gbit/s e suportar um nível de serviço garantido (Acordo de Nível de Serviço - SLA).
Fato: hoje apenas a Huawei produz uma gama completa de equipamentos para organização de redes da classe 400GE. A ilustração acima mostra um cenário para a construção de uma rede para um grande cliente empresarial ou uma grande operadora. Este último utiliza os roteadores core NetEngine 9000 de alto desempenho, bem como os novos roteadores NetEngine 8000 F2A, capazes de agregar um grande número de conexões de 100, 200 ou 400 Gbps.
As fábricas metropolitanas são implementadas com base em dispositivos da série M. Essas soluções permitem adaptar-se ao aumento de dez vezes no volume de tráfego esperado para a próxima década, sem alterar a plataforma.
A Huawei produz de forma independente módulos ópticos com taxa de transferência de 400 Gbps. As soluções baseadas neles são 10–15% mais baratas do que soluções semelhantes em capacidade, mas usando canais de 100 gigabits. Os testes dos módulos começaram em 2017, e já em 2019 ocorreu a primeira implementação de equipamentos baseados neles; A operadora africana de telecomunicações Safaricom está actualmente a operar comercialmente um tal sistema.
A enorme largura de banda do NetEngine 8000, que pode parecer excessiva em 2020, será definitivamente necessária num futuro não muito distante. Além disso, o roteador é adequado para uso como um grande ponto de troca, o que certamente será útil tanto para operadoras de segundo nível quanto para grandes estruturas empresariais em uma fase de rápido crescimento e criadores de soluções de governo eletrônico.
A Huawei também está promovendo a disseminação de uma série de novas tecnologias, incluindo o protocolo de roteamento SRv6, que simplifica significativamente a entrega do tráfego VPN da operadora. A tecnologia FlexE (Flexible Ethernet) fornece rendimento garantido na segunda camada do modelo OSI, e iFIT (In-situ Flow Information Telemetry) permite monitorar com precisão os parâmetros de desempenho do SLA.
Do ponto de vista de um provedor, o SRv6 pode ser usado desde o nível do contêiner em um data center construído em NFV (Network Functions Virtualization) até, por exemplo, um ambiente de banda larga sem fio. Os clientes corporativos precisarão do uso ponta a ponta do novo protocolo ao construir redes backbone (backbone). A tecnologia, ressaltamos, não é proprietária e é utilizada por diferentes fornecedores, o que elimina o risco de incompatibilidade.
Este é o cronograma para a comercialização da tecnologia SRv6 para suportar soluções 5G. Caso prático: a empresa árabe Zain Group, em processo de transição para 5G, modernizou a sua rede, aumentando a capacidade dos canais backbone, e também melhorou a capacidade de gestão da infraestrutura através da introdução do SRv6.
Como aplicar essas tecnologias
Três produtos diferentes foram anteriormente utilizados como “guarda-chuva tecnológico” cobrindo as soluções acima. U2000 foi usado como NMS para o domínio de transmissão e domínio IP. Além disso, os sistemas uTraffic e o muito mais conhecido Agile Controller foram usados em sistemas SDN. No entanto, essa combinação acabou não sendo muito conveniente quando aplicada a roteadores de classe operadora, então agora esses produtos são combinados em uma ferramenta CloudSoP.
Em primeiro lugar, permite gerir integralmente o ciclo de vida da infraestrutura, começando pela construção da rede - óptica ou IP. Também é responsável pelo gerenciamento de recursos, tanto padrão (MPLS) quanto novos (SRv6). Por fim, o CloudSoP permite atender integralmente todos os serviços com alto nível de granularidade.
Vamos dar uma olhada mais de perto na abordagem clássica de gerenciamento. Neste caso, pode ser realizado através de L3VPN ou SR-TE, o que oferece oportunidades adicionais para a criação de túneis. Para distribuir recursos para diversas tarefas de serviço, são utilizados mais de uma centena de parâmetros e roteamento por segmentos.
Como é a implantação de tal serviço? Primeiro você precisa definir a política primária para um nível específico (plano). No diagrama acima, é selecionada a tecnologia SRv6, com a qual é configurada a entrega do tráfego do ponto A ao ponto E. O sistema calculará os caminhos possíveis levando em consideração a vazão e os atrasos, e também criará parâmetros para controle posterior.
Assim que concluirmos a configuração, estaremos prontos para criar e lançar serviços VPN adicionais. Uma grande vantagem da solução da Huawei é que, diferentemente do MPLS Traffic Engineering padrão, ela permite sincronizar caminhos de túneis sem quaisquer complementos adicionais.
O diagrama acima mostra o processo geral de obtenção de informações. O SNMP é frequentemente usado para isso, o que leva muito tempo e dá um resultado médio. No entanto, a telemetria, que anteriormente usávamos em data centers e soluções de campus, chegou ao mundo das redes de backbone de operadoras. Ele adiciona carga, mas permite entender o que está acontecendo na rede não no minuto, mas no nível de subsegundos.
É claro que o volume de tráfego resultante deve ser “digerido” de alguma forma. Para isso, é utilizada tecnologia adicional de aprendizado de máquina. Com base em padrões pré-carregados das falhas de rede mais comuns, o sistema de monitoramento é capaz de fazer previsões sobre a probabilidade de ocorrência de excessos. Por exemplo, uma falha de um módulo SFP (Small Form-factor Pluggable) ou um aumento repentino no tráfego de rede.
E é assim que se parece um sistema de controle horizontalmente escalável (escalável) baseado em servidores TaiShan ARM e no banco de dados GaussDB. Os nós individuais do sistema analítico têm um conceito de “função”, que permite a expansão granular dos serviços de diagnóstico à medida que o tráfego aumenta ou o número de nós da rede aumenta.
Ou seja, tudo o que havia de bom no mundo dos sistemas de armazenamento está chegando gradativamente à área de gerenciamento de redes.
Um exemplo notável da implementação das nossas novas tecnologias é o Banco Industrial e Comercial da China (ICBC). Ele implanta uma rede central de roteadores de alto desempenho aos quais são atribuídas funções específicas. De acordo com o NDA, temos o direito de dar apenas uma ideia geral da estrutura da rede no diagrama. Inclui três grandes data centers conectados por túneis ponta a ponta e 35 locais adicionais (data centers de segundo nível). São usadas conexões padrão e SR-TE.
Arquitetura IP WAN inteligente de três camadas
As soluções Huawei baseiam-se numa arquitetura de três camadas, no nível inferior das quais existem equipamentos de desempenho variado. No segundo nível está um ambiente de gerenciamento de equipamentos e serviços adicionais que ampliam a funcionalidade de análise e controle de rede. A camada superior, relativamente falando, é aplicada. Os cenários de aplicação mais comuns envolvem a organização de redes de operadoras de telecomunicações, instituições financeiras, empresas de energia e agências governamentais.
Aqui está um pequeno vídeo que descreve os recursos do NetEngine 8000 e as soluções técnicas utilizadas nele:
É claro que o equipamento deve ser concebido para o crescimento do tráfego e a expansão da infra-estrutura, tendo em conta a alimentação adequada e o arrefecimento adequado. Quando o modelo principal do roteador é equipado com 20 fontes de alimentação de 3 kW cada, o uso de nanotubos de carbono no sistema de remoção de calor não parece mais redundante.
Para que serve tudo isso? Parece ficção científica, mas para nós agora 14,4 Tbit/s por slot é bastante alcançável. E essa largura de banda alucinante está em demanda. Em particular, as mesmas empresas financeiras e de energia, muitas das quais hoje possuem redes centrais criadas usando a tecnologia DWDM (Dense Wavelength Division Multiplexing). Afinal, o número de aplicações que exigem velocidades cada vez maiores também está crescendo.
Um dos nossos cenários para a construção de redes de aprendizado de máquina entre dois clusters Atlas 900 também requer taxa de transferência de classe terabit. E há muitas tarefas semelhantes. Estes incluem, em particular, computação nuclear, cálculos meteorológicos, etc.
Base de hardware e seus requisitos
Os diagramas mostram os módulos roteadores LPUI atualmente disponíveis com placas integradas e suas características.
E é assim que fica o roteiro com as novas opções de módulos que estarão disponíveis nos próximos dois anos. Ao desenvolver soluções baseadas neles, é importante considerar o consumo de energia. Hoje em dia, os data centers padrão são construídos a uma taxa de 7 a 10 kW por rack, enquanto o uso de roteadores da classe terabit implica um consumo de energia várias vezes maior (até 30 a 40 uW no pico). Isto implica a necessidade de projetar um local especializado ou criar uma zona separada de alta carga em um data center existente.
Uma visão geral do chassi revela que as fábricas estão escondidas atrás do bloco central do ventilador. Existe a possibilidade da sua substituição “a quente”, implementada graças à redundância segundo o esquema 2N ou N+1. Em essência, estamos falando de uma arquitetura ortogonal padrão de alta confiabilidade.
Não apenas carros-chefe
Por mais impressionantes que sejam os modelos emblemáticos, a maioria das instalações é contabilizada pelas soluções em caixa das séries M e F.
Os roteadores de serviço mais populares atualmente são os modelos M8 e M14. Eles permitem que você trabalhe com interfaces de baixa velocidade, como E1, e de alta velocidade (100 Gbit/s agora e 400 Gbit/s em um futuro próximo) na mesma plataforma.
O desempenho do M14 é suficiente para satisfazer todas as necessidades dos clientes empresariais comuns. Com ele, você pode construir soluções L3VPN padrão para conexão com provedores; também é bom como uma ferramenta adicional, por exemplo, para coletar telemetria ou usar SRv6.
Um grande número de cartões está disponível para o modelo. Não existem fábricas separadas e são utilizados supervisores para garantir a conectividade. Desta forma, é alcançada a distribuição de desempenho entre as portas indicadas no diagrama.
Futuramente, o supervisor poderá ser substituído por um novo, o que proporcionará novo desempenho nas mesmas portas.
O modelo M8 é um pouco menor que o M14 e também tem desempenho inferior ao modelo mais antigo, mas seus casos de uso são muito semelhantes.
Um conjunto de cartões físicos compatíveis com M8 permite, por exemplo, estabelecer uma conexão com dispositivos P através de uma interface de 100 Gbps, usar a tecnologia FlexE e criptografar tudo.
Em geral, é com o dispositivo M6 que você pode começar a trabalhar com o ambiente da operadora. É pequeno e não é adequado para fornecedores, mas é facilmente aplicável como ponto de agregação de tráfego para ligar centros de dados regionais, por exemplo, num banco. Além disso, o software definido aqui é o mesmo dos modelos mais antigos.
Há menos placas disponíveis para o M6 e o desempenho máximo é de 50 Gbps, que, no entanto, é visivelmente superior às soluções padrão de 40 Gbps da indústria.
O modelo mais novo, M1A, também merece destaque especial. Esta é uma pequena solução que pode ser útil quando se espera uma faixa de temperatura operacional estendida (-40... +65 °C).
Algumas palavras sobre a linha F. O modelo NetEngine 8000 F1A tornou-se um dos produtos Huawei mais populares em 2019, até porque está equipado com portas com débito de 1 a 100 Gbit/s (até 1,2 Tbit/s no total).
Mais sobre SRv6
Por que exatamente agora foi necessário incluir suporte à tecnologia SRv6 em nossos produtos?
Atualmente, o número de protocolos necessários para estabelecer túneis VPN pode ser superior a 10, o que causa sérios problemas de gestão e sugere a necessidade de simplificar radicalmente o processo.
A resposta da indústria a este desafio foi a criação da tecnologia SRv6, em cujo surgimento a Huawei e a Cisco contribuíram.
Uma das restrições que precisavam ser removidas era a necessidade de usar o princípio do comportamento por salto (PHB) para rotear pacotes padrão. É muito difícil estabelecer interação “interoperadores” via Inter-AS MP-BGP com serviços adicionais (VPNv4), portanto existem muito poucas soluções desse tipo. O SRv6 permite inicialmente pavimentar o caminho de um pacote através de todo o segmento sem registrar túneis especiais. E a programação dos próprios processos é simplificada, o que facilita muito grandes implantações.
O diagrama mostra um caso de implementação do SRv6. As duas redes globais foram conectadas por vários protocolos diferentes. Para receber serviço de qualquer servidor virtual ou de hardware, era necessário um grande número de switches (handover) entre VXLAN, VLAN, L3VPN, etc.
Após a implementação do SRv6, a operadora passou a ter um túnel ponta a ponta nem mesmo para o servidor de hardware, mas para o contêiner Docker.
Saiba mais sobre a tecnologia FlexE
A segunda camada do modelo OSI é ruim porque não fornece os serviços necessários e o nível de SLA que os provedores precisam. Eles, por sua vez, gostariam de obter algum tipo de análogo do TDM (multiplexação por divisão de tempo), mas em Ethernet. Muitas abordagens foram adotadas para resolver o problema, com resultados muito limitados.
O Flex Ethernet serve justamente para garantir a qualidade dos níveis SDH (Synchronous Digital Hierarchy) e TDM em redes IP. Isso se tornou possível graças ao trabalho com o plano de encaminhamento, quando modificamos o ambiente L2 desta forma para que se torne o mais produtivo possível.
Como funciona qualquer porta física padrão? Há um certo número de filas e um anel de transmissão. Um pacote que entra no buffer aguarda processamento, o que nem sempre é conveniente, especialmente na presença de fluxos de elefantes e ratos.
Inserções adicionais e outra camada de abstração ajudam a garantir o rendimento garantido no nível do meio físico.
Uma camada MAC adicional é alocada na camada de transferência de informações, o que permite criar filas físicas rígidas às quais podem ser atribuídos SLAs específicos.
Isto é o que parece no nível de implementação. A camada adicional realmente implementa o enquadramento TDM. Graças a esta meta-inserção, é possível distribuir granularmente filas e criar serviços TDM via Ethernet.
Um dos cenários para usar o FlexE envolve uma adesão muito rigorosa aos SLAs, criando intervalos de tempo para equalizar o rendimento ou fornecer recursos para serviços críticos.
Outro cenário permite trabalhar com defeitos. Em vez de simplesmente fazer hash na transmissão de informações, formamos canais separados quase no nível físico, em oposição aos canais virtuais criados por QoS (Qualidade de Serviço).
Mais sobre o iFIT
Assim como o FlexE, o iFIT é uma tecnologia licenciada da Huawei. Ele permite a verificação do SLA em um nível muito granular. Ao contrário dos mecanismos IP SLA e NQA padrão, o iFIT opera não com tráfego sintético, mas com tráfego “ao vivo”.
O iFIT está disponível em todos os dispositivos que suportam telemetria. Para isso, é utilizado um campo adicional que não é ocupado pelos Dados de Opção padrão. Ali são registradas informações que permitem entender o que está acontecendo no canal.
***
Resumindo o que foi dito, enfatizamos que a funcionalidade do NetEngine 8000 e as tecnologias incorporadas nas “oito milésimas” tecnologias tornam esses dispositivos uma escolha razoável e justificada na criação e desenvolvimento de redes de classe operadora, redes centrais de empresas de energia e financeiras, bem como sistemas de “governo eletrônico”.
Fonte: habr.com