Czas ujawnić szczegóły dotyczące nowych routerów klasy operatorskiej Huawei NetEngine 8000 – o bazie sprzętowej oraz rozwiązaniach programowych, które pozwalają budować na ich bazie połączenia typu end-to-end end-to-end o przepustowości 400 Gbps oraz monitorować jakość usług sieciowych na poziomie subsekundowym.
Co decyduje o tym, jakie technologie są potrzebne do rozwiązań sieciowych
Wymagania dotyczące najnowszego sprzętu sieciowego wyznaczają obecnie cztery kluczowe trendy:
- upowszechnienie mobilnego internetu szerokopasmowego 5G;
- wzrost obciążenia chmurą zarówno w prywatnych, jak i publicznych centrach danych;
- ekspansja świata IoT;
- rosnące zapotrzebowanie na sztuczną inteligencję.
W czasie pandemii pojawił się kolejny ogólny trend: coraz atrakcyjniejsze stają się scenariusze, w których obecność fizyczna jest maksymalnie ograniczana na rzecz wirtualnej. Dotyczy to między innymi usług rzeczywistości wirtualnej i rozszerzonej, a także rozwiązań bazujących na sieciach Wi-Fi 6. Wszystkie te aplikacje wymagają wysokiej jakości kanałów. NetEngine 8000 został zaprojektowany, aby to zapewnić.
Rodzina NetEngine 8000
Urządzenia wchodzące w skład rodziny NetEngine 8000 podzielone są na trzy główne serie. Oznaczone literą X, to wysokowydajne, flagowe modele dla operatorów telekomunikacyjnych lub dla centrów danych o dużym obciążeniu. Seria M została zaprojektowana z myślą o różnych scenariuszach metra. Natomiast urządzenia z indeksem F są przeznaczone przede wszystkim do realizacji typowych scenariuszy DCI (Data Center Interconnect). Większość z „ośmiotysięczników” może stanowić część tuneli typu end-to-end o przepustowości 400 Gbit/s i obsługiwać gwarantowany poziom usług (Service Level Agreement – SLA).
Fakt: dziś tylko Huawei produkuje pełną gamę sprzętu do organizacji sieci klasy 400GE. Powyższa ilustracja przedstawia scenariusz budowy sieci dla dużego klienta korporacyjnego lub dużego operatora. Ten ostatni wykorzystuje wysokowydajne routery rdzeniowe NetEngine 9000, a także nowe routery NetEngine 8000 F2A, zdolne do agregacji dużej liczby połączeń o prędkościach 100, 200 lub 400 Gbps.
Fabryki metra realizowane są w oparciu o urządzenia serii M. Takie rozwiązania pozwalają dostosować się do przewidywanego w ciągu najbliższej dekady dziesięciokrotnego wzrostu natężenia ruchu bez konieczności zmiany peronu.
Huawei samodzielnie produkuje moduły optyczne o przepustowości 400 Gb/s. Zbudowane na nich rozwiązania są o 10–15% tańsze od rozwiązań o podobnej pojemności, ale wykorzystujących kanały 100-gigabitowe. Testowanie modułów rozpoczęto jeszcze w 2017 roku, a już w 2019 roku odbyło się pierwsze wdrożenie sprzętu na ich bazie; Afrykański operator telekomunikacyjny Safaricom obecnie obsługuje taki system na skalę komercyjną.
Ogromna przepustowość NetEngine 8000, która w 2020 roku może wydawać się nadmierna, z pewnością będzie potrzebna w niedalekiej przyszłości. Ponadto router nadaje się do wykorzystania jako duży punkt wymiany, co z pewnością przyda się zarówno operatorom drugiej warstwy, jak i dużym strukturom przedsiębiorstw w fazie szybkiego wzrostu oraz twórcom rozwiązań e-administracji.
Huawei promuje także upowszechnienie szeregu nowych technologii, w tym protokołu routingu SRv6, który znacząco ułatwia dostarczanie ruchu VPN operatora. Technologia FlexE (Flexible Ethernet) zapewnia gwarantowaną przepustowość w drugiej warstwie modelu OSI, a iFIT (In-situ Flow Information Telemetry) pozwala na dokładne monitorowanie parametrów wydajności SLA.
Z punktu widzenia dostawcy SRv6 może być używany z poziomu kontenera w centrum danych zbudowanym w oparciu o NFV (Network Functions Virtualization) aż do na przykład bezprzewodowego środowiska szerokopasmowego. Klienci korporacyjni będą potrzebowali kompleksowego wykorzystania nowego protokołu podczas budowy sieci szkieletowych. Podkreślamy, że technologia ta nie jest zastrzeżona i jest używana przez różnych dostawców, co eliminuje ryzyko niezgodności.
To harmonogram komercjalizacji technologii SRv6 wspierającej rozwiązania 5G. Przykład praktyczny: arabska firma Zain Group w procesie przejścia na 5G zmodernizowała swoją sieć, zwiększając przepustowość kanałów szkieletowych, a także poprawiła łatwość zarządzania infrastrukturą poprzez wprowadzenie SRv6.
Jak zastosować te technologie
Wcześniej zastosowano trzy różne produkty, stanowiące „parasol technologiczny” obejmujący powyższe rozwiązania. U2000 zastosowano jako NMS dla domeny transmisyjnej i domeny IP. Dodatkowo w systemach SDN zastosowano systemy uTraffic oraz znacznie bardziej znany Agile Controller. Jednak ta kombinacja okazała się niezbyt wygodna w zastosowaniu do routerów klasy operatorskiej, dlatego teraz produkty te zostały połączone w narzędzie CloudSoP.
Przede wszystkim pozwala w pełni zarządzać cyklem życia infrastruktury, począwszy od budowy sieci – optycznej lub IP. Odpowiada także za zarządzanie zasobami, zarówno standardowymi (MPLS), jak i nowymi (SRv6). Wreszcie CloudSoP umożliwia pełną obsługę wszystkich usług z wysokim poziomem szczegółowości.
Przyjrzyjmy się bliżej klasycznemu podejściu do zarządzania. W tym przypadku można to zrealizować za pomocą L3VPN lub SR-TE, co daje dodatkowe możliwości tworzenia tuneli. W celu dystrybucji zasobów do różnych zadań serwisowych wykorzystuje się ponad sto parametrów i routingu segmentów.
Jak wygląda wdrożenie takiej usługi? Najpierw musisz ustawić politykę podstawową dla określonego poziomu (płaszczyzny). Na powyższym schemacie wybrana jest technologia SRv6, za pomocą której konfiguruje się dostarczanie ruchu z punktu A do punktu E. System wyliczy możliwe ścieżki uwzględniając przepustowość i opóźnienia, a także utworzy parametry do późniejszej kontroli.
Po zakończeniu konfiguracji jesteśmy gotowi do utworzenia i uruchomienia dodatkowych usług VPN. Główną zaletą rozwiązania Huawei jest to, że w odróżnieniu od standardowego MPLS Traffic Engineering, pozwala ono na synchronizację ścieżek tuneli bez żadnych dodatkowych dodatków.
Powyższy diagram przedstawia ogólny proces pozyskiwania informacji. Często wykorzystuje się do tego SNMP, co zajmuje dużo czasu i daje średni wynik. Jednak telemetria, którą wcześniej stosowaliśmy w centrach danych i rozwiązaniach kampusowych, zawitała do świata operatorskich sieci szkieletowych. Dodaje obciążenie, ale pozwala zrozumieć, co dzieje się w sieci, nie w tej chwili, ale na poziomie ułamka sekundy.
Oczywiście powstały w ten sposób wolumen ruchu musi zostać w jakiś sposób „przetrawiony”. W tym celu wykorzystywana jest dodatkowa technologia uczenia maszynowego. Na podstawie wgranych wzorców najczęstszych usterek sieciowych system monitorowania jest w stanie prognozować prawdopodobieństwo wystąpienia przekroczeń. Na przykład awaria modułu SFP (Small Form-factor Pluggable) lub nagły wzrost ruchu sieciowego.
A tak wygląda skalowalny poziomo (skalowalny) system sterowania oparty na serwerach TaiShan ARM i bazie danych GaussDB. Poszczególne węzły systemu analitycznego posiadają koncepcję „roli”, która pozwala na granulowaną rozbudowę usług diagnostycznych w miarę wzrostu ruchu lub wzrostu liczby węzłów sieci.
Innymi słowy, wszystko, co było dobre w świecie systemów pamięci masowej, stopniowo pojawia się w obszarze zarządzania siecią.
Uderzającym przykładem wdrożenia naszych nowych technologii jest Industrial and Commercial Bank of China (ICBC). Wdraża sieć szkieletową złożoną z routerów o wysokiej wydajności, którym przypisano określone role. Według NDA mamy prawo podać na schemacie jedynie ogólne wyobrażenie o strukturze sieci. Obejmuje trzy duże centra danych połączone kompleksowymi tunelami i 35 dodatkowych lokalizacji (centra danych drugiego poziomu). Stosowane są zarówno połączenia standardowe, jak i SR-TE.
Trójwarstwowa inteligentna architektura IP WAN
Rozwiązania Huawei opierają się na architekturze trójwarstwowej, na niższym poziomie znajduje się sprzęt o zróżnicowanej wydajności. Na drugim poziomie znajduje się środowisko zarządzania sprzętem oraz dodatkowe usługi rozszerzające funkcjonalność analizy i sterowania siecią. Stosunkowo mówiąc, nakładana jest górna warstwa. Najczęstsze scenariusze zastosowań obejmują organizację sieci operatorów telekomunikacyjnych, instytucji finansowych, przedsiębiorstw energetycznych i agencji rządowych.
Poniżej krótki film opisujący możliwości NetEngine 8000 i zastosowane w nim rozwiązania techniczne:
Oczywiście sprzęt musi być zaprojektowany pod kątem wzrostu ruchu i rozbudowy infrastruktury, biorąc pod uwagę odpowiednie zasilanie i odpowiednie chłodzenie. Kiedy flagowy model routera wyposażony jest w 20 zasilaczy po 3 kW każdy, zastosowanie nanorurek węglowych w układzie odprowadzania ciepła nie wydaje się już zbędne.
Po co to wszystko? Brzmi to jak science fiction, ale dla nas obecnie 14,4 Tbit/s na slot jest całkiem osiągalne. A ta oszałamiająca przepustowość jest pożądana. W szczególności te same firmy finansowe i energetyczne, z których wiele ma dziś sieci szkieletowe utworzone w oparciu o technologię DWDM (Dense Wavelength Division Multiplexing). W końcu rośnie także liczba aplikacji wymagających coraz większych prędkości.
Jeden z naszych scenariuszy budowania sieci uczenia maszynowego pomiędzy dwoma klastrami Atlas 900 również wymaga przepustowości klasy terabitowej. A podobnych zadań jest mnóstwo. Należą do nich w szczególności obliczenia nuklearne, obliczenia meteorologiczne itp.
Podstawa sprzętowa i jej wymagania
Na schematach przedstawiono aktualnie dostępne moduły routera LPUI z kartami zintegrowanymi oraz ich charakterystykę.
A tak wygląda plan działania z nowymi opcjami modułów, które będą dostępne w ciągu najbliższych dwóch lat. Przy opracowywaniu rozwiązań w oparciu o nie ważne jest uwzględnienie zużycia energii. Obecnie standardowe centra danych budowane są z mocą 7–10 kW na szafę, natomiast zastosowanie routerów klasy terabitowej wiąże się z kilkukrotnie większym poborem mocy (do 30–40 uW w szczycie). Wiąże się to z koniecznością zaprojektowania specjalistycznego obiektu lub stworzenia oddzielnej strefy o dużym obciążeniu w istniejącym centrum danych.
Ogólny rzut oka na podwozie pokazuje, że fabryki są ukryte za środkowym blokiem wentylatorów. Istnieje możliwość ich „gorącej” wymiany, realizowanej dzięki redundancji według schematu 2N lub N+1. W istocie mówimy o standardowej architekturze ortogonalnej o wysokiej niezawodności.
Nie tylko flagowce
Niezależnie od tego, jak imponujące są flagowe modele, najwięcej instalacji przypada na rozwiązania pudełkowe z serii M i F.
Najpopularniejszymi routerami usługowymi są obecnie modele M8 i M14. Umożliwiają pracę zarówno z interfejsami o niskiej prędkości, takimi jak E1, jak i szybkimi interfejsami (100 Gbit/s obecnie i 400 Gbit/s w najbliższej przyszłości) w ramach tej samej platformy.
Wydajność M14 jest wystarczająca, aby zaspokoić wszystkie potrzeby zwykłych klientów korporacyjnych. Za jego pomocą można budować standardowe rozwiązania L3VPN do łączenia się z dostawcami, ale sprawdzi się także jako dodatkowe narzędzie np. do zbierania telemetrii czy wykorzystania SRv6.
Do modelu dostępna jest duża liczba kart. Nie ma oddzielnych fabryk, a do zapewnienia łączności służą nadzorcy. W ten sposób uzyskano rozkład wydajności na porty wskazany na schemacie.
W przyszłości nadzorcę można wymienić na nowy, co da nową wydajność na tych samych portach.
Model M8 jest nieco mniejszy od M14 i także ma gorszą wydajność od starszego modelu, ale ich zastosowania są bardzo podobne.
Zestaw kart fizycznych kompatybilnych z M8 pozwala na przykład na skonfigurowanie połączenia z urządzeniami P poprzez interfejs 100 Gbps, wykorzystanie technologii FlexE i szyfrowanie tego wszystkiego.
W zasadzie to właśnie za pomocą urządzenia M6 można rozpocząć pracę ze środowiskiem operatora. Jest mały i nieodpowiedni dla dostawców, ale z łatwością można go zastosować jako punkt agregacji ruchu do łączenia regionalnych centrów danych, na przykład w banku. Co więcej, ustawione tutaj oprogramowanie jest takie samo, jak w starszych modelach.
Dla M6 dostępnych jest mniej kart, a maksymalna wydajność wynosi 50 Gb/s, co jednak jest zauważalnie wyższe niż standardowe w branży rozwiązania 40 Gb/s.
Na szczególną uwagę zasługuje także najmłodszy model M1A. To niewielkie rozwiązanie, które może się przydać tam, gdzie spodziewany jest rozszerzony zakres temperatur pracy (-40...+65°C).
Kilka słów o linii F. Model NetEngine 8000 F1A stał się jednym z najpopularniejszych produktów Huawei w 2019 roku, między innymi dzięki temu, że wyposażony jest w porty o przepustowości od 1 do 100 Gbit/s (do 1,2 Łącznie Tbit/s).
Więcej o SRv6
Dlaczego właśnie teraz konieczne było uwzględnienie w naszych produktach obsługi technologii SRv6?
Obecnie liczba protokołów wymaganych do ustanowienia tuneli VPN może wynosić ponad 10, co powoduje poważne problemy w zarządzaniu i sugeruje konieczność radykalnego uproszczenia procesu.
Odpowiedzią branży na to wyzwanie było stworzenie technologii SRv6, do powstania której przyłożyli rękę Huawei i Cisco.
Jednym z ograniczeń, które należało usunąć, była konieczność stosowania zasady zachowania per-hop (PHB) do routingu standardowych pakietów. Dość trudno jest nawiązać interakcję „międzyoperatorską” poprzez Inter-AS MP-BGP z usługami dodatkowymi (VPNv4), dlatego takich rozwiązań jest bardzo niewiele. SRv6 pozwala początkowo utorować ścieżkę pakietu przez cały segment bez rejestrowania specjalnych tuneli. Upraszcza się także programowanie samych procesów, co znacznie ułatwia duże wdrożenia.
Diagram przedstawia przypadek wdrożenia SRv6. Obie sieci globalne były połączone kilkoma różnymi protokołami. Aby otrzymać usługę z dowolnego serwera wirtualnego lub sprzętowego, wymagana była duża liczba przełączników (przekazywania) pomiędzy VXLAN, VLAN, L3VPN itp.
Po wdrożeniu SRv6 operator miał tunel typu end-to-end nawet do serwera sprzętowego, a do kontenera Docker.
Dowiedz się więcej o technologii FlexE
Druga warstwa modelu OSI jest zła, ponieważ nie zapewnia niezbędnych usług i poziomu SLA, jakiego potrzebują dostawcy. Oni z kolei chcieliby uzyskać jakiś analog TDM (multipleksowanie z podziałem czasu), ale w sieci Ethernet. Podjęto wiele podejść do rozwiązania tego problemu, ale wyniki były bardzo ograniczone.
Flex Ethernet służy właśnie do zagwarantowania jakości SDH (Synchronous Digital Hierarchy) i poziomów TDM w sieciach IP. Stało się to możliwe dzięki pracy z płaszczyzną spedycyjną, kiedy tak modyfikujemy środowisko L2, aby było jak najbardziej produktywne.
Jak działa każdy standardowy port fizyczny? Jest określona liczba kolejek i dzwonek tx. Pakiet trafiający do bufora czeka na przetworzenie, co nie zawsze jest wygodne, szczególnie w obecności strumieni słoni i myszy.
Dodatkowe wstawki i kolejna warstwa abstrakcji pozwalają zapewnić gwarantowaną przepustowość na poziomie nośnika fizycznego.
W warstwie przesyłania informacji przydzielana jest dodatkowa warstwa MAC, co umożliwia tworzenie sztywnych kolejek fizycznych, do których można przypisywać określone umowy SLA.
Tak to wygląda na poziomie realizacji. Dodatkowa warstwa faktycznie implementuje kadrowanie TDM. Dzięki tej meta-wstawce możliwa jest granulowana dystrybucja kolejek i tworzenie usług TDM poprzez Ethernet.
Jeden ze scenariuszy wykorzystania FlexE zakłada bardzo ścisłe przestrzeganie umów SLA poprzez tworzenie szczelin czasowych w celu wyrównania przepustowości lub zapewnienia zasobów dla usług krytycznych.
Inny scenariusz pozwala na pracę z defektami. Zamiast po prostu hashować transmisję informacji, tworzymy osobne kanały niemal na poziomie fizycznym, w przeciwieństwie do wirtualnych tworzonych przez QoS (Quality of Service).
Więcej o iFIT
Podobnie jak FlexE, iFIT jest licencjonowaną technologią firmy Huawei. Umożliwia weryfikację SLA na bardzo szczegółowym poziomie. W przeciwieństwie do standardowych mechanizmów IP SLA i NQA, iFIT nie działa na ruchu syntetycznym, ale na ruchu „na żywo”.
iFIT jest dostępny na wszystkich urządzeniach obsługujących telemetrię. W tym celu wykorzystywane jest dodatkowe pole, które nie jest zajęte przez standardowe Dane Opcji. Zapisywane są tam informacje, które pozwalają zrozumieć, co dzieje się na kanale.
***
Podsumowując powyższe, podkreślamy, że funkcjonalność NetEngine 8000 oraz technologie zawarte w „ośmiotysięcznych” technologiach czynią te urządzenia rozsądnym i uzasadnionym wyborem przy tworzeniu i rozwoju sieci klasy operatorskiej, sieci szkieletowych przedsiębiorstw energetycznych i finansowych, a także systemy „elektronicznego rządu”.
Źródło: www.habr.com