Huawei Dorado V6: Syczuański upał

Huawei Dorado V6: Syczuański upał
Lato w Moskwie w tym roku, szczerze mówiąc, nie było zbyt udane. Zaczęło się zbyt wcześnie i szybko, nie wszyscy zdążyli na to zareagować, a skończyło się już pod koniec czerwca. Dlatego też, gdy Huawei zaprosił mnie do Chin, do miasta Chengdu, gdzie znajduje się ich centrum badawczo-rozwojowe, po zapoznaniu się z prognozą pogody +34 stopni w cieniu, od razu się zgodziłem. Przecież nie jestem już w tym samym wieku i muszę trochę rozgrzać kości. Chciałbym jednak zauważyć, że udało się ogrzać nie tylko kości, ale także wnętrzności, ponieważ prowincja Syczuan, w której faktycznie znajduje się Chengdu, słynie z zamiłowania do pikantnego jedzenia. Ale to wciąż nie jest blog o podróżach, więc wróćmy do głównego celu naszej podróży - nowej linii systemów przechowywania - Huawei Dorado V6. Ten artykuł odwiedzie Cię trochę od przeszłości, ponieważ... został napisany przed oficjalnym ogłoszeniem, ale opublikowany dopiero po wydaniu. I tak dzisiaj przyjrzymy się bliżej wszystkiemu ciekawemu i smacznemu, co przygotował dla nas Huawei.

Huawei Dorado V6: Syczuański upał
W nowej linii znajdzie się 5 modeli. Wszystkie modele z wyjątkiem 3000V6 można nabyć w dwóch wersjach – SAS i NVMe. Wybór określa interfejs dysków, które można wykorzystać w tym systemie, porty zaplecza oraz liczbę napędów dyskowych, które można zainstalować w systemie. W przypadku NVMe stosowane są dyski SSD wielkości dłoni, które są cieńsze niż klasyczne 2.5-calowe dyski SSD SAS i można je zainstalować w maksymalnie 36 elementach. Nowa linia to All Flash i nie ma konfiguracji z dyskami.

Huawei Dorado V6: Syczuański upał
Dysk SSD Palm NVMe

Najciekawsze moim zdaniem wyglądają Dorado 8000 i 18000. Huawei pozycjonuje je jako systemy z najwyższej półki i dzięki polityce cenowej Huawei zestawia te modele ze średniej półki z segmentem konkurencji. To właśnie na tych modelach skupię się dzisiaj w mojej recenzji. Od razu zauważę, że juniorskie systemy z dwoma kontrolerami ze względu na swoje cechy konstrukcyjne mają nieco inną architekturę, inną niż Dorado 8000 i 18000, więc nie wszystko, o czym dzisiaj powiem, ma zastosowanie do młodszych modeli.

Jedną z głównych cech nowych systemów było zastosowanie kilku opracowanych wewnętrznie chipów, z których każdy pozwala na rozłożenie obciążenia logicznego z centralnego procesora kontrolera i dodanie funkcjonalności do różnych komponentów.
Huawei Dorado V6: Syczuański upał

Sercem nowych układów są procesory Kunpeng 920, opracowane w oparciu o technologie ARM i produkowane niezależnie przez Huawei. W zależności od modelu liczba rdzeni, ich częstotliwość oraz liczba zainstalowanych procesorów w każdym kontrolerze jest różna:
Huawei Dorado V6 8000 – 2 procesory, 64 rdzenie
Huawei Dorado V6 18000 – 4 procesory, 48 rdzenie
Huawei Dorado V6: Syczuański upał

Huawei opracował ten procesor na architekturze ARM i o ile wiem, początkowo planował zainstalować go tylko w starszych modelach Dorado 8000 i 18000, jak to miało już miejsce w przypadku niektórych modeli V5, ale sankcje skorygowały ten pomysł. Oczywiście ARM mówił też o odmowie współpracy z Huawei podczas nakładania sankcji, ale tutaj sytuacja jest inna niż z Intelem. Huawei produkuje te chipy niezależnie i żadne sankcje nie są w stanie zatrzymać tego procesu. Zerwanie relacji z ARM grozi jedynie utratą dostępu do nowych rozwiązań. Jeśli chodzi o wydajność, będzie można ocenić dopiero po przeprowadzeniu niezależnych testów. Choć widziałem, jak bez problemu usunięto 18000M IOPS z systemu Dorado 1, dopóki nie powtórzę tego własnymi rękami w szafie, nie uwierzę. Ale w kontrolerach naprawdę jest dużo mocy. Starsze modele wyposażone są w 4 kontrolery, każdy z 4 procesorami, co daje łącznie 768 rdzeni.
Huawei Dorado V6: Syczuański upał

O rdzeniach opowiem jednak jeszcze później, gdy przyjrzymy się architekturze nowych układów, ale na razie wróćmy do innego chipa instalowanego w systemie. Chip wygląda na niezwykle ciekawe rozwiązanie Ascend 310 (O ile rozumiem, młodszy brat Ascend 910, który został niedawno zaprezentowany publiczności). Jego zadaniem jest analiza bloków danych wchodzących do systemu w celu zwiększenia współczynnika trafień odczytu. Trudno powiedzieć jak sprawdzi się w pracy, bo... Dziś działa tylko według zadanego szablonu i nie ma możliwości uczenia się w trybie inteligentnym. Pojawienie się trybu inteligentnego jest obiecane w przyszłym oprogramowaniu, najprawdopodobniej na początku przyszłego roku.

Przejdźmy do architektury. Huawei w dalszym ciągu rozwija własną technologię Smart Matrix, która wykorzystuje podejście oparte na pełnej siatce do łączenia komponentów. Ale jeśli w wersji 5 dotyczyło to tylko dostępu kontrolerów do dysków, teraz wszystkie kontrolery mają dostęp do wszystkich portów zarówno w back-endzie, jak i front-endzie.
Huawei Dorado V6: Syczuański upał

Dzięki nowej architekturze mikroserwisów umożliwia to również równoważenie obciążenia pomiędzy wszystkimi kontrolerami, nawet jeśli jest tylko jeden lun. System operacyjny dla tej linii macierzy został opracowany od podstaw, a nie po prostu zoptymalizowany pod kątem korzystania z dysków Flash. Dzięki temu, że wszystkie nasze kontrolery mają dostęp do tych samych portów, w przypadku awarii kontrolera lub restartu host nie traci ani jednej ścieżki do systemu pamięci masowej, a przełączanie ścieżek odbywa się na poziomie systemu pamięci masowej. Jednakże użycie UltraPath na hoście nie jest bezwzględnie konieczne. Kolejną „oszczędnością” przy instalacji systemu jest mniejsza liczba niezbędnych łączy. A jeśli przy „klasycznym” podejściu na 4 kontrolery będziemy potrzebować 8 łączy z 2 fabryk, to w przypadku Huawei wystarczą nawet 2 (nie mówię teraz o wystarczającej przepustowości jednego łącza).
Huawei Dorado V6: Syczuański upał

Podobnie jak w poprzedniej wersji używana jest globalna pamięć podręczna z dublowaniem. Umożliwia to utratę maksymalnie dwóch kontrolerów jednocześnie lub trzech kontrolerów sekwencyjnie bez wpływu na dostępność. Warto jednak zaznaczyć, że na stanowisku demonstracyjnym nie zaobserwowaliśmy pełnego równoważenia obciążenia pomiędzy pozostałymi 3 kontrolerami w przypadku jednej awarii. Obciążenie uszkodzonego sterownika zostało w całości przejęte przez jeden z pozostałych. Możliwe, że w tym celu konieczne będzie dłuższe działanie systemu w tej konfiguracji. W każdym razie sprawdzę to dokładniej, korzystając z własnych testów.
Huawei pozycjonuje nowe systemy jako kompleksowe systemy NVMe, ale obecnie NVMeOF nie jest jeszcze obsługiwany na froncie, a jedynie FC, iSCSI lub NFS. Na końcu tej lub na początku następnej, podobnie jak w przypadku innych funkcji, obiecujemy wsparcie RoCE.
Huawei Dorado V6: Syczuański upał

Półki są również połączone ze sterownikami za pomocą RoCE i wiąże się to z jedną wadą - brakiem połączenia półek typu „loopback”, jak miało to miejsce w przypadku SAS. Moim zdaniem jest to i tak dość duża wada, jeśli planuje się dość duży system. Faktem jest, że wszystkie półki są połączone szeregowo, a awaria jednej z półek skutkuje całkowitą niedostępnością pozostałych, które za nią podążają. W tym przypadku, aby zapewnić odporność na awarie, będziemy musieli podłączyć wszystkie półki do kontrolerów, co wiąże się ze zwiększeniem wymaganej liczby portów backendowych w systemie.

I jeszcze jedna rzecz, o której warto wspomnieć, to aktualizacja bez zakłóceń (NDU). Jak powiedziałem powyżej, Huawei wdrożył kontenerowe podejście do obsługi systemu operacyjnego dla nowej linii Dorado, pozwala to na aktualizację i ponowne uruchomienie usług bez konieczności całkowitego restartu kontrolera. Warto od razu wspomnieć, że niektóre aktualizacje będą zawierać aktualizacje jądra i w tym przypadku czasami w trakcie aktualizacji wymagany będzie klasyczny restart kontrolerów, ale nie zawsze. Zmniejszy to wpływ tej operacji na system produkcyjny.

W naszym arsenale zdecydowana większość tablic pochodzi z NetApp. Dlatego myślę, że całkiem logiczne będzie, jeśli dokonam małego porównania z systemami, z którymi muszę sporo pracować. Nie jest to próba określenia, kto jest lepszy, a kto gorszy, czyja architektura jest korzystniejsza. Spróbuję na trzeźwo i bez fanatyzmu porównać dwa różne podejścia do rozwiązania tego samego problemu u różnych dostawców. Tak, oczywiście, w tym przypadku rozważymy systemy Huawei w „teorii” i osobno odnotuję również te punkty, które są planowane do wdrożenia w przyszłych wersjach oprogramowania. Jakie zalety widzę w tej chwili:

  1. Liczba obsługiwanych dysków NVMe. NetApp ma ich obecnie 288, zaś Huawei 1600-6400, w zależności od modelu. Jednocześnie maksymalna pojemność użytkowa Huawei wynosi 32PBe, podobnie jak systemy NetApp (dokładniej mają 31.64PBe). I to pomimo tego, że obsługiwane są dyski o tej samej pojemności (do 15 TB). Huawei tłumaczy ten fakt następująco: nie mieli możliwości zmontowania większej podstawki. Teoretycznie nie mają ograniczenia objętości, ale po prostu nie byli jeszcze w stanie przetestować tego faktu. Ale tutaj warto zauważyć, że możliwości współczesnych dysków flash są bardzo duże, a w przypadku systemów NVMe mamy do czynienia z faktem, że 24 dyski wystarczą, aby wykorzystać najwyższej klasy system z 2 kontrolerami. W związku z tym dalszy wzrost liczby dysków w systemie nie tylko nie zapewni wzrostu wydajności, ale będzie miał również niekorzystny wpływ na stosunek IOPS/Tb. Oczywiście warto zobaczyć, ile napędów mogą obsłużyć 4-kontrolerowe systemy 8000 i 16000, bo... Możliwości i potencjał Kunpeng 920 nadal nie są do końca jasne.
  2. Obecność Luna jako właściciela systemów NetApp. Te. Tylko jeden kontroler może wykonywać operacje na Księżycu, podczas gdy drugi przepuszcza tylko IO przez siebie. Systemy Huawei natomiast nie mają żadnych właścicieli, a operacje na blokach danych (kompresja, deduplikacja) mogą być wykonywane przez dowolny z kontrolerów, a także zapisywane na dyskach.
  3. Żaden port nie ulega awarii w przypadku awarii jednego z kontrolerów. Dla niektórych ten moment wygląda niezwykle krytycznie. Najważniejsze jest to, że przełączanie w systemie pamięci masowej powinno odbywać się szybciej niż po stronie hosta. I jeśli w przypadku tego samego NetAppa w praktyce zastaliśmy zamrożenie na około 5 sekund przy wyciąganiu kontrolera i przełączaniu ścieżek, to przy przejściu na Huawei trzeba jeszcze poćwiczyć.
  4. Nie ma potrzeby ponownego uruchamiania kontrolera podczas aktualizacji. Szczególnie zaczęło mnie to niepokoić w związku z dość częstym wydawaniem nowych wersji i gałęzi oprogramowania sprzętowego dla NetApps. Tak, niektóre aktualizacje Huawei będą nadal wymagały ponownego uruchomienia, ale nie wszystkie.
  5. 4 kontrolery Huawei w cenie dwóch kontrolerów NetApp. Jak powiedziałem powyżej, dzięki polityce cenowej Huawei może konkurować z modelami ze średniej półki z modelami z wyższej półki.
  6. Obecność dodatkowych chipów w kontrolerach półek i kartach portów, które potencjalnie mają na celu poprawę wydajności systemu.

Wady i ogólne obawy:

  1. Bezpośrednie podłączenie półek do sterowników lub potrzeba dużej liczby portów zaplecza do podłączenia wszystkich półek do kontrolerów.
  2. Architektura ARM i obecność dużej liczby chipów - jak wydajnie będzie to działać i czy wydajność będzie wystarczająca?

Większość obaw i obaw można rozwiać poprzez osobiste przetestowanie nowej linii. Mam nadzieję, że niedługo po premierze pojawią się w Moskwie i będzie ich na tyle, że szybko uda się zdobyć jeden do własnych testów. Na razie można powiedzieć, że ogólnie podejście firmy wygląda interesująco, a nowa linia wypada bardzo dobrze na tle konkurencji. Ostateczna implementacja rodzi wiele pytań, ponieważ Wiele rzeczy zobaczymy dopiero pod koniec roku, a może dopiero w 2020 roku.

Źródło: www.habr.com

Dodaj komentarz