Lato w Moskwie w tym roku, szczerze mówiąc, nie było zbyt udane. Zaczęło się zbyt wcześnie i szybko, nie wszyscy zdążyli na to zareagować, a skończyło się już pod koniec czerwca. Dlatego też, gdy Huawei zaprosił mnie do Chin, do miasta Chengdu, gdzie znajduje się ich centrum badawczo-rozwojowe, po zapoznaniu się z prognozą pogody +34 stopni w cieniu, od razu się zgodziłem. Przecież nie jestem już w tym samym wieku i muszę trochę rozgrzać kości. Chciałbym jednak zauważyć, że udało się ogrzać nie tylko kości, ale także wnętrzności, ponieważ prowincja Syczuan, w której faktycznie znajduje się Chengdu, słynie z zamiłowania do pikantnego jedzenia. Ale to wciąż nie jest blog o podróżach, więc wróćmy do głównego celu naszej podróży - nowej linii systemów przechowywania - Huawei Dorado V6. Ten artykuł odwiedzie Cię trochę od przeszłości, ponieważ... został napisany przed oficjalnym ogłoszeniem, ale opublikowany dopiero po wydaniu. I tak dzisiaj przyjrzymy się bliżej wszystkiemu ciekawemu i smacznemu, co przygotował dla nas Huawei.
W nowej linii znajdzie się 5 modeli. Wszystkie modele z wyjątkiem 3000V6 można nabyć w dwóch wersjach – SAS i NVMe. Wybór określa interfejs dysków, które można wykorzystać w tym systemie, porty zaplecza oraz liczbę napędów dyskowych, które można zainstalować w systemie. W przypadku NVMe stosowane są dyski SSD wielkości dłoni, które są cieńsze niż klasyczne 2.5-calowe dyski SSD SAS i można je zainstalować w maksymalnie 36 elementach. Nowa linia to All Flash i nie ma konfiguracji z dyskami.
Dysk SSD Palm NVMe
Najciekawsze moim zdaniem wyglądają Dorado 8000 i 18000. Huawei pozycjonuje je jako systemy z najwyższej półki i dzięki polityce cenowej Huawei zestawia te modele ze średniej półki z segmentem konkurencji. To właśnie na tych modelach skupię się dzisiaj w mojej recenzji. Od razu zauważę, że juniorskie systemy z dwoma kontrolerami ze względu na swoje cechy konstrukcyjne mają nieco inną architekturę, inną niż Dorado 8000 i 18000, więc nie wszystko, o czym dzisiaj powiem, ma zastosowanie do młodszych modeli.
Jedną z głównych cech nowych systemów było zastosowanie kilku opracowanych wewnętrznie chipów, z których każdy pozwala na rozłożenie obciążenia logicznego z centralnego procesora kontrolera i dodanie funkcjonalności do różnych komponentów.
Sercem nowych układów są procesory Kunpeng 920, opracowane w oparciu o technologie ARM i produkowane niezależnie przez Huawei. W zależności od modelu liczba rdzeni, ich częstotliwość oraz liczba zainstalowanych procesorów w każdym kontrolerze jest różna:
Huawei Dorado V6 8000 – 2 procesory, 64 rdzenie
Huawei Dorado V6 18000 – 4 procesory, 48 rdzenie
Huawei opracował ten procesor na architekturze ARM i o ile wiem, początkowo planował zainstalować go tylko w starszych modelach Dorado 8000 i 18000, jak to miało już miejsce w przypadku niektórych modeli V5, ale sankcje skorygowały ten pomysł. Oczywiście ARM mówił też o odmowie współpracy z Huawei podczas nakładania sankcji, ale tutaj sytuacja jest inna niż z Intelem. Huawei produkuje te chipy niezależnie i żadne sankcje nie są w stanie zatrzymać tego procesu. Zerwanie relacji z ARM grozi jedynie utratą dostępu do nowych rozwiązań. Jeśli chodzi o wydajność, będzie można ocenić dopiero po przeprowadzeniu niezależnych testów. Choć widziałem, jak bez problemu usunięto 18000M IOPS z systemu Dorado 1, dopóki nie powtórzę tego własnymi rękami w szafie, nie uwierzę. Ale w kontrolerach naprawdę jest dużo mocy. Starsze modele wyposażone są w 4 kontrolery, każdy z 4 procesorami, co daje łącznie 768 rdzeni.
O rdzeniach opowiem jednak jeszcze później, gdy przyjrzymy się architekturze nowych układów, ale na razie wróćmy do innego chipa instalowanego w systemie. Chip wygląda na niezwykle ciekawe rozwiązanie
Przejdźmy do architektury. Huawei w dalszym ciągu rozwija własną technologię Smart Matrix, która wykorzystuje podejście oparte na pełnej siatce do łączenia komponentów. Ale jeśli w wersji 5 dotyczyło to tylko dostępu kontrolerów do dysków, teraz wszystkie kontrolery mają dostęp do wszystkich portów zarówno w back-endzie, jak i front-endzie.
Dzięki nowej architekturze mikroserwisów umożliwia to również równoważenie obciążenia pomiędzy wszystkimi kontrolerami, nawet jeśli jest tylko jeden lun. System operacyjny dla tej linii macierzy został opracowany od podstaw, a nie po prostu zoptymalizowany pod kątem korzystania z dysków Flash. Dzięki temu, że wszystkie nasze kontrolery mają dostęp do tych samych portów, w przypadku awarii kontrolera lub restartu host nie traci ani jednej ścieżki do systemu pamięci masowej, a przełączanie ścieżek odbywa się na poziomie systemu pamięci masowej. Jednakże użycie UltraPath na hoście nie jest bezwzględnie konieczne. Kolejną „oszczędnością” przy instalacji systemu jest mniejsza liczba niezbędnych łączy. A jeśli przy „klasycznym” podejściu na 4 kontrolery będziemy potrzebować 8 łączy z 2 fabryk, to w przypadku Huawei wystarczą nawet 2 (nie mówię teraz o wystarczającej przepustowości jednego łącza).
Podobnie jak w poprzedniej wersji używana jest globalna pamięć podręczna z dublowaniem. Umożliwia to utratę maksymalnie dwóch kontrolerów jednocześnie lub trzech kontrolerów sekwencyjnie bez wpływu na dostępność. Warto jednak zaznaczyć, że na stanowisku demonstracyjnym nie zaobserwowaliśmy pełnego równoważenia obciążenia pomiędzy pozostałymi 3 kontrolerami w przypadku jednej awarii. Obciążenie uszkodzonego sterownika zostało w całości przejęte przez jeden z pozostałych. Możliwe, że w tym celu konieczne będzie dłuższe działanie systemu w tej konfiguracji. W każdym razie sprawdzę to dokładniej, korzystając z własnych testów.
Huawei pozycjonuje nowe systemy jako kompleksowe systemy NVMe, ale obecnie NVMeOF nie jest jeszcze obsługiwany na froncie, a jedynie FC, iSCSI lub NFS. Na końcu tej lub na początku następnej, podobnie jak w przypadku innych funkcji, obiecujemy wsparcie RoCE.
Półki są również połączone ze sterownikami za pomocą RoCE i wiąże się to z jedną wadą - brakiem połączenia półek typu „loopback”, jak miało to miejsce w przypadku SAS. Moim zdaniem jest to i tak dość duża wada, jeśli planuje się dość duży system. Faktem jest, że wszystkie półki są połączone szeregowo, a awaria jednej z półek skutkuje całkowitą niedostępnością pozostałych, które za nią podążają. W tym przypadku, aby zapewnić odporność na awarie, będziemy musieli podłączyć wszystkie półki do kontrolerów, co wiąże się ze zwiększeniem wymaganej liczby portów backendowych w systemie.
I jeszcze jedna rzecz, o której warto wspomnieć, to aktualizacja bez zakłóceń (NDU). Jak powiedziałem powyżej, Huawei wdrożył kontenerowe podejście do obsługi systemu operacyjnego dla nowej linii Dorado, pozwala to na aktualizację i ponowne uruchomienie usług bez konieczności całkowitego restartu kontrolera. Warto od razu wspomnieć, że niektóre aktualizacje będą zawierać aktualizacje jądra i w tym przypadku czasami w trakcie aktualizacji wymagany będzie klasyczny restart kontrolerów, ale nie zawsze. Zmniejszy to wpływ tej operacji na system produkcyjny.
W naszym arsenale zdecydowana większość tablic pochodzi z NetApp. Dlatego myślę, że całkiem logiczne będzie, jeśli dokonam małego porównania z systemami, z którymi muszę sporo pracować. Nie jest to próba określenia, kto jest lepszy, a kto gorszy, czyja architektura jest korzystniejsza. Spróbuję na trzeźwo i bez fanatyzmu porównać dwa różne podejścia do rozwiązania tego samego problemu u różnych dostawców. Tak, oczywiście, w tym przypadku rozważymy systemy Huawei w „teorii” i osobno odnotuję również te punkty, które są planowane do wdrożenia w przyszłych wersjach oprogramowania. Jakie zalety widzę w tej chwili:
- Liczba obsługiwanych dysków NVMe. NetApp ma ich obecnie 288, zaś Huawei 1600-6400, w zależności od modelu. Jednocześnie maksymalna pojemność użytkowa Huawei wynosi 32PBe, podobnie jak systemy NetApp (dokładniej mają 31.64PBe). I to pomimo tego, że obsługiwane są dyski o tej samej pojemności (do 15 TB). Huawei tłumaczy ten fakt następująco: nie mieli możliwości zmontowania większej podstawki. Teoretycznie nie mają ograniczenia objętości, ale po prostu nie byli jeszcze w stanie przetestować tego faktu. Ale tutaj warto zauważyć, że możliwości współczesnych dysków flash są bardzo duże, a w przypadku systemów NVMe mamy do czynienia z faktem, że 24 dyski wystarczą, aby wykorzystać najwyższej klasy system z 2 kontrolerami. W związku z tym dalszy wzrost liczby dysków w systemie nie tylko nie zapewni wzrostu wydajności, ale będzie miał również niekorzystny wpływ na stosunek IOPS/Tb. Oczywiście warto zobaczyć, ile napędów mogą obsłużyć 4-kontrolerowe systemy 8000 i 16000, bo... Możliwości i potencjał Kunpeng 920 nadal nie są do końca jasne.
- Obecność Luna jako właściciela systemów NetApp. Te. Tylko jeden kontroler może wykonywać operacje na Księżycu, podczas gdy drugi przepuszcza tylko IO przez siebie. Systemy Huawei natomiast nie mają żadnych właścicieli, a operacje na blokach danych (kompresja, deduplikacja) mogą być wykonywane przez dowolny z kontrolerów, a także zapisywane na dyskach.
- Żaden port nie ulega awarii w przypadku awarii jednego z kontrolerów. Dla niektórych ten moment wygląda niezwykle krytycznie. Najważniejsze jest to, że przełączanie w systemie pamięci masowej powinno odbywać się szybciej niż po stronie hosta. I jeśli w przypadku tego samego NetAppa w praktyce zastaliśmy zamrożenie na około 5 sekund przy wyciąganiu kontrolera i przełączaniu ścieżek, to przy przejściu na Huawei trzeba jeszcze poćwiczyć.
- Nie ma potrzeby ponownego uruchamiania kontrolera podczas aktualizacji. Szczególnie zaczęło mnie to niepokoić w związku z dość częstym wydawaniem nowych wersji i gałęzi oprogramowania sprzętowego dla NetApps. Tak, niektóre aktualizacje Huawei będą nadal wymagały ponownego uruchomienia, ale nie wszystkie.
- 4 kontrolery Huawei w cenie dwóch kontrolerów NetApp. Jak powiedziałem powyżej, dzięki polityce cenowej Huawei może konkurować z modelami ze średniej półki z modelami z wyższej półki.
- Obecność dodatkowych chipów w kontrolerach półek i kartach portów, które potencjalnie mają na celu poprawę wydajności systemu.
Wady i ogólne obawy:
- Bezpośrednie podłączenie półek do sterowników lub potrzeba dużej liczby portów zaplecza do podłączenia wszystkich półek do kontrolerów.
- Architektura ARM i obecność dużej liczby chipów - jak wydajnie będzie to działać i czy wydajność będzie wystarczająca?
Większość obaw i obaw można rozwiać poprzez osobiste przetestowanie nowej linii. Mam nadzieję, że niedługo po premierze pojawią się w Moskwie i będzie ich na tyle, że szybko uda się zdobyć jeden do własnych testów. Na razie można powiedzieć, że ogólnie podejście firmy wygląda interesująco, a nowa linia wypada bardzo dobrze na tle konkurencji. Ostateczna implementacja rodzi wiele pytań, ponieważ Wiele rzeczy zobaczymy dopiero pod koniec roku, a może dopiero w 2020 roku.
Źródło: www.habr.com