Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Proszę nie wyciągać pochopnych wniosków na podstawie tytułu! Mamy na poparcie tego ważne argumenty i spakowaliśmy je tak zwięźle, jak tylko mogliśmy. Zwracamy uwagę na post dotyczący koncepcji i zasad działania naszego nowego systemu magazynowania, który ukazał się w styczniu 2020 roku.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Naszym zdaniem główną przewagą konkurencyjną rodziny pamięci masowej Dorado V6 jest wspomniana w tytule wydajność i niezawodność. Tak, tak, to takie proste, ale jakie trudne i niezbyt trudne decyzje udało nam się osiągnąć to „proste”, porozmawiamy dzisiaj.

Aby lepiej uwolnić potencjał systemów nowej generacji, porozmawiamy o starszych przedstawicielach gamy modelowej (modele 8000, 18000). O ile nie zaznaczono inaczej, mają być.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Kilka słów o rynku

Aby lepiej zrozumieć miejsce rozwiązań Huawei na rynku, sięgnijmy do sprawdzonej miary –”magiczne kwadranty» Gartnera. Dwa lata temu w sektorze macierzy dyskowych ogólnego przeznaczenia nasza firma śmiało weszła do grona liderów, ustępując jedynie NetApp i Hewlett Packard Enterprise. Pozycja Huawei na rynku pamięci masowej SSD w 2018 roku charakteryzowała się statusem „challengera”, ale czegoś brakowało, by osiągnąć pozycję lidera.

W 2019 roku Gartner w swoim badaniu połączył oba powyższe sektory w jeden – „Main Storage”. W efekcie Huawei ponownie znalazł się w kwadrancie liderów, obok takich dostawców jak IBM, Hitachi Vantara czy Infinidat.

Aby uzupełnić obraz, zauważmy, że Gartner zbiera 80% danych do analizy na rynku amerykańskim, co prowadzi do znacznego uprzedzenia na korzyść tych firm, które są dobrze reprezentowane w USA. Tymczasem dostawcy zorientowani na rynki europejskie i azjatyckie znajdują się w wyraźnie mniej korzystnej sytuacji. Mimo to w zeszłym roku produkty Huawei zajęły należne im miejsce w prawym górnym kwadrancie i według werdyktu Gartnera „mogą być zalecane do użytku”.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Co nowego w Dorado V6

W szczególności linia produktów Dorado V6 jest reprezentowana przez podstawowe systemy z serii 3000. Początkowo wyposażone w dwa kontrolery, można je poziomo rozszerzyć do 16 kontrolerów, 1200 dysków i 192 GB pamięci podręcznej. Ponadto system zostanie wyposażony w zewnętrzne porty Fibre Channel (8/16/32 Gb/s) oraz Ethernet (1/10/25/40/100 Gb/s).

Należy zauważyć, że korzystanie z protokołów, które nie odniosły sukcesu komercyjnego, jest obecnie wycofywane, dlatego na początku zdecydowaliśmy się zrezygnować ze wsparcia Fibre Channel over Ethernet (FCoE) i Infiniband (IB). Zostaną dodane w późniejszych wersjach oprogramowania. Obsługa NVMe over Fabric (NVMe-oF) jest dostępna od razu po Fibre Channel. Kolejne oprogramowanie układowe, którego wydanie zaplanowano na czerwiec, ma obsługiwać tryb NVMe over Ethernet. Naszym zdaniem powyższy zestaw z nawiązką zaspokoi potrzeby większości klientów Huawei.

Dostęp do plików nie jest dostępny w obecnej wersji oprogramowania i pojawi się w jednej z kolejnych aktualizacji pod koniec roku. Implementacja zakładana jest na poziomie natywnym, przez same kontrolery z portami Ethernet, bez użycia dodatkowego sprzętu.

Główna różnica pomiędzy modelem z serii Dorado V6 3000 a starszymi polega na tym, że obsługuje on jeden protokół na zapleczu - SAS 3.0. W związku z tym napędy mogą być używane tylko z nazwanym interfejsem. Z naszego punktu widzenia zapewniana przez to wydajność jest wystarczająca dla urządzenia tego typu.

Systemy Dorado V6 serii 5000 i 6000 to rozwiązania ze średniej półki. Wykonane są również w obudowie 2U i wyposażone w dwa kontrolery. Różnią się od siebie wydajnością, liczbą procesorów, maksymalną liczbą dysków i rozmiarem pamięci podręcznej. Jednak pod względem architektonicznym i inżynierskim Dorado V6 5000 i 6000 są identyczne i wyglądają tak samo.

Do klasy hi-end należą układy Dorado V6 serii 8000 i 18000. Wykonane w rozmiarze 4U, mają domyślnie oddzielną architekturę, w której kontrolery i dyski są oddalone od siebie. Mogą być również dostarczane z co najmniej dwoma kontrolerami, chociaż klienci zazwyczaj proszą o cztery lub więcej.

Dorado V6 8000 skaluje się do 16 kontrolerów, a Dorado V6 18000 do 32. Systemy te mają różne procesory o różnej liczbie rdzeni i rozmiarach pamięci podręcznej. Jednocześnie zachowana jest tożsamość rozwiązań inżynierskich, jak w modelach klasy średniej.

Półki do przechowywania 2U połączone są poprzez RDMA z przepustowością 100 Gb/s. Starszy backend Dorado V6 obsługuje również SAS 3.0, ale więcej na wypadek, gdyby ceny dysków SSD z tym interfejsem znacznie spadły. Wówczas będzie istniała ekonomiczna celowość ich wykorzystania nawet przy uwzględnieniu niższej produktywności. W tej chwili różnica w kosztach między dyskami SSD z interfejsami SAS i NVMe jest tak mała, że ​​nie jesteśmy gotowi polecić takiego rozwiązania.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Wewnątrz kontrolera

Kontrolery Dorado V6 wykonane są na własnej bazie elementów. Żadnych procesorów Intela, żadnych układów ASIC firmy Broadcom. W ten sposób każdy element płyty głównej, jak i sama płyta główna, jest całkowicie wyjęty spod wpływu zagrożeń związanych z presją sankcji ze strony amerykańskich firm. Ci, którzy widzieli na własne oczy którykolwiek z naszych sprzętów, zapewne zauważyli tarcze z czerwonym paskiem pod logo. Oznacza to, że produkt nie zawiera amerykańskich komponentów. Taki jest oficjalny kurs Huawei - przejście na podzespoły własnej produkcji, lub w każdym razie produkowane w krajach, które nie przestrzegają polityki USA.

Oto, co możesz zobaczyć na samej płycie kontrolera.

  • Uniwersalny interfejs sieciowy (chip Hisilicon 1822) odpowiedzialny za połączenie z Fibre Channel lub Ethernet.
  • Zapewnienie zdalnej dostępności układu BMC systemu, czyli Hisilicon 1710, do pełnego zdalnego sterowania i monitorowania systemu. Podobne stosowane są również w naszych serwerach oraz w innych rozwiązaniach.
  • Jednostka centralna, jaką jest układ Kunpeng 920 zbudowany w oparciu o architekturę ARM, wyprodukowany przez firmę Huawei. To on jest pokazany na powyższym schemacie, chociaż inne kontrolery mogą mieć różne modele z inną liczbą rdzeni, innym taktowaniem itp. Liczba procesorów w jednym kontrolerze również zmienia się z modelu na model. Na przykład w starszej serii Dorado V6 są ich cztery na jednej płytce.
  • Kontroler SSD (chip Hisilicon 1812e), który obsługuje zarówno dyski SAS, jak i NVMe. Poza tym Huawei samodzielnie produkuje dyski SSD, ale sam nie produkuje ogniw NAND, woląc kupować je od czterech największych światowych producentów w formie nieoszlifowanych płytek krzemowych. Cięcie, testowanie i pakowanie w chipy Huawei produkuje niezależnie, po czym wypuszcza je pod własną marką.
  • Chip sztucznej inteligencji to Ascend 310. Domyślnie nie ma go w kontrolerze i jest montowany przez osobną kartę, która zajmuje jedno ze gniazd zarezerwowanych dla kart sieciowych. Chip służy do zapewnienia inteligentnego zachowania pamięci podręcznej, zarządzania wydajnością lub procesów deduplikacji i kompresji. Wszystkie te zadania można rozwiązać za pomocą centralnego procesora, ale chip AI pozwala robić to znacznie wydajniej.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Osobno o procesorach Kunpeng

Procesor Kunpeng to układ na chipie (SoC), w którym oprócz jednostki obliczeniowej znajdują się moduły sprzętowe przyspieszające różne procesy, takie jak obliczanie sum kontrolnych czy wykonywanie kodowania wymazywania. Implementuje również wsparcie sprzętowe dla SAS, Ethernet, DDR4 (od sześciu do ośmiu kanałów) itp. Wszystko to pozwala Huawei tworzyć kontrolery pamięci masowej, które nie ustępują wydajnością klasycznym rozwiązaniom Intela.

Ponadto autorskie rozwiązania oparte na architekturze ARM umożliwiają Huawei tworzenie kompletnych rozwiązań serwerowych i oferowanie ich swoim klientom jako alternatywa dla x86.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Nowa architektura Dorado V6…

Wewnętrzna architektura systemu pamięci masowej Dorado V6 ze starszej serii jest reprezentowana przez cztery główne subdomeny (fabryki).

Pierwsza fabryka to wspólny frontend (interfejsy sieciowe odpowiedzialne za komunikację z fabryką SAN lub hostami).

Drugi to zestaw kontrolerów, z których każdy może „sięgać” przez protokół RDMA zarówno do dowolnej karty sieciowej front-end, jak i do sąsiedniego „silnika”, czyli skrzynki z czterema kontrolerami, a także zasilaniem i chłodzeniem wspólne dla nich jednostki. Teraz hi-endowe modele Dorado V6 mogą być wyposażone w dwa takie „silniki” (odpowiednio osiem sterowników).

Trzecia fabryka odpowiada za backend i składa się z kart sieciowych RDMA 100G.

Wreszcie, czwarta fabryka „w sprzęcie” jest reprezentowana przez inteligentne półki do przechowywania typu plug-in.

Ta symetryczna struktura uwalnia pełny potencjał technologii NVMe i gwarantuje wysoką wydajność i niezawodność. Proces I/O jest maksymalnie zrównoleglony między procesorami i rdzeniami, zapewniając jednoczesny odczyt i zapis wielu wątków.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

…i co nam dała

Maksymalna wydajność rozwiązań Dorado V6 jest około trzykrotnie wyższa niż systemów poprzedniej generacji (tej samej klasy) i może osiągnąć 20 milionów IOPS.

Wynika to z faktu, że w poprzedniej generacji urządzeń obsługa NVMe obejmowała tylko szuflady z napędami. Teraz jest obecny na wszystkich etapach, od hosta po dysk SSD. Sieć zaplecza również przeszła zmiany: SAS/PCIe ustąpił miejsca RoCEv2 o przepustowości 100 Gb/s.

Zmienił się również format dysku SSD. Jeśli wcześniej na półkę 2U przypadało 25 dysków, teraz została ona powiększona do 36 dysków fizycznych wielkości dłoni. Ponadto półki „zmądrzały”. Każdy z nich posiada teraz odporny na uszkodzenia układ dwóch kontrolerów oparty na układach ARM, podobny do tych zainstalowanych w kontrolerach centralnych.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Do tej pory zajmują się tylko reorganizacją danych, ale wraz z wydaniem nowego oprogramowania układowego zostanie do niego dodane kodowanie kompresji i kasowania, co zmniejszy obciążenie głównych kontrolerów z 15 do 5%. Jednoczesne przeniesienie niektórych zadań na półkę zwalnia przepustowość sieci wewnętrznej. A to wszystko znacznie zwiększa potencjał skalowalności systemu.

Kompresję i deduplikację w systemie pamięci masowej poprzedniej generacji wykonywano za pomocą bloków o stałej długości. Teraz dodano tryb pracy z blokami o zmiennej długości, który do tej pory trzeba było włączać na siłę. Kolejne aktualizacje mogą zmienić tę okoliczność.

Także krótko o tolerancji na niepowodzenia. Dorado V3 pozostawało sprawne, jeśli jeden z dwóch kontrolerów uległ awarii. Dorado V6 zapewni dostępność danych nawet w przypadku awarii siedmiu z ośmiu kontrolerów lub czterech z jednego silnika jednocześnie.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Niezawodność pod względem ekonomicznym

Ostatnio wśród klientów Huawei przeprowadzono ankietę na temat tego, ile przestojów poszczególnych elementów infrastruktury IT firma uważa za dopuszczalne. Respondenci w większości tolerowali hipotetyczną sytuację, w której aplikacja nie odpowiada w ciągu kilkuset sekund. W przypadku systemu operacyjnego lub adaptera magistrali hosta dziesiątki sekund (zasadniczo czas ponownego uruchomienia) były krytycznym przestojem. Klienci stawiają sieci jeszcze wyższe wymagania: jej przepustowość nie powinna zanikać na dłużej niż 10–20 sekund. Jak można się domyślić, najważniejsi respondenci rozważali awarie systemu pamięci masowej. Z punktu widzenia przedstawicieli biznesu proste przechowywanie nie powinno przekraczać… kilku sekund w roku!

Innymi słowy, jeśli aplikacja kliencka banku nie odpowiada przez 100 sekund, najprawdopodobniej nie spowoduje to katastrofalnych konsekwencji. Ale jeśli system magazynowania nie działa dla tej samej kwoty, prawdopodobne jest zatrzymanie działalności i znaczne straty finansowe.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Powyższy wykres pokazuje koszt godziny pracy dla dziesięciu największych banków (dane Forbesa za 2017 rok). Zgadzam się, jeśli Twoja firma zbliża się do rozmiarów chińskich banków, nie będzie tak trudno uzasadnić potrzebę zakupu systemów pamięci masowej za kilka milionów dolarów. Słuszne jest również stwierdzenie odwrotne: jeśli firma nie ponosi znacznych strat podczas przestojów, jest mało prawdopodobne, aby kupował hi-endowe systemy pamięci masowej. W każdym razie ważne jest, aby mieć pojęcie o tym, jakiego rozmiaru dziura grozi powstaniem w portfelu, podczas gdy administrator systemu zajmuje się systemem pamięci masowej, który odmówił działania.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Sekunda na przełączanie awaryjne

W rozwiązaniu A na powyższej ilustracji można rozpoznać nasz system Dorado V3 poprzedniej generacji. Jego cztery kontrolery działają w parach, a tylko dwa kontrolery zawierają kopie pamięci podręcznej. Kontrolery w parze mogą redystrybuować obciążenie. Jednocześnie, jak widać, nie ma tutaj „fabryk” front-endu i back-endu, więc każda z półek do przechowywania jest połączona z konkretną parą kontrolerów.

Diagram rozwiązania B przedstawia rozwiązanie dostępne obecnie na rynku od innego dostawcy (rozpoznanego?). Są tu już fabryki front-endu i back-endu, a dyski są podłączone do czterech kontrolerów jednocześnie. To prawda, że ​​\uXNUMXb\uXNUMXbistnieją niuanse, które nie są oczywiste w pierwszym przybliżeniu w pracy wewnętrznych algorytmów systemu.

Po prawej stronie znajduje się nasza aktualna architektura pamięci masowej Dorado V6 z pełnym zestawem elementów wewnętrznych. Zastanów się, jak te systemy przetrwają typową sytuację - awarię jednego kontrolera.

W klasycznych systemach, do których należy Dorado V3, czas potrzebny do redystrybucji obciążenia w przypadku awarii sięga czterech sekund. W tym czasie I/O zatrzymuje się całkowicie. Rozwiązanie B od naszych kolegów, pomimo nowocześniejszej architektury, ma jeszcze dłuższy czas przestoju w przypadku awarii wynoszący sześć sekund.

Storage Dorado V6 przywraca swoją pracę w zaledwie sekundę po awarii. Wynik ten osiągnięto dzięki jednorodnemu wewnętrznemu środowisku RDMA, które umożliwia kontrolerowi dostęp do „obcej” pamięci. Drugą ważną okolicznością jest obecność fabryki front-end, dzięki której ścieżka dla hosta się nie zmienia. Port pozostaje ten sam, a obciążenie jest po prostu wysyłane do sprawnych kontrolerów przez wieloprzebiegowe sterowniki.

Awaria drugiego kontrolera w Dorado V6 jest rozwiązywana w ciągu jednej sekundy według tego samego schematu. Dorado V3 zajmuje około sześciu sekund, a rozwiązanie innego dostawcy zajmuje dziewięć. W przypadku wielu DBMS takich odstępów nie można już uznać za akceptowalne, ponieważ w tym czasie system przechodzi w tryb gotowości i przestaje działać. Dotyczy to przede wszystkim DBMS składającego się z wielu sekcji.

Awaria trzeciego kontrolera Rozwiązanie A nie jest w stanie przetrwać. Po prostu z powodu utraty dostępu do części dysków z danymi. Z kolei Solution B w takiej sytuacji przywraca swoją zdolność do pracy, co zajmuje, podobnie jak w poprzednim przypadku, dziewięć sekund.

Co jest w Dorado V6? Sekundę.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Co można zrobić w sekundę

Prawie nic, ale nie potrzebujemy tego. Po raz kolejny w Dorado V6 klasy hi-end fabryka front-end jest oddzielona od fabryki kontrolerów. Oznacza to, że nie ma zakodowanych na stałe portów należących do konkretnego kontrolera. Przełączanie awaryjne nie obejmuje znajdowania alternatywnych ścieżek ani ponownego inicjowania wieloprzebiegowości. System nadal działa tak jak wcześniej.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Wielokrotna tolerancja awarii

Starsze modele Dorado V6 z łatwością przetrwają jednoczesną awarię dowolnych dwóch (!) Kontrolerów z dowolnych „silników”. Jest to możliwe dzięki temu, że rozwiązanie przechowuje teraz trzy kopie pamięci podręcznej. Dlatego nawet przy podwójnej awarii zawsze będzie jedna kompletna kopia.

Synchroniczna awaria wszystkich czterech kontrolerów w jednym z „silników” również nie spowoduje fatalnych konsekwencji, ponieważ wszystkie trzy kopie pamięci podręcznej są dystrybuowane między „silnikami” w dowolnym momencie. Sam system monitoruje przestrzeganie takiej logiki pracy.

Wreszcie bardzo mało prawdopodobnym scenariuszem jest sekwencyjna awaria siedmiu z ośmiu kontrolerów. Ponadto minimalny dopuszczalny odstęp czasu dla utrzymania sprawności między poszczególnymi awariami wynosi 15 minut. W tym czasie system pamięci masowej ma czas na wykonanie operacji niezbędnych do migracji pamięci podręcznej.

Ostatni zachowany kontroler będzie prowadził magazyn danych i utrzymywał pamięć podręczną przez pięć dni (wartość domyślna, którą można łatwo zmienić w ustawieniach). Następnie pamięć podręczna zostanie wyłączona, ale system pamięci masowej będzie nadal działał.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Nie przeszkadzające aktualizacje

Nowy system operacyjny Dorado V6 umożliwia aktualizację oprogramowania pamięci masowej bez ponownego uruchamiania kontrolerów.

System operacyjny, podobnie jak w przypadku poprzednich rozwiązań, bazuje na Linuksie, jednak wiele procesów operacyjnych zostało przeniesionych z jądra do trybu użytkownika. Większość funkcji, takich jak te odpowiedzialne za deduplikację i kompresję, to teraz zwykłe demony działające w tle. Dzięki temu nie trzeba zmieniać całego systemu operacyjnego, aby zaktualizować poszczególne moduły. Załóżmy, że aby dodać obsługę nowego protokołu, konieczne będzie jedynie wyłączenie odpowiedniego modułu oprogramowania i uruchomienie nowego.

Oczywiste jest, że nadal pozostają kwestie aktualizacji całego systemu, ponieważ w jądrze mogą znajdować się elementy, które wymagają aktualizacji. Ale te, zgodnie z naszymi obserwacjami, stanowią mniej niż 6% całości. Pozwala to na ponowne uruchamianie kontrolerów dziesięć razy rzadziej niż wcześniej.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Rozwiązania odporne na awarie i wysokiej dostępności (HA/DR).

Dorado V6 po wyjęciu z pudełka jest gotowe do integracji z rozwiązaniami rozproszonymi geograficznie, klastrami na poziomie miasta (metro) i „potrójnymi” centrami danych.

Po lewej stronie powyższej ilustracji znajduje się klaster metra, który jest już znany wielu. Dwa systemy magazynowania działają w trybie aktywny/aktywny w odległości do 100 km od siebie. Taka infrastruktura z jednym lub kilkoma serwerami kworum może być obsługiwana przez rozwiązania różnych firm, w tym nasz chmurowy system operacyjny FusionSphere. Szczególne znaczenie w tego typu projektach ma charakterystyka kanału pomiędzy lokacjami, wszystkie inne zadania w naszym przypadku przejmuje funkcja HyperMetro, ponownie dostępna od razu po wyjęciu z pudełka. Integracja jest możliwa po Fibre Channel, a także iSCSI w sieciach IP, jeśli zajdzie taka potrzeba. Nie ma już potrzeby obowiązkowej obecności dedykowanej „ciemnej” optyki, ponieważ system może komunikować się za pośrednictwem istniejących kanałów.

Podczas budowania takich systemów jedynym wymogiem sprzętowym do przechowywania danych jest przydział portów do replikacji. Wystarczy zakupić licencję, uruchomić kworum serwerów - fizyczne lub wirtualne - oraz zapewnić łączność IP do kontrolerów (10 Mbps, 50 ms).

Tę architekturę można łatwo przenieść do systemu z trzema centrami danych (patrz ilustracja po prawej stronie). Na przykład, gdy dwa centra danych działają w trybie klastra metropolitalnego, a trzecia lokalizacja, zlokalizowana w odległości ponad 100 km, wykorzystuje replikację asynchroniczną.

System wspiera technologicznie różne scenariusze biznesowe, które zostaną zrealizowane w przypadku wystąpienia nadwyżki na dużą skalę.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Przetrwanie klastra metra z wieloma awariami

Powyżej i poniżej pokazano również klasyczny klaster metropolitalny składający się z dwóch systemów pamięci masowej i serwera kworum. Jak widać, w sześciu z dziewięciu możliwych scenariuszy wielokrotnych awarii nasza infrastruktura będzie działać.

Na przykład w drugim scenariuszu, jeśli serwer kworum ulegnie awarii i nastąpi synchronizacja między lokacjami, system pozostanie produktywny, ponieważ druga lokacja przestanie działać. To zachowanie jest już wbudowane we wbudowane algorytmy.

Nawet po trzech awariach dostęp do informacji może być utrzymany, jeśli przerwa między nimi wynosi co najmniej 15 sekund.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Zwykła karta atutowa z rękawa

Przypomnijmy, że Huawei produkuje nie tylko systemy pamięci masowej, ale także pełną gamę sprzętu sieciowego. Niezależnie od tego, jakiego dostawcę pamięci masowej wybierzesz, jeśli między lokacjami wykorzystywana jest sieć WDM, w 90% przypadków będzie ona zbudowana na rozwiązaniach naszej firmy. Powstaje logiczne pytanie: po co tworzyć zoo systemów, skoro cały sprzęt, który gwarantuje kompatybilność ze sobą, można uzyskać od jednego dostawcy?

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Do pytania o wydajność

Chyba nikogo nie trzeba przekonywać, że przejście na pamięć masową All-Flash może znacznie obniżyć koszty utrzymania infrastruktury, ponieważ wszystkie rutynowe operacje są wykonywane wielokrotnie szybciej. Świadczą o tym wszyscy dostawcy takiego sprzętu. Tymczasem wielu dostawców zaczyna być przebiegłych, jeśli chodzi o degradację wydajności, gdy włączone są różne tryby przechowywania.

W naszej branży powszechną praktyką jest wystawianie systemów pamięci masowej na działanie próbne na jeden lub dwa dni. Sprzedawca przeprowadza 20-minutowy test na pustym systemie, uzyskując kosmiczne wyniki wydajności. A podczas prawdziwej pracy „podwodne grabie” szybko się czołgają. Po dniu piękne wartości IOPS zmniejszają się o połowę lub trzykrotnie, a jeśli system pamięci masowej jest wypełniony o 80%, okazują się jeszcze mniejsze. Gdy RAID 5 jest włączony zamiast RAID 10, traci się kolejne 10-15%, aw trybie klastra metropolitalnego wydajność spada dodatkowo o połowę.

Wszystko wymienione powyżej nie dotyczy Dorado V6. Nasi klienci mają możliwość przeprowadzenia testu wydajności w weekend lub przynajmniej w nocy. Wtedy objawia się wyrzucanie śmieci, a także staje się jasne, jak aktywacja różnych opcji - takich jak migawki i replikacja - wpływa na ilość osiąganych IOPS.

W Dorado V6 migawki i RAID z parzystością prawie nie mają wpływu na wydajność (3-5% zamiast 10-15%). Wyrzucanie śmieci (wypełnianie komórek dysku zerami), kompresja, deduplikacja w systemie pamięci masowej zapełnionym w 80% zawsze będą miały wpływ na ogólną szybkość przetwarzania żądań. Ale to Dorado V6 jest interesujące w tym, że bez względu na to, jaką kombinację funkcji i mechanizmów ochronnych aktywujesz, ostateczna wydajność przechowywania nie spadnie poniżej 80% wartości uzyskanej bez obciążenia.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Równoważenie obciążenia

Wysoką wydajność Dorado V6 osiąga się poprzez wyważenie na każdym etapie, a mianowicie:

  • wieloprzebiegowy;
  • korzystanie z wielu połączeń z jednego hosta;
  • dostępność fabryki front-end;
  • równoległość działania kontrolerów pamięci masowej;
  • rozkład obciążenia na wszystkie dyski na poziomie RAID 2.0+.

Zasadniczo jest to powszechna praktyka. W dzisiejszych czasach niewiele osób przechowuje wszystkie dane w jednej jednostce LUN: wszyscy starają się mieć ich osiem, a nawet czterdzieści, a nawet więcej. To oczywiste i słuszne podejście, które podzielamy. Ale jeśli Twoje zadanie wymaga tylko jednej jednostki LUN, która jest łatwiejsza w utrzymaniu, nasze rozwiązania architektoniczne pozwalają osiągnąć 80% wydajności dostępnej przy wielu jednostkach LUN.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Dynamiczne planowanie procesora

Rozkład obciążenia procesorów podczas korzystania z jednego LUN jest realizowany w następujący sposób: zadania na poziomie LUN są podzielone na osobne małe „odłamki”, z których każdy jest sztywno przypisany do konkretnego kontrolera w „silniku”. Odbywa się to tak, aby system nie tracił wydajności podczas „przeskakiwania” z tym fragmentem danych między różnymi kontrolerami.

Innym mechanizmem utrzymywania wysokiej wydajności jest dynamiczne szeregowanie, w którym określone rdzenie procesorów mogą być przydzielane do różnych pul zadań. Przykładowo, jeśli system jest teraz bezczynny na poziomie deduplikacji i kompresji, to część rdzeni może być zaangażowana w proces obsługi wejść/wyjść. Lub odwrotnie. Wszystko to odbywa się automatycznie i w sposób przejrzysty dla użytkownika.

Dane o bieżącym obciążeniu każdego z rdzeni Dorado V6 nie są wyświetlane w interfejsie graficznym, ale za pomocą wiersza poleceń można uzyskać dostęp do systemu operacyjnego kontrolera i użyć zwykłego polecenia systemu Linux Top.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Obsługa NVMe i RoCE

Jak już wspomniano, Dorado V6 obecnie w pełni obsługuje NVMe przez Fibre Channel po wyjęciu z pudełka i nie wymaga żadnych licencji. W połowie roku pojawi się wsparcie dla trybu NVMe over Ethernet. Do pełnego wykorzystania potrzebne będzie wsparcie Ethernetu z bezpośrednim dostępem do pamięci (DMA) w wersji v2.0 zarówno z samego systemu pamięci masowej, jak iz przełączników i kart sieciowych. Na przykład, takie jak Mellanox ConnectX-4 lub ConnectX-5. Możesz także skorzystać z kart sieciowych wykonanych na bazie naszych chipów. Ponadto obsługa RoCE musi być zaimplementowana na poziomie systemu operacyjnego.

Ogólnie rzecz biorąc, uważamy Dorado V6 za system zorientowany na NVMe. Pomimo istniejącego wsparcia dla Fibre Channel i iSCSI, w przyszłości planowane jest przejście na szybki Ethernet z RDMA.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Szczypta marketingu

Ze względu na to, że system Dorado V6 jest wysoce odporny na awarie, dobrze skaluje się, obsługuje różne technologie migracji itp., ekonomiczny efekt jego nabycia staje się widoczny wraz z rozpoczęciem intensywnego użytkowania systemów pamięci masowej. Będziemy nadal starać się, aby posiadanie systemu było jak najbardziej opłacalne, nawet jeśli na pierwszym etapie nie jest to oczywiste.

W szczególności stworzyliśmy program FLASH EVER związany z wydłużaniem cyklu życia systemów pamięci masowych i mający na celu maksymalne odciążenie klienta podczas modernizacji.

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Program ten obejmuje szereg działań:

  • możliwość stopniowej wymiany kontrolerów i półek na dyski na nowe wersje bez wymiany całego sprzętu (dla hi-endowych systemów Dorado V6);
  • możliwość przechowywania federacyjnego (łączenie różnych wersji Dorado w ramach jednego hybrydowego klastra pamięci masowej);
  • inteligentna wirtualizacja (możliwość wykorzystania sprzętu firm trzecich w ramach rozwiązania Dorado).

Dlaczego OceanStor Dorado V6 to najszybsze i najbardziej niezawodne rozwiązanie pamięci masowej

Należy zauważyć, że trudna sytuacja na świecie miała niewielki wpływ na komercyjne perspektywy nowego systemu. Pomimo tego, że oficjalna premiera Dorado V6 miała miejsce dopiero w styczniu, widzimy na nią duże zapotrzebowanie w Chinach, a także duże zainteresowanie nią ze strony rosyjskich i międzynarodowych partnerów z sektora finansowego i rządowego.

Między innymi w związku z pandemią, bez względu na to, jak długo one potrwają, kwestia udostępnienia zdalnym pracownikom wirtualnych pulpitów jest szczególnie dotkliwa. W tym procesie Dorado V6 może również usunąć wiele pytań. W tym celu dokładamy wszelkich starań, w tym praktycznie uzgadniamy wpisanie nowego systemu na listę kompatybilności VMware.

***

Przy okazji nie zapomnij o naszych licznych seminariach internetowych, które odbywają się nie tylko w segmencie rosyjskojęzycznym, ale także na poziomie globalnym. Lista webinarów na kwiecień dostępna jest pod adresem powiązanie.

Źródło: www.habr.com

Dodaj komentarz