Dzielimy się naszym doświadczeniem, jak działają dyski SSD w ramach RAID i który poziom macierzy jest bardziej opłacalny

В materiał z przeszłości rozważaliśmy już kwestię „Czy zastosujemy RAID na SSD” na przykładzie dysków Kingston, ale zrobiliśmy to tylko na poziomie zerowym. W bieżącym artykule przeanalizujemy możliwości wykorzystania profesjonalnych i domowych rozwiązań NVMe w najpopularniejszych typach macierzy RAID oraz porozmawiamy o kompatybilności kontrolerów. Broadcom z dyskami Kingston.

Dzielimy się naszym doświadczeniem, jak działają dyski SSD w ramach RAID i który poziom macierzy jest bardziej opłacalny

Dlaczego potrzebujesz RAID na dysku SSD?

Zaletą macierzy pamięci masowej opartych na dyskach SSD w porównaniu z macierzami pamięci masowej HDD jest krótszy czas dostępu do danych na dysku oraz doskonała wydajność odczytu/zapisu. Jednak idealna wydajność macierzy RAID opartej na dyskach SSD wymaga optymalnej kombinacji procesora, pamięci podręcznej, oprogramowania i sprzętu. Gdy wszystkie te czynniki doskonale ze sobą współgrają, macierz SSD RAID może znacznie przewyższyć porównywalną konfigurację wykorzystującą tradycyjne dyski twarde.

Typowy dysk SSD zużywa mniej energii niż dysk twardy, więc po połączeniu dużej liczby dysków SSD w macierz RAID oszczędność energii w porównaniu z macierzą HDD RAID może również przełożyć się na niższe koszty korporacyjnych rachunków za energię.

SSD RAID ma jednak ograniczenia i wady, w szczególności wyższą cenę za gigabajt przestrzeni w porównaniu do dysków twardych o porównywalnej pojemności. A czas między awariami pamięci flash jest ograniczony do określonej liczby cykli przepisywania. Oznacza to, że dyski SSD mają określoną żywotność, która zależy od operacji: im więcej informacji zostanie na nich nadpisanych, tym szybciej dysk ulegnie awarii. Z drugiej strony korporacyjne dyski SSD mają przyzwoitą żywotność porównywalną z mechanicznymi dyskami twardymi.

Jak działają dyski SSD firmy Kingston w trybie RAID z kontrolerami Broadcom

We wczesnych latach dysków SSD projekty RAID miały wiele niuansów. Między innymi dzięki zastosowaniu mniej odpornych na awarie dysków twardych. Dyski półprzewodnikowe są znacznie bardziej niezawodne niż ich odpowiedniki oparte na dyskach magnetycznych. Jak wiemy, w rozwiązaniach SSD nie ma ruchomych części, więc uszkodzenia mechaniczne są zredukowane do zera. Awaria dysków półprzewodnikowych z powodu skoków napięcia jest również mało prawdopodobna, biorąc pod uwagę, że na poziomie domowego komputera i dowolnego serwera chronią cię UPS, zabezpieczenia przeciwprzepięciowe, a nawet zasilacz.

Jednocześnie dyski półprzewodnikowe mają jeszcze jedną istotną zaletę: nawet jeśli komórki pamięci są zużyte do zapisu, nadal można z nich odczytać dane, ale jeśli dysk magnetyczny jest uszkodzony, niestety.

Dzielimy się naszym doświadczeniem, jak działają dyski SSD w ramach RAID i który poziom macierzy jest bardziej opłacalny

Obecnie dość normalną praktyką jest stosowanie rozwiązań SSD w macierzach RAID o różnych poziomach. Najważniejsze jest, aby wybrać odpowiednie dyski SSD, których opóźnienie jest minimalne. A najlepiej używaj dysków SSD tego samego producenta i tego samego modelu, aby nie skończyć z mieszanką dysków obsługujących różne rodzaje obciążeń i zbudowanych w oparciu o różne typy pamięci, kontrolerów i inne technologie. Oznacza to, że jeśli zdecydujemy się na zakup czterech lub 16 dysków SSD NVMe firmy Kingston w celu stworzenia macierzy RAID, lepiej będzie, jeśli wszystkie będą pochodzić z tej samej serii i zakresu modeli.

Swoją drogą, w ostatni artykuł nie bez powodu cytowaliśmy kontrolery Broadcom, gdy rozmawialiśmy o NVMe SSD firmy Kingston. Faktem jest, że instrukcje obsługi tych urządzeń od razu podają kompatybilne dyski (w tym rozwiązania wspomnianego amerykańskiego producenta SSD), z którymi kontroler będzie działał bez zarzutu. Na tych informacjach należy polegać przy wyborze pakietu kontroler-SSD dla RAID.

Analizujemy pracę SSD Kingston w najpopularniejszych typach RAID - „1”, „5”, „10”, „50”

Tak więc „zerowy” poziom RAID nie zapewnia redundancji danych, a jedynie zwiększa wydajność. RAID 0 w ogóle nie zapewnia ochrony danych, więc nie będziemy go rozważać w segmencie korporacyjnym. Z drugiej strony RAID 1 zapewnia pełną nadmiarowość, ale jedynie niewielki wzrost wydajności, dlatego należy go rozważyć, jeśli wzrost wydajności nie jest głównym czynnikiem podczas tworzenia macierzy SSD RAID.

RAID 1 oparty na dyskach SSD Kingston i kontrolerach Broadcom

Tak więc macierz RAID pierwszego poziomu oparta na kontrolerze Broadcom MegaRAID 9460-16i łączy od dwóch do 32 dysków Kingston, które są swoimi kopiami i zapewnia całkowitą redundancję. O ile przy korzystaniu z tradycyjnych dysków HDD prędkość zapisu i odczytu danych utrzymywała się na poziomie tego właśnie HDD, to stosując rozwiązania NVMe SSD uzyskujemy dziesięciokrotny wzrost wydajności. Zwłaszcza jeśli chodzi o czas dostępu do danych. Na przykład dzięki dwóm dyskom SSD Kingston DC1000M U.2 NVMe w serwerowej macierzy RAID 1 uzyskujemy 350 000 losowych IOPS odczytu i 75 000 IOPS zapisu.

Dzielimy się naszym doświadczeniem, jak działają dyski SSD w ramach RAID i który poziom macierzy jest bardziej opłacalny

Pod względem prędkości odczytu sekwencyjnego wyniki będą pasować do charakterystyki dysku - 3200 MB/s. Ale ponieważ oba dyski SSD NVMe są sprawne, dane można z nich odczytywać w tym samym czasie, co sprawia, że ​​operacje odczytu są dość szybkie. Ale prędkość zapisu (podana jako 2000 MB / s) będzie mniejsza, ponieważ każda operacja zapisu jest wykonywana dwukrotnie.

Dzielimy się naszym doświadczeniem, jak działają dyski SSD w ramach RAID i który poziom macierzy jest bardziej opłacalny

RAID 1 jest idealny dla małych baz danych lub innych środowisk wymagających odporności na awarie, ale małej pojemności. Dublowanie dysków jest szczególnie przydatne w scenariuszach odzyskiwania po awarii (wydajność jest nieznacznie obniżona), ponieważ zapewnia natychmiastową „resuscytację” ważnych danych w przypadku awarii jednego z dysków w macierzy. Ponieważ jednak ten poziom ochrony wymaga podwojenia pojemności przechowywania lustrzanych danych (100 TB wymagałoby 200 TB), wiele systemów korporacyjnych korzysta z bardziej ekonomicznych opcji przechowywania: RAID 5 i RAID 6.

RAID 5 oparty na dyskach SSD Kingston i kontrolerach Broadcom

Aby zorganizować macierz RAID piątego poziomu, potrzebujemy co najmniej trzech dysków, na których dane są przeplatane (cyklicznie zapisywane na wszystkich dyskach w tablicy), ale nie duplikowane. Organizując je, należy wziąć pod uwagę ich bardziej złożoną strukturę, ponieważ pojawia się tutaj takie pojęcie jak „suma kontrolna” (lub „parzystość”). Ta koncepcja oznacza logiczną algebraiczną funkcję XOR (inaczej wyłączną „OR”), która nakazuje użycie minimum trzech dysków w tablicy (maksymalnie - 32). W takim przypadku informacje o parzystości są zapisywane na wszystkich „dyskach” w tablicy.

Dzielimy się naszym doświadczeniem, jak działają dyski SSD w ramach RAID i który poziom macierzy jest bardziej opłacalny

Za macierz czterech dysków Kingston DC500R SATA SSD o pojemności 3,84 TB każdy otrzymujemy 11,52 TB miejsca i 3,84 na sumy kontrolne. A jeśli połączymy 16 dysków Kingston DC1000M U.2 NVMe o pojemności 7,68 TB w macierz RAID poziomu 115,2, poznamy 7,68 TB ze stratą 5 TB. Jak widać, im więcej napędów, tym ostatecznie lepiej. Jest to również lepsze, ponieważ im więcej dysków w RAID 0, tym wyższa ogólna wydajność zapisu. A odczyt liniowy osiągnie poziom RAID XNUMX.

Dzielimy się naszym doświadczeniem, jak działają dyski SSD w ramach RAID i który poziom macierzy jest bardziej opłacalny

Grupa dysków RAID 5 zapewnia wysoką przepustowość (szczególnie w przypadku dużych plików) i nadmiarowość przy minimalnych stratach mocy. Ten typ organizacji tablicy najlepiej nadaje się do sieci, które wykonują jednocześnie wiele małych operacji wejścia/wyjścia (I/O). Ale nie powinieneś używać go do zadań wymagających dużej liczby operacji zapisu dla małych lub małych bloków.
Jest jeszcze jeden niuans: jeśli przynajmniej jeden z dysków NVMe ulegnie awarii, RAID 5 przechodzi w tryb degradacji, a awaria innego urządzenia pamięci masowej może stać się krytyczna dla wszystkich danych. Jeśli jeden dysk w macierzy ulegnie awarii, kontroler RAID wykorzystuje informacje o parzystości do odtworzenia brakujących danych.

RAID 10 oparty na dyskach SSD Kingston i kontrolerach Broadcom

Tak więc RAID 0 zapewnia nam dwukrotny wzrost szybkości i czasu dostępu, a RAID 1 zapewnia niezawodność. Idealnie byłoby je połączyć i tutaj z pomocą przychodzi RAID 10 (lub 1+0). „Dziesięć” składa się z czterech dysków SATA SSD lub NVMe (maksymalnie - 32) i implikuje tablicę „lustrzanych”, w której liczba dysków musi zawsze być wielokrotnością czterech. Dane w tej macierzy są zapisywane przy użyciu partycjonowania na stałe bloki (jak w przypadku RAID 0) i rozkładania między dyskami, rozkładając kopie na „dyski” w macierzy RAID 1. Oraz z możliwością dostępu do wielu grup dysków jednocześnie jednocześnie RAID 10 wykazuje wysoką wydajność.

Dzielimy się naszym doświadczeniem, jak działają dyski SSD w ramach RAID i który poziom macierzy jest bardziej opłacalny

Ponieważ RAID 10 jest w stanie rozłożyć dane na wiele par lustrzanych, oznacza to, że może tolerować awarię jednego dysku w parze. Jeśli jednak obie pary serwerów lustrzanych (czyli wszystkie cztery dyski) ulegną awarii, nastąpi nieunikniona utrata danych. W rezultacie uzyskujemy również dobrą odporność na uszkodzenia i niezawodność. Należy jednak pamiętać, że podobnie jak RAID 1, macierz dziesiątego poziomu wykorzystuje tylko połowę całkowitej pojemności, a zatem jest kosztownym rozwiązaniem. A także trudne do skonfigurowania.

RAID 10 nadaje się do użytku z hurtowniami danych, które wymagają 100% redundancji dublowanych grup dysków, a także zwiększonej wydajności we/wy RAID 0. Jest to najlepsze rozwiązanie dla średnich baz danych lub dowolnego środowiska wymagającego większej odporności na awarie niż RAID 5.

RAID 50 oparty na dyskach SSD Kingston i kontrolerach Broadcom

Połączona macierz podobna do RAID poziomu 5, która jest macierzą poziomu 50 zbudowaną z macierzy poziomu 5. Tak jak poprzednio, głównym celem tej macierzy jest osiągnięcie dwukrotnie większej wydajności przy zachowaniu niezawodności danych w macierzach RAID XNUMX. Jednocześnie RAID XNUMX zapewnia lepszą wydajność zapisu i lepszą ochronę danych niż standardowa RAID XNUMX w przypadku awarii dysku , a także jest w stanie szybciej przywrócić działanie w przypadku awarii jednego z dysków.

Dzielimy się naszym doświadczeniem, jak działają dyski SSD w ramach RAID i który poziom macierzy jest bardziej opłacalny

Grupa dysków RAID 50 dzieli dane na mniejsze bloki, a następnie rozdziela je na każdą macierz RAID 5. Grupa dysków RAID 5 z kolei dzieli również dane na mniejsze bloki, oblicza parzystość, wykonuje operację logicznego LUB na blokach, a następnie wykonuje operacje zapisu bloku danych i operacji parzystości dla każdego dysku w grupie dysków.

I chociaż wydajność spada nieuchronnie w przypadku awarii jednego z dysków, nie jest to tak znaczące, jak w przypadku macierzy RAID 5, ponieważ jedna awaria wpływa tylko na jedną z macierzy, pozostawiając drugą w pełni sprawną. W rzeczywistości RAID 50 może przetrwać do ośmiu awarii dysków HDD/SSD/NVMe, jeśli każdy uszkodzony „dysk” znajduje się w oddzielnej macierzy RAID 5.

Dzielimy się naszym doświadczeniem, jak działają dyski SSD w ramach RAID i który poziom macierzy jest bardziej opłacalny

RAID 50 najlepiej nadaje się do zastosowań, które wymagają wysokiej niezawodności i muszą przetwarzać dużą liczbę żądań przy zachowaniu wysokich szybkości przesyłania danych i niższych kosztów dysków niż RAID 10. Ponieważ jednak do skonfigurowania macierzy RAID 50 wymagane jest co najmniej sześć dysków , koszt nie jest całkowicie wykluczony jako czynnik. Wadą RAID 50 jest to, że podobnie jak RAID 5 wymaga złożonego kontrolera: takiego jak wspomniany przez nas w ostatnim artykule MegaRAID 9460-16i z Broadcomu.

Warto również zauważyć, że RAID 50 zajmuje mniej miejsca na dysku niż RAID 5 ze względu na alokację pojemności do przechowywania rekordów parzystości. Jednak nadal ma więcej użytecznej przestrzeni niż inne poziomy RAID, zwłaszcza te, które korzystają z dublowania. Przy minimalnym wymogu sześciu dysków RAID 50 może być kosztowną opcją, ale dodatkowe miejsce na dysku uzasadnia koszty, chroniąc dane firmowe. Ten typ macierzy jest zalecany w przypadku danych, które wymagają wysokiej niezawodności pamięci masowej, dużej liczby żądań, dużej szybkości transferu i dużej pojemności pamięci masowej.

RAID 6 i RAID 60: o nich też nie zapomnieliśmy

Skoro już mówiliśmy o macierzach piątego i pięćdziesiątego poziomu, grzechem byłoby nie wspomnieć o takich typach organizacji macierzy, jak RAID 6 i RAID 60.

Dzielimy się naszym doświadczeniem, jak działają dyski SSD w ramach RAID i który poziom macierzy jest bardziej opłacalny

Wydajność RAID 6 jest podobna do RAID 5, ale tutaj przynajmniej dwóm dyskom nadawana jest parzystość, co pozwala macierzy przetrwać awarię dwóch dysków bez utraty danych (w RAID 5 taka sytuacja jest wysoce niepożądana). Skutkuje to wyższą niezawodnością. Poza tym wszystko jest takie samo jak w macierzy piątego poziomu: w przypadku awarii jednego lub dwóch dysków kontroler RAID wykorzystuje bloki parzystości do odtworzenia wszystkich brakujących informacji. W przypadku awarii dwóch dysków odzyskiwanie nie następuje jednocześnie: najpierw reanimowany jest pierwszy dysk, a następnie drugi. W ten sposób wykonywane są dwie operacje odzyskiwania danych.

Dzielimy się naszym doświadczeniem, jak działają dyski SSD w ramach RAID i który poziom macierzy jest bardziej opłacalny

Łatwo zgadnąć, że jeśli RAID 50 jest tablicą poziomu 60 z tablicami poziomu 6, to RAID 50 jest tablicą poziomu 8 z tablicami poziomu 16, o której właśnie mówiliśmy. Oznacza to, że taka organizacja przechowywania RAID pozwala przetrwać utratę dwóch dysków SSD w każdej grupie dysków RAID XNUMX. Zasada działania jest podobna do tej, o której mówiliśmy w sekcji RAID XNUMX, ale liczba awarii, które macierz poziomu XNUMX może wytrzymać wzrost z XNUMX do XNUMX dysków. Zazwyczaj takie macierze są wykorzystywane do obsługi klienta online, co wymaga dużej odporności na awarie.

Podsumowując:

Chociaż tworzenie kopii lustrzanych zapewnia większą odporność na awarie niż RAID 50/60, wymaga również znacznie więcej miejsca. Ponieważ ilość danych jest podwojona, w rzeczywistości otrzymujesz tylko 50% całkowitej pojemności dysków zainstalowanych w serwerze do zapisywania i przechowywania informacji. Wybór między RAID 50/60 a RAID 10 najprawdopodobniej będzie zależał od dostępnego budżetu, pojemności serwera i potrzeb w zakresie ochrony danych. Co więcej, koszt wysuwa się na pierwszy plan, gdy mówimy o rozwiązaniach SSD (zarówno klasy korporacyjnej, jak i konsumenckiej).

Co równie ważne, wiemy już na pewno, że RAID oparty na dyskach SSD jest całkowicie bezpiecznym rozwiązaniem i normalną praktyką w dzisiejszym biznesie. W ramach użytku domowego istnieje również powód, aby przejść na NVMe, jeśli pozwalają na to budżety. A jeśli nadal masz pytanie, dlaczego to wszystko jest potrzebne, wróć do początku artykułu - szczegółowo już na to odpowiedzieliśmy.

Ten artykuł został przygotowany przy wsparciu naszych kolegów z firmy Broadcom, którzy dostarczają swoje kontrolery inżynierom firmy Kingston do testowania dysków SATA/SAS/NVMe klasy korporacyjnej. Dzięki tej przyjaznej symbiozie klienci nie muszą wątpić w niezawodność i stabilność dysków Kingston z fabrycznymi kontrolerami HBA i RAID. Broadcom.

Więcej informacji na temat produktów firmy Kingston można znaleźć pod adresem Oficjalna strona firma.

Źródło: www.habr.com

Dodaj komentarz