Stwierdzono niezgodność dysków WD SMR i ZFS, która może prowadzić do utraty danych

iXsystems, twórca projektu FreeNAS, ostrzeżony o poważnych problemach z kompatybilnością ZFS z niektórymi nowymi dyskami twardymi WD Red wypuszczonymi przez firmę Western Digital wykorzystującymi technologię SMR (Shingled Magnetic Recording). W najgorszym przypadku użycie ZFS na problematycznych dyskach może spowodować utratę danych.

Problemy pojawiają się z produkowanymi od 2 roku dyskami WD Red o pojemnościach od 6 do 2018 TB, które wykorzystują technologię nagrywania DM-SMR (Zarządzany urządzeniami zapis magnetyczny na gontach) i są zaznaczone Etykieta EFAX (w przypadku dysków CMR stosowany jest identyfikator EFRX). Zachodnia cyfrowość zauważyłem na swoim blogu, że dyski WD Red SMR są przeznaczone do użytku w NASach dla domów i małych firm, które instalują nie więcej niż 8 dysków i mają obciążenie 180 TB rocznie, typowe dla tworzenia kopii zapasowych i udostępniania plików. Poprzednia generacja dysków WD Red i modele WD Red o pojemności 8 TB i większej, a także dyski z linii WD Red Pro, WD Gold i WD Ultrastar, w dalszym ciągu produkowane są w oparciu o technologię CMR (Conventional Magnetic Recording) a ich użycie nie powoduje problemów z ZFS.

Istotą technologii SMR jest zastosowanie głowicy magnetycznej na dysku, którego szerokość jest większa niż szerokość ścieżki, co prowadzi do nagrywania z częściowym nakładaniem się sąsiedniej ścieżki, tj. jakiekolwiek ponowne nagranie powoduje konieczność ponownego nagrania całej grupy utworów. Aby zoptymalizować pracę z takimi dyskami, stosuje się go podział na strefy — przestrzeń dyskowa jest podzielona na strefy tworzące grupy bloków lub sektorów, do których dozwolone jest jedynie sekwencyjne dodawanie danych wraz z aktualizacją całej grupy bloków. Ogólnie rzecz biorąc, dyski SMR są bardziej energooszczędne, tańsze i wykazują lepszą wydajność w przypadku zapisu sekwencyjnego, ale wykazują opóźnienia podczas wykonywania zapisów losowych, w tym operacji takich jak odbudowa macierzy pamięci masowej.

DM-SMR oznacza, że ​​operacje podziału na strefy i dystrybucji danych są kontrolowane przez kontroler dysku, a dla systemu taki dysk wygląda jak klasyczny dysk twardy, który nie wymaga odrębnych manipulacji. DM-SMR wykorzystuje pośrednie adresowanie bloków logicznych (LBA, Logical Block Addressing), przypominające adresowanie logiczne w dyskach SSD. Każda losowa operacja zapisu wymaga operacji usuwania elementów bezużytecznych w tle, co powoduje nieprzewidywalne wahania wydajności. System może próbować optymalizować takie dyski, wierząc, że dane zostaną zapisane w określonym sektorze, ale tak naprawdę informacja wydawana przez kontroler określa jedynie strukturę logiczną i tak naprawdę przy dystrybucji danych kontroler będzie stosował swoją własne algorytmy uwzględniające wcześniej przydzielone dane. Dlatego przed użyciem dysków DM-SMR w puli ZFS zaleca się wykonanie operacji ich wyzerowania i przywrócenia stanu pierwotnego.

W analizę warunków powstawania problemów zaangażowana została firma Western Digital, która wraz z iXsystems stara się znaleźć rozwiązanie i przygotować aktualizację oprogramowania. Przed opublikowaniem wniosków na temat usunięcia problemów dyski z nowym oprogramowaniem mają zostać przetestowane na nośnikach o dużym obciążeniu z systemem FreeNAS 11.3 i TrueNAS CORE 12.0. Stwierdza się, że ze względu na różne interpretacje SMR przez różnych producentów, niektóre typy dysków SMR nie mają problemów z ZFS, jednak testy podejmowane przez iXsystems skupiają się wyłącznie na sprawdzeniu dysków WD Red opartych na technologii DM-SMR i pod kątem SMR jeździ inni producenci wymagane są dodatkowe badania.

Obecnie problemy z ZFS zostały udowodnione i powtórzone w testach dla co najmniej dysków WD Red 4 TB WD40EFAX z oprogramowaniem 82.00A82 i pojawić się przejście w stan awarii przy dużym obciążeniu zapisem, np. podczas wykonywania odbudowy pamięci po dodaniu nowego dysku do macierzy (resilvering). Uważa się, że problem występuje w innych modelach WD Red z tym samym oprogramowaniem. Kiedy pojawia się problem, dysk zaczyna zwracać kod błędu IDNF (Sector ID Not Found) i staje się bezużyteczny, co w ZFS jest traktowane jako awaria dysku i może prowadzić do utraty danych przechowywanych na dysku. W przypadku awarii wielu dysków dane w vdev lub puli mogą zostać utracone. Należy zaznaczyć, że wspomniane awarie zdarzają się dość rzadko – na około tysiąc sprzedanych systemów FreeNAS Mini, które były wyposażone w problematyczne dyski, problem w warunkach pracy pojawił się tylko raz.

Źródło: opennet.ru

Dodaj komentarz