Byla zjištěna nekompatibilita mezi disky WD SMR a ZFS, což může vést ke ztrátě dat

iXsystems, vývojář projektu FreeNAS, varoval o vážných problémech s kompatibilitou ZFS s některými novými pevnými disky WD Red vydanými společností Western Digital využívající technologii SMR (Shingled Magnetic Recording). V nejhorším případě může použití ZFS na problematických discích vést ke ztrátě dat.

Problémy nastávají u disků WD Red s kapacitou od 2 do 6 TB vyrobených od roku 2018, které využívají technologii pro záznam DM-SMR (Device-Managed Shingled Magnetic Recording) a jsou označeny Štítek EFAX (u disků CMR se používá identifikátor EFRX). Western Digital poznamenal ve svém blogu uvedl, že disky WD Red SMR jsou určeny pro použití v NAS pro domácnosti a malé firmy, které instalují maximálně 8 disků a mají zatížení 180 TB ročně, což je typické pro zálohování a sdílení souborů. Předchozí generace disků WD Red a modely WD Red s kapacitou 8 TB nebo více, stejně jako disky z řad WD Red Pro, WD Gold a WD Ultrastar, jsou nadále vyráběny na základě technologie CMR (Conventional Magnetic Recording). a jejich použití nezpůsobuje problémy se ZFS.

Podstatou technologie SMR je použití magnetické hlavy na disku, jehož šířka je větší než šířka stopy, což vede k záznamu s částečným přesahem sousední stopy, tzn. jakékoli opětovné nahrávání má za následek nutnost znovu nahrát celou skupinu skladeb. Pro optimalizaci práce s takovými pohony se používá zónování — úložný prostor je rozdělen do zón, které tvoří skupiny bloků nebo sektorů, do kterých je povoleno pouze sekvenční přidávání dat s aktualizací celé skupiny bloků. Obecně platí, že disky SMR jsou energeticky účinnější, cenově dostupnější a vykazují výkonnostní výhody pro sekvenční zápisy, ale zpožďují se při provádění náhodných zápisů, včetně operací, jako je přestavba úložných polí.

DM-SMR znamená, že operace zónování a distribuce dat jsou řízeny diskovým řadičem a pro systém takový disk vypadá jako klasický pevný disk, který nevyžaduje samostatné manipulace. DM-SMR používá nepřímé adresování logických bloků (LBA, Logical Block Addressing), připomínající logické adresování u SSD disků. Každá operace náhodného zápisu vyžaduje operaci shromažďování paměti na pozadí, což má za následek nepředvídatelné kolísání výkonu. Systém se může pokusit aplikovat optimalizace na takové disky v domnění, že data budou zapsána do určeného sektoru, ale ve skutečnosti informace vydané řadičem určují pouze logickou strukturu a ve skutečnosti, při distribuci dat, řadič použije svou vlastní algoritmy, které berou v úvahu dříve přidělená data. Proto se před použitím disků DM-SMR ve fondu ZFS doporučuje provést operaci k jejich vynulování a resetování do původního stavu.

Na analýze podmínek vzniku problémů se podílí společnost Western Digital, která se společně s iXsystems snaží najít řešení a připravit aktualizaci firmwaru. Před zveřejněním závěrů o opravě problémů se plánuje testování disků s novým firmwarem na úložištích s vysokou zátěží s FreeNAS 11.3 a TrueNAS CORE 12.0. Uvádí se, že kvůli různým interpretacím SMR různými výrobci nemají některé typy disků SMR problémy se ZFS, ale testování prováděné společností iXsystems se zaměřuje pouze na kontrolu disků WD Red založených na technologii DM-SMR a pro SMR pohony ostatní výrobci je nutný další výzkum.

Aktuálně se problémy se ZFS prokázaly a opakovaly v testech minimálně u disků WD Red 4TB WD40EFAX s firmwarem 82.00A82 resp. manifest přechod do stavu selhání při vysoké zátěži zápisu, například při provádění přestavby úložiště po přidání nového disku do pole (resilvering). Předpokládá se, že k problému dochází u jiných modelů WD Red se stejným firmwarem. Když nastane problém, disk začne vracet chybový kód IDNF (Sector ID Not Found) a stane se nepoužitelným, což je v ZFS považováno za selhání disku a může vést ke ztrátě dat uložených na disku. Pokud selže více disků, může dojít ke ztrátě dat ve vdev nebo fondu. Nutno podotknout, že ke zmíněným poruchám dochází zcela výjimečně – ze zhruba tisíce prodaných systémů FreeNAS Mini, které byly vybaveny problematickými disky, se problém vynořil v pracovních podmínkách pouze jednou.

Zdroj: opennet.ru

Přidat komentář