Inkompatibilitet mellan WD SMR-enheter och ZFS har identifierats, vilket kan leda till dataförlust

iXsystems, utvecklaren av FreeNAS-projektet, varnade om allvarliga problem med ZFS-kompatibilitet med några av de nya WD Red-hårddiskar som släppts av Western Digital med SMR-teknik (Shingled Magnetic Recording). I värsta fall kan användning av ZFS på problematiska enheter resultera i dataförlust.

Problem uppstår med WD Red-diskar med kapaciteter från 2 till 6 TB, producerade sedan 2018, som använder teknik för inspelning DM-SMR (Device-Managed Shingled Magnetic Recording) och är markerade EFAX-etikett (för CMR-diskar används EFRX-identifieraren). Western digital noterade i sin blogg att WD Red SMR-enheter är designade för användning i NAS för hem och småföretag, som inte installerar mer än 8 enheter och har en belastning på 180 TB per år, typiskt för säkerhetskopiering och fildelning. Den tidigare generationen WD Red-enheter och WD Red-modeller med en kapacitet på 8 TB eller mer, samt enheter från WD Red Pro-, WD Gold- och WD Ultrastar-linjerna, fortsätter att tillverkas baserade på CMR-teknik (Conventional Magnetic Recording) och deras användning orsakar inte problem med ZFS.

Kärnan i SMR-tekniken är användningen av ett magnethuvud på en skiva, vars bredd är större än spårets bredd, vilket leder till inspelning med partiell överlappning av det intilliggande spåret, dvs. varje återinspelning resulterar i att hela gruppen av spår måste spelas in igen. För att optimera arbetet med sådana enheter används den zonindelning — Lagringsutrymme är uppdelat i zoner som utgör grupper av block eller sektorer, till vilka endast sekventiell tillägg av data tillåts med uppdatering av hela gruppen av block. Generellt sett är SMR-enheter mer energieffektiva, mer prisvärda och uppvisar prestandafördelar för sekventiell skrivning, men släpar efter när du utför slumpmässiga skrivningar, inklusive operationer som att bygga om lagringsmatriser.

DM-SMR innebär att zonindelning och datadistribution styrs av diskkontrollern och för systemet ser en sådan disk ut som en klassisk hårddisk som inte kräver separata manipulationer. DM-SMR använder indirekt logisk blockadressering (LBA, Logical Block Addressing), som påminner om logisk adressering i SSD-enheter. Varje slumpmässig skrivoperation kräver en skräpinsamling i bakgrunden, vilket resulterar i oförutsägbara prestandafluktuationer. Systemet kan försöka tillämpa optimeringar på sådana diskar, i tron ​​att data kommer att skrivas till den specificerade sektorn, men i själva verket bestämmer informationen som utfärdas av kontrollanten endast den logiska strukturen och i själva verket, när data distribueras kommer kontrollanten att tillämpa sin egna algoritmer som tar hänsyn till tidigare allokerad data. Därför, innan du använder DM-SMR-diskar i en ZFS-pool, rekommenderas det att utföra en operation för att nollställa dem och återställa dem till deras ursprungliga tillstånd.

Western Digital har varit med och analyserat under vilka förutsättningar problem uppstår, som tillsammans med iXsystems försöker hitta en lösning och förbereda en firmwareuppdatering. Innan man publicerar slutsatser om att åtgärda problemen, planeras enheter med den nya firmwaren testas på högbelastningslagringar med FreeNAS 11.3 och TrueNAS CORE 12.0. Det anges att på grund av olika tolkningar av SMR av olika tillverkare, har vissa typer av SMR-diskar inte problem med ZFS, men testerna som utförs av iXsystems fokuserar endast på att kontrollera WD Red-diskar baserade på DM-SMR-teknologi, och för SMR driver andra tillverkare ytterligare forskning krävs.

För närvarande har problem med ZFS bevisats och upprepats i tester för minst WD Red 4TB WD40EFAX-enheter med firmware 82.00A82 och dyka upp övergång till ett feltillstånd under hög skrivbelastning, till exempel när en lagringsuppbyggnad utförs efter att en ny enhet lagts till i arrayen (återförsilvering). Man tror att problemet uppstår på andra WD Red-modeller med samma firmware. När ett problem uppstår börjar disken returnera en IDNF (Sector ID Not Found) felkod och blir oanvändbar, vilket i ZFS behandlas som ett diskfel och kan leda till att data som lagras på disken går förlorade. Om flera diskar misslyckas kan data i en vdev eller pool gå förlorad. Det noteras att de nämnda felen inträffar ganska sällan - av cirka tusen sålda FreeNAS Mini-system som var utrustade med problematiska diskar, dök problemet upp under arbetsförhållanden endast en gång.

Källa: opennet.ru

Lägg en kommentar