Vi delar med oss ​​av vår erfarenhet, hur SSD:er presterar inom ramen för RAID och vilken arraynivå som är mer lönsam

В tidigare material vi har redan övervägt frågan om "Kommer vi att tillämpa RAID på SSD" med exemplet med Kingston-enheter, men vi gjorde det bara inom nollnivån. I den aktuella artikeln kommer vi att analysera alternativen för att använda professionella och hem-NVMe-lösningar i de mest populära typerna av RAID-arrayer och prata om kontrollerkompatibilitet. Broadcom med Kingston-drev.

Vi delar med oss ​​av vår erfarenhet, hur SSD:er presterar inom ramen för RAID och vilken arraynivå som är mer lönsam

Varför behöver du RAID på en SSD?

Fördelarna med SSD-baserade lagringsarrayer jämfört med HDD-lagringsarrayer inkluderar snabbare åtkomsttider till data på enheten och överlägsen läs/skrivprestanda. En idealisk SSD-baserad RAID-prestanda kräver dock en optimal kombination av processor, cache, mjukvara och hårdvara. När alla dessa faktorer fungerar perfekt kan en SSD RAID avsevärt överträffa en jämförbar konfiguration med traditionella hårddiskar.

En typisk SSD förbrukar mindre ström än hårddiskar, så när du kombinerar ett stort antal SSD-enheter i en RAID-array kan energibesparingen jämfört med en HDD RAID-array också översättas till lägre kostnader på företagens energiräkningar.

SSD RAID har dock begränsningar och nackdelar, i synnerhet det högre priset per gigabyte utrymme jämfört med hårddiskar med jämförbar kapacitet. Och tiden mellan flashminnesfel är begränsad till ett visst antal omskrivningscykler. Det vill säga, SSD-enheter har en viss livslängd, vilket beror på operationen: ju mer information som skrivs över på den, desto snabbare kommer enheten att misslyckas. Å andra sidan har SSD:er för företag en anständig livslängd jämförbar med mekaniska hårddiskar.

Hur Kingston SSD:er lever i RAID-läge med Broadcom-kontroller

I början av SSD:er hade RAID-designer många nyanser. Inklusive på grund av användningen av mindre feltoleranta hårddiskar. Solid state-enheter är mycket mer tillförlitliga än sina motsvarigheter baserade på magnetiska diskar. Som vi vet finns det inga rörliga delar i SSD-lösningar, så mekaniska skador reduceras till noll. Fel på solid-state-diskar på grund av spänningsöverspänningar är också osannolikt, med tanke på att på nivån för en hemdator och vilken server, UPS, överspänningsskydd och till och med en strömkälla skyddar dig.

Samtidigt har solid-state-enheter ett annat betydande plus: även om minnescellerna är utslitna för skrivning kan data fortfarande läsas från dem, men om magnetskivan är skadad, tyvärr.

Vi delar med oss ​​av vår erfarenhet, hur SSD:er presterar inom ramen för RAID och vilken arraynivå som är mer lönsam

Idag är det ganska normal praxis att använda SSD-lösningar i RAID-arrayer på olika nivåer. Det viktigaste är att välja rätt SSD-enheter, vars latens är minimal. Och helst, använd SSD-enheter av samma tillverkare och samma modell så att du inte hamnar i en klunga av enheter som stöder olika typer av belastningar och är byggda på basis av olika typer av minne, kontroller och andra teknologier. Det vill säga, om vi bestämmer oss för att köpa fyra eller 16 NVMe SSD:er från Kingston för att skapa en RAID-array, skulle det vara bättre om de alla kommer från samma serie och modellutbud.

Förresten, in senaste artikeln vi citerade Broadcom-kontroller av en anledning när vi pratade om NVMe SSD från Kingston. Faktum är att manualerna för dessa enheter omedelbart föreskriver kompatibla enheter (inklusive lösningar från den tidigare nämnda amerikanska SSD-tillverkaren), med vilka kontrollern kommer att fungera felfritt. Man bör lita på denna information när man väljer ett controller-SSD-paket för RAID.

Vi analyserar SSD Kingstons arbete i de mest populära typerna av RAID - "1", "5", "10", "50"

Så "noll" RAID-nivån ger inte dataredundans, utan ökar bara prestandan. RAID 0 ger inget dataskydd alls, så vi kommer inte att överväga det inom företagssegmentet. RAID 1, å andra sidan, ger full redundans men endast blygsamma prestandavinster, och bör därför övervägas om prestandavinster inte är en primär faktor när man bygger en SSD RAID-array.

RAID 1 baserat på Kingston SSD:er och Broadcom-kontroller

Så, den första nivån RAID-array baserad på Broadcom MegaRAID 9460-16i-kontrollern kombinerar från två till 32 Kingston-enheter, som är kopior av varandra, och ger fullständig redundans. Om när man använder traditionella hårddiskar, hastigheten för att skriva och läsa data förblev på samma nivå som denna hårddisk, så får vi en tiofaldig ökning av prestanda med hjälp av NVMe SSD-lösningar. Särskilt när det gäller dataåtkomsttid. Till exempel, med två Kingston DC1000M U.2 NVMe SSD:er i server RAID 1, får vi 350 000 slumpmässiga läs-IOPS och 75 000 skriv-IOPS.

Vi delar med oss ​​av vår erfarenhet, hur SSD:er presterar inom ramen för RAID och vilken arraynivå som är mer lönsam

När det gäller sekventiell läshastighet kommer resultaten att matcha enhetens egenskaper - 3200 MB / s. Men eftersom båda NVMe SSD:erna fungerar, kan data läsas från dem samtidigt, vilket gör läsoperationerna ganska snabba. Men skrivhastigheten (som påstås vara 2000 MB/s) kommer att vara långsammare, eftersom varje skrivoperation utförs två gånger.

Vi delar med oss ​​av vår erfarenhet, hur SSD:er presterar inom ramen för RAID och vilken arraynivå som är mer lönsam

RAID 1 är idealisk för små databaser eller andra miljöer som kräver feltolerans men låg kapacitet. Enhetsspegling är särskilt användbar vid katastrofåterställningsscenarier (prestandan är något försämrad) eftersom den ger omedelbar "återupplivning" av viktig data om en av enheterna i arrayen misslyckas. Men eftersom denna skyddsnivå kräver en fördubbling av lagringskapaciteten för speglad data (100 TB skulle kräva 200 TB lagring), använder många företagssystem mer ekonomiska lagringsalternativ: RAID 5 och RAID 6.

RAID 5 baserat på Kingston SSD:er och Broadcom-kontroller

För att organisera en RAID-array på femte nivån behöver vi minst tre enheter, vars data är interfolierad (cykliskt skrivs till alla enheter i arrayen), men inte duplicerad. När man organiserar dem bör man ta hänsyn till deras mer komplexa struktur, eftersom ett sådant koncept som "kontrollsumma" (eller "paritet") visas här. Detta koncept innebär den logiska algebraiska XOR-funktionen (aka exklusiv "OR"), som dikterar användningen av minst tre enheter i arrayen (max - 32). I detta fall skrivs paritetsinformation till alla "diskar" i arrayen.

Vi delar med oss ​​av vår erfarenhet, hur SSD:er presterar inom ramen för RAID och vilken arraynivå som är mer lönsam

För en uppsättning av fyra Kingston DC500R SATA SSD-enheter med en kapacitet på 3,84 TB vardera får vi 11,52 TB utrymme och 3,84 för kontrollsummor. Och om du kombinerar 16 Kingston DC1000M U.2 NVMe-enheter med en kapacitet på 7,68 TB till en nivå 115,2 RAID, kommer vi att lära oss 7,68 TB med en förlust på 5 TB. Som du kan se, ju fler enheter, desto bättre i slutändan. Det är också bättre eftersom ju fler enheter i RAID 0, desto högre blir den totala skrivprestandan. Och linjär avläsning når nivån RAID XNUMX.

Vi delar med oss ​​av vår erfarenhet, hur SSD:er presterar inom ramen för RAID och vilken arraynivå som är mer lönsam

En RAID 5-diskgrupp ger hög genomströmning (särskilt för stora filer) och redundans med minimal strömförlust. Denna typ av array-organisation är bäst lämpad för nätverk som utför många små input/output (I/O) operationer samtidigt. Men du bör inte använda den för uppgifter som kräver ett stort antal skrivoperationer för små eller små block.
Det finns ytterligare en nyans: om åtminstone en av NVMe-enheterna misslyckas, går RAID 5 in i försämringsläge och fel på en annan lagringsenhet kan bli kritiskt för all data. Om en enhet i arrayen misslyckas använder RAID-styrenheten paritetsinformationen för att återskapa eventuella saknade data.

RAID 10 baserat på Kingston SSD:er och Broadcom-kontroller

Så, RAID 0 ger oss en dubbel ökning av hastighet och åtkomsttid, och RAID 1 ger tillförlitlighet. Helst skulle de kombineras, och här kommer RAID 10 (eller 1 + 0) till undsättning. "Tio" är sammansatt av fyra SATA SSD- eller NVMe-enheter (högst - 32) och innebär en rad "speglar", antalet enheter i vilka alltid måste vara en multipel av fyra. Data i denna array skrivs med hjälp av fixerad blockpartitionering (som i fallet med RAID 0) och striping mellan enheter, spridning av kopior över "enheterna" i en RAID 1-array. Och med möjligheten att komma åt flera grupper av enheter på samtidigt visar RAID 10 hög prestanda.

Vi delar med oss ​​av vår erfarenhet, hur SSD:er presterar inom ramen för RAID och vilken arraynivå som är mer lönsam

Eftersom RAID 10 kan strippa data över flera speglade par, betyder det att den kan tolerera fel på en enhet i ett par. Men om båda spegelparen (det vill säga alla fyra enheterna) misslyckas kommer det att bli oundviklig dataförlust. Som ett resultat får vi också god feltolerans och tillförlitlighet. Men kom ihåg att, precis som RAID 1, använder den tionde nivån bara hälften av den totala kapaciteten och därför är en dyr lösning. Och dessutom svår att sätta upp.

RAID 10 är lämplig för användning med datalager som kräver 100 % redundans av speglade diskgrupper, samt den ökade I/O-prestandan hos RAID 0. Det är den bästa lösningen för medelstora databaser eller alla miljöer som kräver högre feltolerans än RAID 5.

RAID 50 baserat på Kingston SSD:er och Broadcom-kontroller

En kombinerad array som liknar nivå 5 RAID, vilket är en nivå 50-array byggd av nivå 5-arrayer. Som tidigare är huvudmålet med denna array att uppnå dubbel prestanda samtidigt som datatillförlitligheten i RAID XNUMX-arrayer bibehålls. Samtidigt ger RAID XNUMX förbättrad skrivprestanda och bättre dataskydd än standard RAID XNUMX i händelse av ett diskfel , och är också kapabel till snabbare återställning i händelse av fel på en av enheterna.

Vi delar med oss ​​av vår erfarenhet, hur SSD:er presterar inom ramen för RAID och vilken arraynivå som är mer lönsam

RAID 50-enhetsgruppen delar upp data i mindre block och strippar dem sedan över varje RAID 5-array. RAID 5-enhetsgruppen delar i sin tur också upp data i mindre block, beräknar paritet, utför en logisk ELLER-operation på blocken och sedan utför datablockskrivning och paritetsoperationer för varje disk i diskgruppen.

Och även om prestandan oundvikligen försämras om en av enheterna går sönder, är det inte lika betydande som i en RAID 5-array, eftersom ett fel bara påverkar en av arrayerna, vilket gör att den andra fungerar fullt ut. Faktum är att RAID 50 kan överleva upp till åtta HDD/SSD/NVMe-diskfel om varje misslyckad "disk" finns i en separat RAID 5-array.

Vi delar med oss ​​av vår erfarenhet, hur SSD:er presterar inom ramen för RAID och vilken arraynivå som är mer lönsam

RAID 50 används bäst för applikationer som kräver hög tillförlitlighet och måste behandla ett stort antal förfrågningar samtidigt som höga dataöverföringshastigheter och lägre enhetskostnader än RAID 10 bibehålls. Men eftersom minst sex enheter krävs för att konfigurera en RAID 50-array , kostnad är inte helt utesluten som en faktor. En nackdel med RAID 50 är att den, precis som RAID 5, behöver en komplex styrenhet: som t.ex. nämns av oss i den sista artikeln MegaRAID 9460-16i från Broadcom.

Det är också värt att notera att RAID 50 använder mindre diskutrymme än RAID 5 på grund av allokeringen av kapacitet för att hålla paritetsrekord. Den har dock fortfarande mer användbart utrymme än andra RAID-nivåer, särskilt de som använder spegling. Med ett minimikrav på sex enheter kan RAID 50 vara ett kostsamt alternativ, men det extra diskutrymmet motiverar kostnaden genom att skydda företagsdata. Denna typ av array rekommenderas för data som kräver hög lagringssäkerhet, höga begäranden, höga överföringshastigheter och hög lagringskapacitet.

RAID 6 och RAID 60: vi har inte glömt dem heller

Eftersom vi har pratat om arrayer på den femte och femtionde nivån skulle det vara synd att inte nämna sådana typer av arrayorganisation som RAID 6 och RAID 60.

Vi delar med oss ​​av vår erfarenhet, hur SSD:er presterar inom ramen för RAID och vilken arraynivå som är mer lönsam

Prestandan för RAID 6 liknar RAID 5, men här ges minst två enheter paritet, vilket gör att arrayen kan överleva felet på två enheter utan att förlora data (i RAID 5 är denna situation högst oönskad). Detta resulterar i högre tillförlitlighet. Annars är allt detsamma som i den femte nivån: i händelse av ett fel på en eller två diskar använder RAID-styrenheten paritetsblock för att återskapa all information som saknas. Om två enheter misslyckas sker inte återställning samtidigt: först återanimeras den första enheten, sedan den andra. Således utförs två dataåterställningsoperationer.

Vi delar med oss ​​av vår erfarenhet, hur SSD:er presterar inom ramen för RAID och vilken arraynivå som är mer lönsam

Det är lätt att gissa att om RAID 50 är en nivå 60-array av nivå 6-arrayer, så är RAID 50 en nivå 8-array av nivå 16-arrayer som vi just pratade om. Det vill säga, denna organisation av RAID-lagring låter dig överleva förlusten av två SSD-enheter i varje grupp av RAID XNUMX-enheter. Funktionsprincipen liknar den vi pratade om i RAID XNUMX-avsnittet, men antalet fel som en nivå XNUMX array tål tillväxt från XNUMX till XNUMX enheter. Vanligtvis används sådana arrayer för onlinekundservice, vilket kräver hög feltolerans.

Summering:

Även om spegling ger mer feltolerans än RAID 50/60, kräver den också mycket mer utrymme. Eftersom mängden data fördubblas får du faktiskt bara 50 % av den totala kapaciteten på de enheter som är installerade i servern för inspelning och lagring av information. Att välja mellan RAID 50/60 och RAID 10 kommer troligen att bero på tillgängliga budgetar, serverkapacitet och dina dataskyddsbehov. Dessutom kommer kostnaden i förgrunden när vi talar om SSD-lösningar (både företags- och konsumentklass).

Lika viktigt är att vi nu med säkerhet vet att SSD-baserad RAID är en helt säker lösning och en normal praxis för dagens verksamhet. Som en del av hemmabruk finns det också anledning att byta till NVMe, om budgetar tillåter. Och om du fortfarande har en fråga, varför behövs allt detta, gå tillbaka till början av artikeln - vi har redan besvarat det i detalj.

Den här artikeln förbereddes med stöd av våra kollegor på Broadcom, som tillhandahåller sina kontroller till Kingstons ingenjörer för testning med SATA/SAS/NVMe-enheter i företagsklass. Tack vare denna vänliga symbios behöver kunderna inte tvivla på tillförlitligheten och stabiliteten hos Kingston-diskar med HBA- och RAID-kontroller från produktion. Broadcom.

Mer information om Kingstons produkter finns på officiella hemsida företaget.

Källa: will.com

Lägg en kommentar