Huawei Dorado V6: Sichuan värme

Huawei Dorado V6: Sichuan värme
Sommaren i Moskva i år var, om jag ska vara ärlig, inte särskilt bra. Det började för tidigt och snabbt, alla hann inte reagera på det, och det tog slut redan i slutet av juni. Därför, när Huawei bjöd in mig att åka till Kina, till staden Chengdu, där deras RnD-center ligger, efter att ha tittat på väderprognosen på +34 grader i skuggan, gick jag genast med. Jag är trots allt inte i samma ålder längre och jag behöver värma upp benen lite. Men jag skulle vilja notera att det var möjligt att värma inte bara benen, utan också insidan, eftersom provinsen Sichuan, där Chengdu faktiskt ligger, är känd för sin kärlek till kryddig mat. Men ändå är det här inte en blogg om resor, så låt oss återgå till huvudmålet med vår resa - en ny linje med lagringssystem - Huawei Dorado V6. Den här artikeln kommer att vinka dig lite från det förflutna, eftersom... den skrevs före det officiella tillkännagivandet, men publicerades först efter releasen. Och så, idag kommer vi att titta närmare på allt intressant och välsmakande som Huawei har förberett för oss.

Huawei Dorado V6: Sichuan värme
Det kommer att finnas 5 modeller i den nya linjen. Alla modeller utom 3000V6 kan fås i två versioner - SAS och NVMe. Valet avgör gränssnittet för de diskar som du kan använda i det här systemet, Back-End-portarna och antalet diskenheter som du kan installera i systemet. För NVMe används SSD-enheter i Palmstorlek, som är tunnare än klassiska 2.5" SAS SSD-enheter och kan installeras i upp till 36 delar. Den nya raden är All Flash och det finns inga konfigurationer med diskar.

Huawei Dorado V6: Sichuan värme
Palm NVMe SSD

Enligt min mening ser Dorado 8000 och 18000 ut som de mest intressanta modellerna. Huawei positionerar dem som avancerade system, och tack vare Huaweis prispolicy kontrasterar den dessa mellanklassmodeller med konkurrentsegmentet. Det är dessa modeller som jag kommer att fokusera på i min recension idag. Jag ska genast notera att på grund av deras designfunktioner har junior dubbelkontrollsystem en något annorlunda arkitektur, annorlunda än Dorado 8000 och 18000, så allt jag kommer att prata om idag är inte tillämpligt på juniormodeller.

En av huvuddragen i de nya systemen var användningen av flera chips, utvecklade internt, som var och en låter dig fördela den logiska belastningen från styrenhetens centrala processor och lägga till funktionalitet till olika komponenter.
Huawei Dorado V6: Sichuan värme

Hjärtat i de nya systemen är Kunpeng 920-processorerna, utvecklade på ARM-teknologier och tillverkade av Huawei oberoende. Beroende på modell varierar antalet kärnor, deras frekvens och antalet installerade processorer i varje styrenhet:
Huawei Dorado V6 8000 – 2CPU, 64 kärnor
Huawei Dorado V6 18000 – 4CPU, 48 kärnor
Huawei Dorado V6: Sichuan värme

Huawei utvecklade den här processorn på ARM-arkitekturen, och så vitt jag vet planerade han först att installera den endast i de äldre Dorado 8000- och 18000-modellerna, vilket redan var fallet med vissa V5-modeller, men sanktioner gjorde justeringar av denna idé. ARM pratade förstås också om att vägra samarbeta med Huawei under införandet av sanktioner, men här är situationen annorlunda än med Intel. Huawei producerar dessa chips oberoende, och inga sanktioner kan stoppa denna process. Att bryta relationerna med ARM hotar bara förlusten av tillgång till nya utvecklingar. När det gäller prestanda kommer det att vara möjligt att bedöma först efter att ha genomfört oberoende tester. Även om jag såg hur 18000M IOPS togs bort från Dorado 1-systemet utan några problem, tills jag upprepar det med mina egna händer i mitt rack, kommer jag inte att tro det. Men det finns verkligen mycket kraft i kontroller. Äldre modeller är utrustade med 4 kontroller, var och en med 4 processorer, vilket ger totalt 768 kärnor.
Huawei Dorado V6: Sichuan värme

Men jag kommer att prata om kärnorna ännu senare, när vi tittar på arkitekturen för de nya systemen, men låt oss nu återgå till ett annat chip installerat i systemet. Chipet ser ut som en extremt intressant lösning Gå upp 310 (Såvitt jag förstår, yngre bror till Ascend 910, som nyligen presenterades för allmänheten). Dess uppgift är att analysera datablock som kommer in i systemet för att öka träffförhållandet Läs. Det är svårt att säga hur det kommer att fungera på jobbet, eftersom... Idag fungerar den bara enligt en given mall och har inte förmågan att lära sig i ett intelligent läge. Utseendet på ett intelligent läge utlovas i framtida firmware, troligen i början av nästa år.

Låt oss gå vidare till arkitekturen. Huawei har fortsatt att utveckla sin egen Smart Matrix-teknik, som implementerar en full mesh-metod för att ansluta komponenter. Men om detta i V5 bara var för åtkomst från kontroller till diskar, har nu alla kontroller tillgång till alla portar på både Back-End och Front-End.
Huawei Dorado V6: Sichuan värme

Tack vare den nya mikrotjänstarkitekturen tillåter detta även lastbalansering mellan alla styrenheter, även om det bara finns en lun. OS för denna serie av arrayer har utvecklats från grunden och inte bara optimerat för användning av flash-enheter. På grund av det faktum att alla våra kontroller har tillgång till samma portar, i händelse av ett kontrollfel eller omstart, förlorar värden inte en enda sökväg till lagringssystemet, och sökvägsbyte utförs på lagringssystemnivå. Det är dock inte absolut nödvändigt att använda UltraPath på värden. En annan "besparing" när du installerar systemet är det mindre antalet nödvändiga länkar. Och om vi med det "klassiska" tillvägagångssättet för 4 kontroller kommer att behöva 8 länkar från 2 fabriker, då kommer till och med 2 i Huaweis fall att räcka (jag pratar inte nu om tillräckligheten för genomströmningen av en länk).
Huawei Dorado V6: Sichuan värme

Som i den tidigare versionen används en global cache med spegling. Detta gör att du kan förlora upp till två kontroller samtidigt eller tre kontroller i följd utan att det påverkar tillgängligheten. Men det är värt att notera att vi inte såg fullständig belastningsbalansering mellan de återstående 3 kontrollerna i händelse av ett fel på demostället. Lasten på den trasiga styrenheten togs över helt av en av de återstående. Det är möjligt att det för detta är nödvändigt att låta systemet arbeta längre i denna konfiguration. Jag kommer i alla fall att kontrollera detta mer i detalj med hjälp av mina egna tester.
Huawei positionerar de nya systemen som End-to-End NVMe-system, men idag stöds ännu inte NVMeOF på fronten, bara FC, iSCSI eller NFS. I slutet av detta eller i början av nästa, liksom andra funktioner, lovas vi RoCE-stöd.
Huawei Dorado V6: Sichuan värme

Hyllorna är också anslutna till styrenheterna med hjälp av RoCE, och det finns en nackdel med detta - frånvaron av en "loopback"-anslutning av hyllorna, vilket var fallet med SAS. Enligt min mening är detta fortfarande en ganska stor nackdel om du planerar ett ganska stort system. Faktum är att alla hyllor är anslutna i serie, och fel på en av hyllorna resulterar i att alla andra som följer den är fullständigt otillgängliga. I det här fallet, för att säkerställa feltolerans, måste vi ansluta alla hyllor till kontroller, vilket innebär en ökning av det erforderliga antalet backend-portar i systemet.

Och en sak till som är värd att nämna är non-disruptive update (NDU). Som jag sa ovan har Huawei implementerat en containerstrategi för att driva operativsystemet för den nya Dorado-linjen, detta låter dig uppdatera och starta om tjänster utan att behöva starta om kontrollern helt. Här är det värt att omedelbart nämna att vissa uppdateringar kommer att innehålla kärnuppdateringar, och i det här fallet kommer en klassisk omstart av kontroller ibland fortfarande att krävas under uppdateringen, men inte alltid. Detta kommer att minska effekten av denna operation på det produktiva systemet.

I vår arsenal är de allra flesta arrayer från NetApp. Därför tycker jag att det blir ganska logiskt om jag gör en liten jämförelse med system som jag måste jobba ganska mycket med. Detta är inte ett försök att avgöra vem som är bättre och vem som är sämre eller vems arkitektur som är mer fördelaktig. Jag kommer att försöka nyktert och utan fanatism jämföra två olika tillvägagångssätt för att lösa samma problem från olika leverantörer. Ja, naturligtvis, i det här fallet kommer vi att överväga Huawei-system i "teori" och jag kommer också separat att notera de punkter som planeras att implementeras i framtida firmwareversioner. Vilka fördelar ser jag för tillfället:

  1. Antal NVMe-enheter som stöds. NetApp har för närvarande 288 av dem, medan Huawei har 1600-6400, beroende på modell. Samtidigt är Huaweis maximala användbara kapacitet 32PBe, precis som NetApp-system (för att vara mer exakt, de har 31.64PBe). Och detta trots att enheter med samma volym stöds (upp till 15Tb). Huawei förklarar detta faktum så här: de hade inte möjlighet att montera ett större stativ. I teorin har de ingen volymbegränsning, men de har helt enkelt inte kunnat testa detta faktum ännu. Men här är det värt att notera att kapaciteten hos flash-enheter idag är mycket höga, och i fallet med NVMe-system står vi inför det faktum att 24 enheter är tillräckligt för att använda ett toppstyrt 2-kontrollsystem. Följaktligen kommer en ytterligare ökning av antalet diskar i systemet inte bara inte att ge en prestandaökning, utan kommer också att ha en dålig effekt på IOPS/Tb-förhållandet. Naturligtvis är det värt att se hur många enheter 4-kontrollsystemen 8000 och 16000 klarar av, eftersom... Kunpeng 920:s möjligheter och potential är fortfarande inte helt klarlagda.
  2. Närvaron av Lun som ägare av NetApp-system. De där. Endast en styrenhet kan utföra operationer med månen, medan den andra bara skickar IO genom sig själv. Huawei-system, tvärtom, har inga ägare och operationer med datablock (komprimering, deduplicering) kan utföras av någon av kontrollerna, samt skrivas till diskar.
  3. Ingen port tappar när en av kontrollerna misslyckas. För vissa ser detta ögonblick extremt kritiskt ut. Summan av kardemumman är att byte inuti lagringssystemet bör ske snabbare än på värdsidan. Och om vi i fallet med samma NetApp i praktiken hittade en frysning på cirka 5 sekunder när vi drog ut kontrollern och växlade vägar, måste vi fortfarande öva med att byta till Huawei.
  4. Inget behov av att starta om regulatorn vid uppdatering. Detta började särskilt oroa mig med den ganska frekventa lanseringen av nya versioner och firmware-grenar för NetApps. Ja, vissa uppdateringar för Huawei kommer fortfarande att kräva en omstart, men inte alla.
  5. 4 Huawei-kontroller till priset av två NetApp-kontroller. Som jag sa ovan, tack vare Huaweis prispolicy, kan den konkurrera med Mid-range med sina avancerade modeller.
  6. Förekomsten av ytterligare chips i hyllkontroller och portkort, som potentiellt är avsedda att förbättra systemets effektivitet.

Nackdelar och bekymmer i allmänhet:

  1. Direktanslutning av hyllor till kontroller eller behov av ett stort antal back-end-portar för att ansluta alla hyllor till kontroller.
  2. ARM-arkitektur och närvaron av ett stort antal marker - hur effektivt kommer det att fungera, och kommer prestandan att räcka?

De flesta farhågor och farhågor kan skingras genom personlig testning av den nya linjen. Jag hoppas att de snart efter releasen dyker upp i Moskva och att det kommer att finnas tillräckligt många för att snabbt skaffa en för dina egna tester. Hittills kan vi säga att företagets tillvägagångssätt i allmänhet ser intressant ut, och den nya linjen ser väldigt bra ut jämfört med konkurrenterna. Det slutliga genomförandet väcker många frågor, eftersom Vi kommer att se många saker först i slutet av året, och kanske först 2020.

Källa: will.com

Lägg en kommentar