Elbrus VS Intel. Sammenligning av ytelsen til lagringssystemer Aerodisk Vostok og Engine

Elbrus VS Intel. Sammenligning av ytelsen til lagringssystemer Aerodisk Vostok og Engine

Hei alle sammen. Vi fortsetter å introdusere deg til Aerodisk VOSTOK-datalagringssystemet, basert på den russiske Elbrus 8C-prosessoren.

I denne artikkelen vil vi (som lovet) analysere i detalj et av de mest populære og interessante emnene knyttet til Elbrus, nemlig produktivitet. Det er ganske mange spekulasjoner om ytelsen til Elbrus, og absolutt polare. Pessimister sier at Elbrus' produktivitet nå er "ingenting", og det vil ta flere tiår å ta igjen de "topp" produsentene (dvs. aldri i den nåværende virkeligheten). På den annen side sier optimister at Elbrus 8C allerede viser gode resultater, og i løpet av de neste par årene, med utgivelsen av nye versjoner av prosessorer (Elbrus 16C og 32C), vil vi være i stand til å "ta igjen og overta" verdens ledende prosessorprodusenter.

Vi i Aerodisk er praktiske mennesker, så vi tok den enkleste og mest forståelige (for oss) ruten: test, registrer resultatene og først deretter trekke konklusjoner. Som et resultat gjennomførte vi et stort antall tester og oppdaget en rekke driftsfunksjoner til Elbrus 8C e2k-arkitekturen (inkludert hyggelige) og selvfølgelig sammenlignet dette med lignende lagringssystemer på Intel Xeon amd64-arkitekturprosessorer.

Vi vil forresten snakke mer detaljert om testene, resultatene og fremtidig utvikling av lagringssystemer på Elbrus på vårt neste webinar “OkoloIT” 15.10.2020. oktober 15 kl 00:XNUMX. Du kan registrere deg ved å bruke lenken nedenfor.

Påmelding til webinaret

Prøvestativ

Vi har laget to stands. Begge standene består av en server som kjører Linux, koblet via 16G FC-svitsjer til to lagringskontrollere, der 12 SAS SSD 960 GB-disker er installert (11,5 TB "råkapasitet" eller 5,7 TB "brukbar" kapasitet, hvis vi bruker RAID -10).

Skjematisk ser stativet slik ut.

Elbrus VS Intel. Sammenligning av ytelsen til lagringssystemer Aerodisk Vostok og Engine

Stand nr. 1 e2k (Elbrus)

Maskinvarekonfigurasjonen er som følger:

  • Linux-server (2xIntel Xeon E5-2603 v4 (6 kjerner, 1,70Ghz), 64 GB DDR4, 2xFC-adapter 16G 2 porter) – 1 stk.
  • Bryter FC 16 G – 2 stk.
  • Lagringssystem Aerodisk Vostok 2-E12 (2xElbrus 8C (8 kjerner, 1,20Ghz), 32 GB DDR3, 2xFE FC-adapter 16G 2 port, 12xSAS SSD 960 GB) - 1 stk.

Stand nr. 2 amd64 (Intel)

For sammenligning med en lignende konfigurasjon på e2k, brukte vi en lignende lagringskonfigurasjon med en prosessor som ligner i egenskaper som amd64:

  • Linux-server (2xIntel Xeon E5-2603 v4 (6 kjerner, 1,70Ghz), 64 GB DDR4, 2xFC-adapter 16G 2 porter) – 1 stk.
  • Bryter FC 16 G – 2 stk.
  • Lagringssystem Aerodisk Engine N2 (2xIntel Xeon E5-2603 v4 (6 kjerner, 1,70Ghz), 32 GB DDR4, 2xFE FC-adapter 16G 2 port, 12xSAS SSD 960 GB) - 1 stk.

Viktig merknad: Elbrus 8C-prosessorene som brukes i testen støtter kun DDR3 RAM, dette er selvfølgelig "dårlig, men ikke lenge." Elbrus 8SV (vi har den ikke på lager ennå, men vil ha den snart) støtter DDR4.

Testmetodikk

For å generere belastningen brukte vi det populære og tidstestede programmet Flexible IO (FIO).

Begge lagringssystemene er konfigurert i henhold til våre konfigurasjonsanbefalinger, basert på kravene til høy ytelse ved blokktilgang, så vi bruker DDP (Dynamic Disk Pool) diskpooler. For ikke å forvrenge testresultatene, deaktiverer vi komprimering, deduplisering og RAM-cache på begge lagringssystemene.

8 D-LUN-er ble laget i RAID-10, 500 GB hver, med en total brukbar kapasitet på 4 TB (dvs. omtrent 70 % av den mulige brukbare kapasiteten til denne konfigurasjonen).

Grunnleggende og populære scenarier for bruk av lagringssystemer vil bli utført, spesielt:

de to første testene emulerer driften av et transaksjonelt DBMS. I denne gruppen av tester er vi interessert i IOPS og latens.

1) Tilfeldig lesing i små blokker 4k
en. Blokkstørrelse = 4k
b. Les/skriv = 100 %/0 %
c. Antall verk = 8
d. Kødybde = 32
e. Last inn tegn = Full Random

2) Tilfeldig opptak i små blokker 4k
en. Blokkstørrelse = 4k
b. Les/skriv = 0 %/100 %
c. Antall verk = 8
d. Kødybde = 32
e. Last inn tegn = Full Random

de to andre testene emulerer driften av den analytiske delen av DBMS. I denne gruppen av tester er vi også interessert i IOPS og latens.

3) Sekvensiell lesing i små blokker 4k
en. Blokkstørrelse = 4k
b. Les/skriv = 100 %/0 %
c. Antall verk = 8
d. Kødybde = 32
e. Last tegn = Sekvensiell

4) Sekvensielt opptak i små blokker 4k
en. Blokkstørrelse = 4k
b. Les/skriv = 0 %/100 %
c. Antall verk = 8
d. Kødybde = 32
e. Last tegn = Sekvensiell

Den tredje gruppen med tester emulerer arbeidet med streaming av lesing (eksempel: nettsendinger, gjenoppretting av sikkerhetskopier) og streaming av opptak (eksempel: videoovervåking, opptak av sikkerhetskopier). I denne gruppen av tester er vi ikke lenger interessert i IOPS, men i MB/s og også latens.

5) Sekvensiell lesing i store blokker på 128k
en. Blokkstørrelse = 128k
b. Les/skriv = 0 %/100 %
c. Antall verk = 8
d. Kødybde = 32
e. Last tegn = Sekvensiell

6) Sekvensielt opptak i store blokker på 128k
en. Blokkstørrelse = 128k
b. Les/skriv = 0 %/100 %
c. Antall verk = 8
d. Kødybde = 32
e. Last tegn = Sekvensiell

Hver test vil vare en time, unntatt oppvarmingstiden på 7 minutter.

Testresultater

Testresultatene er oppsummert i to tabeller.

Elbrus 8S (SHD Aerodisk Vostok 2-E12)

Elbrus VS Intel. Sammenligning av ytelsen til lagringssystemer Aerodisk Vostok og Engine

Intel Xeon E5-2603 v4 (lagringssystem Aerodisk Engine N2)

Elbrus VS Intel. Sammenligning av ytelsen til lagringssystemer Aerodisk Vostok og Engine

Resultatene viste seg å være svært interessante. I begge tilfeller utnyttet vi lagringssystemets prosessorkraft (70-90 % utnyttelse), og i denne situasjonen er fordelene og ulempene med begge prosessorene tydelige.

I begge tabellene er tester der prosessorer «føler seg selvsikre» og viser gode resultater fremhevet med grønt, mens situasjoner som prosessorer «ikke liker» er uthevet med oransje.

Hvis vi snakker om tilfeldig belastning i små blokker, så:

  • fra synspunktet til tilfeldig lesing er Intel absolutt foran Elbrus, forskjellen er 2 ganger;
  • fra et tilfeldig opptakssynspunkt er det definitivt uavgjort, begge prosessorene viste omtrent like og anstendige resultater.

I en sekvensiell belastning i små blokker er bildet annerledes:

  • både ved lesing og skriving er Intel betydelig (2 ganger) foran Elbrus. På samme tid, hvis Elbrus har en IOPS-indikator som er lavere enn Intel, men ser anstendig ut (200-300 tusen), så er det et åpenbart problem med forsinkelser (de er tre ganger høyere enn Intels). Konklusjon, den nåværende versjonen av Elbrus 8C "liker ikke" sekvensielle belastninger i små blokker. Det er tydeligvis en del arbeid å gjøre.

Men i en sekvensiell belastning med store blokker er bildet nøyaktig det motsatte:

  • begge prosessorene viste omtrent like resultater i MB/s, men det er ett MEN.... Elbrus' latency ytelse er 10 (ti, Karl!!!) ganger bedre (dvs. lavere) enn for en lignende prosessor fra Intel (0,4/0,5 ms mot 5,1/6,5 ms). Først trodde vi det var en feil, så vi sjekket resultatene på nytt, gjorde en retest, men retesten viste det samme bildet. Dette er en alvorlig fordel med Elbrus (og e2k-arkitekturen generelt) fremfor Intel (og følgelig amd64-arkitekturen). La oss håpe at denne suksessen vil bli videreutviklet.

Det er et annet interessant trekk ved Elbrus, som en oppmerksom leser kan ta hensyn til ved å se på bordet. Hvis du ser på forskjellen mellom Intels lese- og skriveytelse, så i alle tester er lesing foran skriving i gjennomsnitt med ca 50%+. Dette er normen som alle (inkludert oss) er vant til. Hvis du ser på Elbrus, er skriveindikatorene mye nærmere leseindikatorene; lesing er foran skriving, som regel med 10 - 30 %, ikke mer.

Hva betyr dette? Det faktum at Elbrus "virkelig elsker" å skrive, og dette, i sin tur, antyder at denne prosessoren vil være svært nyttig i oppgaver der skriving klart råder over lesing (hvem sa Yarovayas lov?), som også er en utvilsom fordel e2k-arkitektur, og denne fordelen må utvikles.

Konklusjoner og nær fremtid

Sammenlignende tester av Elbrus og Intel mellomklasseprosessorer for datalagringsoppgaver viste omtrent like og like verdige resultater, mens hver prosessor viste sine egne interessante funksjoner.

Intel klarte sterkt bedre enn Elbrus i tilfeldig lesing i små blokker, så vel som i sekvensiell lesing og skriving i små blokker.

Når du skriver tilfeldig i små blokker, viser begge prosessorene like resultater.

Når det gjelder latens, ser Elbrus betydelig bedre ut enn Intel i en strømmebelastning, d.v.s. i sekvensiell lesing og skriving i store blokker.

I tillegg takler Elbrus, i motsetning til Intel, like godt både lese- og skrivebelastninger, mens med Intel er lesing alltid mye bedre enn å skrive.
Basert på de oppnådde resultatene kan vi trekke en konklusjon om anvendeligheten av Aerodisk Vostok-datalagringssystemer på Elbrus 8C-prosessoren i følgende oppgaver:

  • informasjonssystemer med en overvekt av skriveoperasjoner;
  • filtilgang;
  • nettsendinger;
  • CCTV;
  • sikkerhetskopiering;
  • medieinnhold.

MCST-teamet har fortsatt noe å jobbe med, men resultatet av arbeidet deres er allerede synlig, som selvfølgelig ikke kan annet enn å glede seg.

Disse testene ble utført på Linux-kjernen for e2k versjon 4.19; for tiden i beta-tester (i MCST, i Basalt SPO, og også her i Aerodisk) er det en Linux-kjerne 5.4-e2k, der den blant annet har blitt seriøst redesignet planlegger og mange optimaliseringer for høyhastighets solid-state-stasjoner. Spesielt for kjerner i 5.x.x-grenen, gir MCST JSC også ut en ny LCC-kompilator, versjon 1.25. I følge foreløpige resultater, på den samme Elbrus 8C-prosessoren, vil en ny kjerne kompilert med en ny kompilator, et kjernemiljø, systemverktøy og biblioteker og faktisk Aerodisk VOSTOK-programvaren tillate en enda mer betydelig økning i ytelsen. Og dette er uten å bytte utstyr - på samme prosessor og med samme frekvenser.

Vi forventer utgivelse av en versjon av Aerodisk VOSTOK basert på kjerne 5.4 mot slutten av året, og så snart arbeidet med den nye versjonen er fullført, vil vi oppdatere testresultatene og også publisere dem her.

Hvis vi nå går tilbake til begynnelsen av artikkelen og svarer på spørsmålet, hvem har rett: pessimister som sier at Elbrus er "ingenting" og aldri vil ta igjen de ledende prosessorprodusentene, eller optimister som sier at "de har allerede nesten tatt igjen opp og vil snart innhente "? Hvis vi ikke går ut fra stereotypier og religiøse fordommer, men fra virkelige tester, så har optimistene definitivt rett.

Elbrus viser allerede gode resultater sammenlignet med mid-level amd64-prosessorer. Elbrus 8-ke er selvfølgelig langt fra toppmodellene av serverprosessorer fra Intel eller AMD, men det var ikke rettet mot det; prosessorene 16C og 32C vil bli utgitt for dette formålet. Da kan vi snakke.

Vi forstår at etter denne artikkelen vil det være enda flere spørsmål om Elbrus, så vi bestemte oss for å organisere et nytt nettseminar "OkoloIT" for å svare på disse spørsmålene live.

Denne gangen blir gjesten vår visegeneraldirektør for MCST-selskapet, Konstantin Trushkin. Du kan registrere deg for webinaret ved å bruke lenken nedenfor.

Påmelding til webinaret

Takk alle sammen, som alltid, vi ser frem til konstruktiv kritikk og interessante spørsmål.

Kilde: www.habr.com

Legg til en kommentar