Elbrus VS Intel. Aerodiski Vostoki ja mootori salvestussüsteemide jõudluse võrdlemine

Elbrus VS Intel. Aerodiski Vostoki ja mootori salvestussüsteemide jõudluse võrdlemine

Tere kõigile. Jätkame Venemaa Elbrus 8C protsessoril põhineva andmesalvestussüsteemi Aerodiski VOSTOK tutvustamist.

Selles artiklis analüüsime (nagu lubatud) üksikasjalikult üht kõige populaarsemat ja huvitavamat Elbrusega seotud teemat, nimelt tootlikkust. Spekulatsioone Elbruse jõudluse kohta on üsna palju ja täiesti polaarseid. Pessimistid ütlevad, et Elbruse tootlikkus on praegu "mitte midagi" ja "tipptootjatele" järele jõudmiseks kulub aastakümneid (st praeguses tegelikkuses mitte kunagi). Seevastu optimistid ütlevad, et Elbrus 8C näitab juba häid tulemusi ning järgmise paari aasta jooksul saame protsessorite uute versioonide (Elbrus 16C ja 32C) väljalaskmisega “järele jõuda ja mööduda”. maailma juhtivad protsessorite tootjad.

Oleme Aerodiskis asjalikud inimesed, seega valisime kõige lihtsama ja (meie jaoks) kõige arusaadavama tee: testime, paneme tulemused kirja ja alles siis teeme järeldused. Selle tulemusena viisime läbi üsna suure hulga teste ja avastasime mitmeid Elbrus 8C e2k arhitektuuri tööfunktsioone (sealhulgas meeldivaid) ning loomulikult võrdlesime seda sarnaste salvestussüsteemidega Intel Xeon amd64 arhitektuuriprotsessoritel.

Muide, Elbruse salvestussüsteemide testidest, tulemustest ja edasisest arengust räägime täpsemalt meie järgmisel veebiseminaril “OkoloIT” 15.10.2020. oktoobril 15 kell 00:XNUMX. Registreeruda saad alloleva lingi kaudu.

Registreerumine veebiseminarile

Katselaud

Oleme loonud kaks stendi. Mõlemad stendid koosnevad Linuxi serverist, mis on ühendatud 16G FC lülitite kaudu kahe salvestuskontrolleriga, millele on paigaldatud 12 SAS SSD 960 GB ketast (11,5 TB “tooremahust” või 5,7 TB “kasutatavat” mahtu, kui kasutame RAID-10) .

Skemaatiliselt näeb stend välja selline.

Elbrus VS Intel. Aerodiski Vostoki ja mootori salvestussüsteemide jõudluse võrdlemine

Stend nr 1 e2k (Elbrus)

Riistvara konfiguratsioon on järgmine:

  • Linuxi server (2xIntel Xeon E5-2603 v4 (6 tuuma, 1,70 Ghz), 64 GB DDR4, 2xFC adapter 16G 2 porti) – 1 tk.
  • Lüliti FC 16 G – 2 tk.
  • Salvestussüsteem Aerodisk Vostok 2-E12 (2xElbrus 8C (8 tuuma, 1,20Ghz), 32 GB DDR3, 2xFE FC-adapter 16G 2 port, 12xSAS SSD 960 GB) - 1 tk.

Stend nr 2 amd64 (Intel)

Võrdluseks e2k sarnase konfiguratsiooniga kasutasime sarnast salvestuskonfiguratsiooni protsessoriga, mis on omadustelt sarnane amd64-ga:

  • Linuxi server (2xIntel Xeon E5-2603 v4 (6 tuuma, 1,70 Ghz), 64 GB DDR4, 2xFC adapter 16G 2 porti) – 1 tk.
  • Lüliti FC 16 G – 2 tk.
  • Salvestussüsteem Aerodisk Engine N2 (2xIntel Xeon E5-2603 v4 (6 tuuma, 1,70Ghz), 32 GB DDR4, 2xFE FC-adapter 16G 2 port, 12xSAS SSD 960 GB) - 1 tk.

Oluline märkus: testis kasutatud Elbrus 8C protsessorid toetavad ainult DDR3 RAM-i, see on muidugi “halb, aga mitte kauaks”. Elbrus 8SV (meil pole seda veel laos, kuid see on varsti saadaval) toetab DDR4.

Testimise metoodika

Koormuse genereerimiseks kasutasime populaarset ja aja testitud Flexible IO (FIO) programmi.

Mõlemad salvestussüsteemid on konfigureeritud vastavalt meie konfiguratsioonisoovitustele, mis põhinevad kõrge jõudlusega plokijuurdepääsul, seega kasutame DDP (Dynamic Disk Pool) kettakogumeid. Et testitulemusi mitte moonutada, keelame mõlemas salvestussüsteemis tihendamise, dubleerimise ja RAM-i vahemälu.

RAID-8-s loodi 10 D-LUN-i, igaüks 500 GB, kasutatava kogumahuga 4 TB (st umbes 70% selle konfiguratsiooni võimalikust kasutatavast mahust).

Salvestussüsteemide kasutamise põhi- ja populaarsed stsenaariumid viiakse läbi, eelkõige:

kaks esimest testi emuleerivad tehingulise DBMS-i tööd. Selles testide rühmas oleme huvitatud IOPS-ist ja latentsusest.

1) Juhuslik lugemine väikeste plokkidena 4k
a. Ploki suurus = 4k
b. Lugemine/kirjutamine = 100%/0%
c. Tööde arv = 8
d. Järjekorra sügavus = 32
e. Laadi märk = täielik juhuslik

2) Juhuslik salvestamine väikeste plokkidena 4k
a. Ploki suurus = 4k
b. Lugemine/kirjutamine = 0%/100%
c. Tööde arv = 8
d. Järjekorra sügavus = 32
e. Laadi märk = täielik juhuslik

kaks teist testi emuleerivad DBMS-i analüütilise osa tööd. Selles testirühmas oleme huvitatud ka IOPS-ist ja latentsusest.

3) Järjestikune lugemine väikeste plokkidena 4k
a. Ploki suurus = 4k
b. Lugemine/kirjutamine = 100%/0%
c. Tööde arv = 8
d. Järjekorra sügavus = 32
e. Laadi märk = järjestikune

4) Järjestikune salvestamine väikeste plokkidena 4k
a. Ploki suurus = 4k
b. Lugemine/kirjutamine = 0%/100%
c. Tööde arv = 8
d. Järjekorra sügavus = 32
e. Laadi märk = järjestikune

Kolmas testide rühm emuleerib lugemise voogedastust (näide: võrgusaated, varukoopiate taastamine) ja voogesituse salvestamist (näiteks videovalve, varukoopiate salvestamine). Selles testide rühmas ei huvita meid enam IOPS, vaid MB/s ja ka latentsus.

5) Järjestikune lugemine suurtes plokkides 128k
a. Ploki suurus = 128k
b. Lugemine/kirjutamine = 0%/100%
c. Tööde arv = 8
d. Järjekorra sügavus = 32
e. Laadi märk = järjestikune

6) Järjestikune salvestamine suurtes plokkides 128k
a. Ploki suurus = 128k
b. Lugemine/kirjutamine = 0%/100%
c. Tööde arv = 8
d. Järjekorra sügavus = 32
e. Laadi märk = järjestikune

Iga test kestab ühe tunni, välja arvatud massiivi 7-minutiline soojendusaeg.

Katsetulemused

Testi tulemused on kokku võetud kahes tabelis.

Elbrus 8S (SHD Aerodisk Vostok 2-E12)

Elbrus VS Intel. Aerodiski Vostoki ja mootori salvestussüsteemide jõudluse võrdlemine

Intel Xeon E5-2603 v4 (salvestussüsteem Aerodisk Engine N2)

Elbrus VS Intel. Aerodiski Vostoki ja mootori salvestussüsteemide jõudluse võrdlemine

Tulemused osutusid äärmiselt huvitavateks. Mõlemal juhul kasutasime hästi ära salvestussüsteemi töötlusvõimsust (kasutustase 70-90%) ning antud olukorras on mõlema protsessori plussid ja miinused selgelt näha.

Mõlemas tabelis on rohelisega esile tõstetud testid, kus protsessorid “tunnevad end kindlalt” ja näitavad häid tulemusi, oranžiga aga olukorrad, mis protsessoritele “ei meeldi”.

Kui räägime juhuslikust koormusest väikestes plokkides, siis:

  • juhusliku lugemise seisukohalt on Intel Elbrust kindlasti ees, vahe on 2 korda;
  • juhusliku salvestamise seisukohalt on see kindlasti viik, mõlemad protsessorid näitasid ligikaudu võrdseid ja korralikke tulemusi.

Väikeste plokkide järjestikuse koormuse korral on pilt erinev:

  • nii lugemisel kui kirjutamisel edestab Intel Elbrust oluliselt (2 korda). Samas, kui Elbrusel on IOPS-indikaator madalam kui Intelil, kuid näeb korralik välja (200-300 tuhat), siis on ilmne probleem viivitustega (need on kolm korda suuremad kui Intelil). Kokkuvõtteks võib öelda, et Elbrus 8C praegusele versioonile „ei meeldi” järjestikused koormused väikestes plokkides. Ilmselgelt on tööd teha.

Kuid suurte plokkidega järjestikusel koormusel on pilt täpselt vastupidine:

  • mõlemad protsessorid näitasid umbes võrdseid tulemusi MB/s, kuid on üks AGA.... Elbruse latentsusjõudlus on 10 (kümme, Karl!!!) korda parem (st madalam) kui sarnasel Inteli protsessoril (0,4/0,5 ms versus 5,1/6,5 ms). Alguses arvasime, et see on tõrge, nii et kontrollisime uuesti tulemusi, tegime kordustesti, kuid kordustest näitas sama pilti. See on Elbruse (ja e2k arhitektuuri üldiselt) tõsine eelis Inteli (ja vastavalt ka amd64 arhitektuuri) ees. Loodame, et seda edu arendatakse edasi.

Elbruse juures on veel üks huvitav omadus, millele tähelepanelik lugeja võib tabelit vaadates tähelepanu pöörata. Kui vaadata Inteli lugemise ja kirjutamise jõudluse erinevust, siis kõigis testides on lugemine kirjutamisest keskmiselt umbes 50%+ ees. See on norm, millega kõik (ka meie) on harjunud. Kui vaadata Elbrust, on kirjutamisnäitajad lugemisnäitajatele palju lähemal, lugemine edestab kirjutamist reeglina 10–30%, mitte rohkem.

Mida see tähendab? Asjaolu, et Elbrus "tõesti armastab" kirjutamist ja see omakorda viitab sellele, et see protsessor on väga kasulik ülesannetes, kus kirjutamine on lugemisest selgelt ülekaalus (kes ütles Yarovaya seaduse?), mis on samuti e2k arhitektuuri vaieldamatu eelis, ja seda eelist tuleb arendada.

Järeldused ja lähitulevik

Elbruse ja Inteli keskklassi protsessorite võrdlustestid andmesalvestusülesannete jaoks näitasid ligikaudu võrdseid ja võrdselt väärikaid tulemusi, samas kui iga protsessor näitas oma huvitavaid omadusi.

Intel edestas Elbrust märkimisväärselt väikeste plokkide juhusliku lugemise, aga ka väikeste plokkide järjestikuse lugemise ja kirjutamise osas.

Juhuslikult väikestesse plokkidesse kirjutades näitavad mõlemad protsessorid võrdseid tulemusi.

Latentsusaja poolest näeb Elbrus voogedastuskoormuses Intelist oluliselt parem välja, st. järjestikusel lugemisel ja suurte plokkidena kirjutamisel.

Lisaks tuleb Elbrus erinevalt Intelist ühtviisi hästi toime nii lugemis- kui ka kirjutamiskoormusega, Inteli puhul on lugemine alati palju parem kui kirjutamine.
Saadud tulemuste põhjal saame teha järelduse Aerodisk Vostok andmesalvestussüsteemide rakendatavuse kohta Elbrus 8C protsessoril järgmistes ülesannetes:

  • infosüsteemid, kus domineerivad kirjutamistoimingud;
  • juurdepääs failidele;
  • Sidussaated;
  • CCTV;
  • varukoopia;
  • meedia sisu.

MCST meeskonnal on veel, mille kallal tööd teha, kuid nende töö tulemus on juba näha, mis muidugi ei saa muud üle kui rõõmustada.

Need testid viidi läbi Linuxi kerneliga e2k versioonile 4.19, praegu on beetatestides (MCST-s, Basalt SPO-s ja ka siin Aerodiskis) Linuxi kernel 5.4-e2k, milles on muuhulgas on tõsiselt ümber kujundatud ajakava ja palju optimeerimisi kiirete pooljuhtketaste jaoks. Samuti annab MCST JSC spetsiaalselt 5.x.x haru tuumade jaoks välja uue LCC-kompilaatori versiooni 1.25. Esialgsete tulemuste kohaselt võimaldavad samal Elbrus 8C protsessoril jõudlust veelgi märgatavamalt tõsta uus tuum, mis on koostatud uue kompilaatoriga, kerneli keskkond, süsteemiutiliidid ja teegid ning tegelikult ka tarkvara Aerodisk VOSTOK. Ja seda ilma seadmeid asendamata - samal protsessoril ja samade sagedustega.

Ootame kernel 5.4-l põhineva Aerodiski VOSTOK-i versiooni väljaandmist aasta lõpus ning niipea, kui töö uue versiooniga on lõppenud, uuendame testitulemusi ja avaldame need ka siin.

Kui nüüd pöörduda tagasi artikli algusesse ja vastata küsimusele, siis kellel on õigus: pessimistidel, kes ütlevad, et Elbrus pole midagi ega jõua kunagi juhtivatele protsessoritootjatele järele, või optimistidel, kes ütlevad, et "nad on juba peaaegu kinni püüdnud üles ja varsti möödub "? Kui lähtuda mitte stereotüüpidest ja religioossetest eelarvamustest, vaid tõelistest proovikividest, siis on optimistidel kindlasti õigus.

Elbrus näitab juba häid tulemusi võrreldes kesktaseme amd64 protsessoritega. Inteli või AMD serveriprotsessorite tippmudelitest on Elbrus 8-ke muidugi kaugel, kuid sinna see sihitud ei olnud, selleks tulevad välja protsessorid 16C ja 32C. Siis räägime.

Mõistame, et pärast seda artiklit on Elbruse kohta veelgi rohkem küsimusi, mistõttu otsustasime korraldada veel ühe veebipõhise veebiseminari “OkoloIT”, et neile küsimustele otse vastata.

Seekord on meie külaliseks MCST ettevõtte peadirektori asetäitja Konstantin Truškin. Veebiseminarile saad registreeruda alloleva lingi kaudu.

Registreerumine veebiseminarile

Täname teid kõiki, nagu alati, ootame konstruktiivset kriitikat ja huvitavaid küsimusi.

Allikas: www.habr.com

Lisa kommentaar