Elbrus VS Intel. Aerodisk Vostok ja Enginen tallennusjärjestelmien suorituskyvyn vertailu

Elbrus VS Intel. Aerodisk Vostok ja Enginen tallennusjärjestelmien suorituskyvyn vertailu

Hei kaikki. Jatkamme venäläiseen Elbrus 8C -prosessoriin perustuvan Aerodisk VOSTOK -tiedontallennusjärjestelmän esittelyä.

Tässä artikkelissa (kuten luvattiin) analysoimme yksityiskohtaisesti yhtä suosituimmista ja mielenkiintoisimmista Elbrukseen liittyvistä aiheista, nimittäin tuottavuuden. Elbruksen suorituskyvystä on olemassa melko paljon spekulaatioita, ja täysin polaarisia. Pessimistit sanovat, että Elbruksen tuottavuus on nyt "ei mitään", ja kestää vuosikymmeniä päästä kiinni "huipputuottajiin" (eli nykyisessä todellisuudessa ei koskaan). Toisaalta optimistit sanovat, että Elbrus 8C näyttää jo hyviä tuloksia, ja parin seuraavan vuoden aikana uusien prosessoriversioiden (Elbrus 16C ja 32C) julkaisun myötä pystymme "kuromaan kiinni ja ohittamaan" maailman johtavia prosessorivalmistajia.

Me Aerodiskillä olemme käytännöllisiä ihmisiä, joten valitsimme yksinkertaisimman ja (meille) ymmärrettävimmän reitin: testaa, kirjaa tulokset ja vasta sen jälkeen tee johtopäätökset. Tämän seurauksena suoritimme melkoisen määrän testejä ja löysimme useita Elbrus 8C e2k -arkkitehtuurin toimintaominaisuuksia (mukaan lukien miellyttävät) ja tietysti vertasimme tätä vastaaviin Intel Xeon amd64 -arkkitehtuuriprosessoreiden tallennusjärjestelmiin.

Kerromme muuten tarkemmin Elbruksen testeistä, tuloksista ja tallennusjärjestelmien tulevasta kehityksestä seuraavassa webinaarissamme "OkoloIT" 15.10.2020 klo 15. Ilmoittautua voit alla olevan linkin kautta.

Ilmoittautuminen verkkoseminaariin

Testiteline

Olemme luoneet kaksi osastoa. Molemmat jalustat koostuvat Linux-palvelimesta, joka on kytketty 16G FC -kytkimillä kahteen tallennusohjaimeen, joihin on asennettu 12 SAS SSD 960 Gt -levyä (11,5 TB "raakakapasiteettia" tai 5,7 TB "käyttöistä" kapasiteettia, jos käytämme RAID-10:tä) .

Kaavamaisesti teline näyttää tältä.

Elbrus VS Intel. Aerodisk Vostok ja Enginen tallennusjärjestelmien suorituskyvyn vertailu

Osasto nro 1 e2k (Elbrus)

Laitteiston kokoonpano on seuraava:

  • Linux-palvelin (2xIntel Xeon E5-2603 v4 (6 ydintä, 1,70 GHz), 64 Gt DDR4, 2xFC-sovitin 16G 2 porttia) – 1 kpl.
  • Kytkin FC 16 G – 2 kpl.
  • Tallennusjärjestelmä Aerodisk Vostok 2-E12 (2xElbrus 8C (8 ydintä, 1,20 GHz), 32 Gt DDR3, 2xFE FC-sovitin 16G 2 porttia, 12xSAS SSD 960 Gt) - 1 kpl.

Teline nro 2 amd64 (Intel)

Vertailun vuoksi e2k:n samankaltaiseen kokoonpanoon käytimme samanlaista tallennuskokoonpanoa, jossa prosessori on ominaisuuksiltaan samanlainen kuin amd64:

  • Linux-palvelin (2xIntel Xeon E5-2603 v4 (6 ydintä, 1,70 GHz), 64 Gt DDR4, 2xFC-sovitin 16G 2 porttia) – 1 kpl.
  • Kytkin FC 16 G – 2 kpl.
  • Tallennusjärjestelmä Aerodisk Engine N2 (2xIntel Xeon E5-2603 v4 (6 ydintä, 1,70 GHz), 32 Gt DDR4, 2xFE FC-sovitin 16G 2 porttia, 12xSAS SSD 960 Gt) - 1 kpl.

Tärkeä huomautus: testissä käytetyt Elbrus 8C -prosessorit tukevat vain DDR3 RAM -muistia, tämä on tietysti "huono, mutta ei kauaa". Elbrus 8SV (meillä ei ole vielä varastossa, mutta saamme sen pian) tukee DDR4:ää.

Testausmenetelmä

Kuorman luomiseen käytimme suosittua ja aikatestattua Flexible IO (FIO) -ohjelmaa.

Molemmat tallennusjärjestelmät on konfiguroitu määrityssuositusten mukaisesti, jotka perustuvat korkean suorituskyvyn vaatimuksiin lohkokäytössä, joten käytämme DDP (Dynamic Disk Pool) -levyvarantoja. Jotta testitulokset eivät vääristy, poistamme pakkauksen, kopioinnin ja RAM-välimuistin käytöstä molemmissa tallennusjärjestelmissä.

RAID-8:een luotiin 10 D-LUN-yksikköä, kukin 500 Gt, joiden käytettävissä oleva kokonaiskapasiteetti on 4 Tt (eli noin 70 % tämän kokoonpanon mahdollisesta käytettävissä olevasta kapasiteetista).

Tallennusjärjestelmien käytön perus- ja suosittuskenaariot suoritetaan, erityisesti:

kaksi ensimmäistä testiä emuloivat transaktiotietokannan hallintajärjestelmän toimintaa. Tässä testiryhmässä olemme kiinnostuneita IOPS:stä ja latenssista.

1) Satunnaisluku pienissä lohkoissa 4k
a. Lohkon koko = 4k
b. Luku/kirjoitus = 100 %/0 %
c. Teosten määrä = 8
d. Jonon syvyys = 32
e. Lataa merkki = Full Random

2) Satunnainen tallennus pienissä lohkoissa 4k
a. Lohkon koko = 4k
b. Luku/kirjoitus = 0 %/100 %
c. Teosten määrä = 8
d. Jonon syvyys = 32
e. Lataa merkki = Full Random

kaksi toista testiä emuloivat DBMS:n analyyttisen osan toimintaa. Tässä testiryhmässä olemme kiinnostuneita myös IOPS:stä ja latenssista.

3) Jaksollinen luku pieninä lohkoina 4k
a. Lohkon koko = 4k
b. Luku/kirjoitus = 100 %/0 %
c. Teosten määrä = 8
d. Jonon syvyys = 32
e. Lataa merkki = peräkkäinen

4) Jaksottainen tallennus pienissä lohkoissa 4k
a. Lohkon koko = 4k
b. Luku/kirjoitus = 0 %/100 %
c. Teosten määrä = 8
d. Jonon syvyys = 32
e. Lataa merkki = peräkkäinen

Kolmas testiryhmä emuloi suoratoiston lukemista (esimerkki: online-lähetykset, varmuuskopioiden palauttaminen) ja suoratoistonauhoitusta (esimerkki: videovalvonta, varmuuskopioiden tallennus). Tässä testiryhmässä meitä ei enää kiinnosta IOPS, vaan MB/s ja myös latenssi.

5) Jaksollinen luku suurissa 128k:n lohkoissa
a. Lohkon koko = 128k
b. Luku/kirjoitus = 0 %/100 %
c. Teosten määrä = 8
d. Jonon syvyys = 32
e. Lataa merkki = peräkkäinen

6) Jaksottainen tallennus suurissa 128k:n lohkoissa
a. Lohkon koko = 128k
b. Luku/kirjoitus = 0 %/100 %
c. Teosten määrä = 8
d. Jonon syvyys = 32
e. Lataa merkki = peräkkäinen

Jokainen testi kestää yhden tunnin, lukuun ottamatta 7 minuutin järjestelmän lämpenemisaikaa.

Testitulokset

Testitulokset on koottu kahteen taulukkoon.

Elbrus 8S (SHD Aerodisk Vostok 2-E12)

Elbrus VS Intel. Aerodisk Vostok ja Enginen tallennusjärjestelmien suorituskyvyn vertailu

Intel Xeon E5-2603 v4 (tallennusjärjestelmä Aerodisk Engine N2)

Elbrus VS Intel. Aerodisk Vostok ja Enginen tallennusjärjestelmien suorituskyvyn vertailu

Tulokset osoittautuivat erittäin mielenkiintoisiksi. Molemmissa tapauksissa hyödynsimme hyvin tallennusjärjestelmän prosessointitehoa (70-90 % käyttöaste), ja tässä tilanteessa molempien prosessorien hyvät ja huonot puolet ovat selvästi nähtävissä.

Molemmissa taulukoissa testit, joissa prosessori tuntee olonsa luottavaiseksi ja osoittavat hyviä tuloksia, on korostettu vihreällä, kun taas tilanteet, joista prosessorit "eivät pidä" on korostettu oranssilla.

Jos puhumme satunnaisesta kuormituksesta pienissä lohkoissa, niin:

  • satunnaisen lukemisen näkökulmasta Intel on varmasti edellä Elbrusta, ero on 2 kertaa;
  • satunnaisen tallennuksen näkökulmasta se on ehdottomasti tasapeli, molemmat prosessorit näyttivät suunnilleen yhtäläisiä ja kunnollisia tuloksia.

Peräkkäisessä kuormassa pienissä lohkoissa kuva on erilainen:

  • sekä lukemisessa että kirjoittamisessa Intel on merkittävästi (2 kertaa) Elbrusta edellä. Samaan aikaan, jos Elbrusilla on alhaisempi IOPS-indikaattori kuin Intelillä, mutta se näyttää kunnolliselta (200-300 tuhatta), viiveissä on ilmeinen ongelma (ne ovat kolme kertaa korkeammat kuin Intelin). Johtopäätös, Elbrus 8C:n nykyinen versio todella "ei pidä" peräkkäisistä kuormista pienissä lohkoissa. On selvää, että työtä on tehtävänä.

Mutta peräkkäisessä kuormassa suurilla lohkoilla kuva on täsmälleen päinvastainen:

  • molemmat prosessorit näyttivät suunnilleen yhtäläiset tulokset MB/s, mutta on yksi MUTTA.... Elbrusin latenssin suorituskyky on 10 (kymmenen, Karl!!!) kertaa parempi (eli alhaisempi) kuin vastaavan Intelin prosessorin (0,4/0,5 ms vs. 5,1/6,5 ms). Aluksi luulimme, että se oli häiriö, joten tarkistimme tulokset uudelleen, teimme uusintatestin, mutta uusintatesti näytti saman kuvan. Tämä on Elbruksen (ja e2k-arkkitehtuurin ylipäätään) vakava etu Inteliin (ja vastaavasti amd64-arkkitehtuuriin) verrattuna. Toivotaan, että tätä menestystä kehitetään edelleen.

Elbrusissa on toinenkin mielenkiintoinen piirre, johon tarkkaavainen lukija voi kiinnittää huomiota katsomalla taulukkoa. Jos tarkastellaan eroa Intelin luku- ja kirjoitussuorituskyvyn välillä, niin lukeminen on kaikissa testeissä keskimäärin noin 50 %+ kirjoittamista edellä. Tämä on normi, johon kaikki (mukaan lukien me) ovat tottuneet. Jos katsot Elbrusta, kirjoitusilmaisimet ovat paljon lähempänä lukuilmaisimia; lukeminen on kirjoittamista edellä yleensä 10 - 30%, ei enempää.

Mitä tämä tarkoittaa? Se tosiasia, että Elbrus "todella rakastaa" kirjoittamista, ja tämä puolestaan ​​viittaa siihen, että tämä prosessori on erittäin hyödyllinen tehtävissä, joissa kirjoittaminen ylittää selvästi lukemisen (kuka sanoi Yarovayan lain?), mikä on myös kiistaton etu e2k-arkkitehtuurille, ja tätä etua on kehitettävä.

Johtopäätökset ja lähitulevaisuus

Elbrus- ja Intel-keskitason prosessorien vertailutestit tiedontallennustehtävissä osoittivat suunnilleen yhtäläisiä ja yhtä arvokkaita tuloksia, kun taas jokainen prosessori osoitti omat mielenkiintoiset piirteensä.

Intel ylitti Elbruksen huomattavasti satunnaisessa lukemisessa pienissä lohkoissa sekä peräkkäisessä lukemisessa ja kirjoittamisessa pienissä lohkoissa.

Kun kirjoitetaan satunnaisesti pieniin lohkoihin, molemmat prosessorit näyttävät yhtäläiset tulokset.

Latenssin suhteen Elbrus näyttää merkittävästi paremmalta kuin Intel suoratoistokuormassa, ts. peräkkäisessä lukemisessa ja kirjoittamisessa suurissa lohkoissa.

Lisäksi Elbrus, toisin kuin Intel, selviytyy yhtä hyvin sekä luku- että kirjoituskuormista, kun taas Intelillä lukeminen on aina paljon parempaa kuin kirjoittaminen.
Saatujen tulosten perusteella voimme tehdä johtopäätöksen Aerodisk Vostok -tietojen tallennusjärjestelmien soveltuvuudesta Elbrus 8C -prosessoriin seuraavissa tehtävissä:

  • tietojärjestelmät, joissa valtaosa kirjoitusoperaatioista;
  • tiedostojen käyttö;
  • Online-lähetykset;
  • CCTV;
  • varmuuskopioida;
  • mediasisältöä.

MCST-tiimillä on vielä tehtävää, mutta heidän työnsä tulos on jo näkyvissä, mikä tietysti ei voi kuin iloita.

Nämä testit suoritettiin Linux-ytimellä e2k-versiolle 4.19, tällä hetkellä beta-testeissä (MCST:ssä, Basalt SPO:ssa ja myös täällä Aerodiskissa) on Linux-ydin 5.4-e2k, jossa se on mm. ajoitusohjelma on suunniteltu vakavasti uudelleen ja monia optimointeja nopeille solid-state-asemille. Lisäksi erityisesti 5.x.x-haaran ytimille MCST JSC julkaisee uuden LCC-kääntäjän, version 1.25. Alustavien tulosten mukaan samassa Elbrus 8C -prosessorissa uudella kääntäjällä käännetty uusi ydin, ydinympäristö, järjestelmäapuohjelmat ja kirjastot sekä itse asiassa Aerodisk VOSTOK -ohjelmisto mahdollistavat vieläkin merkittävämmän suorituskyvyn lisäämisen. Ja tämä tapahtuu ilman laitteiden vaihtamista - samalla prosessorilla ja samoilla taajuuksilla.

Odotamme ytimeen 5.4 perustuvan Aerodisk VOSTOK -version julkaisun loppuvuodesta, ja heti kun työ uuden version parissa on valmis, päivitämme testitulokset ja julkaisemme ne myös täällä.

Jos nyt palataan artikkelin alkuun ja vastataan kysymykseen, kuka on oikeassa: pessimistit, jotka sanovat, että Elbrus ei ole mitään eikä tule koskaan kiinni johtavista prosessorivalmistajista, vai optimistit, jotka sanovat, että "he ovat jo melkein kiinni. ylös ja ohittaa pian "? Jos emme lähde stereotypioista ja uskonnollisista ennakkoluuloista, vaan todellisista kokeista, niin optimistit ovat ehdottomasti oikeassa.

Elbrus näyttää jo hyviä tuloksia verrattuna keskitason amd64-prosessoreihin. Elbrus 8-ke on tietysti kaukana Intelin tai AMD:n palvelinprosessorien huippumalleista, mutta sinne sitä ei suunnattu, vaan prosessorit 16C ja 32C julkaistaan ​​tätä tarkoitusta varten. Sitten puhutaan.

Ymmärrämme, että tämän artikkelin jälkeen Elbruksesta tulee vielä enemmän kysymyksiä, joten päätimme järjestää uuden verkkoseminaarin "OkoloIT" vastataksemme näihin kysymyksiin suorana.

Tällä kertaa vieraamme on MCST-yhtiön apulaisjohtaja Konstantin Truškin. Voit ilmoittautua webinaariin alla olevan linkin kautta.

Ilmoittautuminen verkkoseminaariin

Kiitos kaikille, kuten aina, odotamme rakentavaa kritiikkiä ja mielenkiintoisia kysymyksiä.

Lähde: will.com

Lisää kommentti