Elbrus VS Intel. Comparant el rendiment dels sistemes d'emmagatzematge Aerodisk Vostok i Engine

Elbrus VS Intel. Comparant el rendiment dels sistemes d'emmagatzematge Aerodisk Vostok i Engine

Hola a tots. Continuem presentant-vos el sistema d'emmagatzematge de dades Aerodisk VOSTOK, basat en el processador rus Elbrus 8C.

En aquest article analitzarem (tal com ens vam prometre) amb detall un dels temes més populars i interessants relacionats amb Elbrus, és a dir, la productivitat. Hi ha força especulacions sobre l'actuació d'Elbrus, i absolutament polars. Els pessimistes diuen que la productivitat d'Elbrus ara no és "res", i que trigarà dècades a posar-se al dia amb els "tops" productors (és a dir, en la realitat actual, mai). D'altra banda, els optimistes asseguren que l'Elbrus 8C ja està donant bons resultats, i en els propers dos anys, amb el llançament de noves versions de processadors (Elbrus 16C i 32C), podrem "aconseguir-nos i avançar". fabricants de processadors líders del món.

Des d'Aerodisk som persones pràctiques, així que hem fet la ruta més senzilla i entenedora (per a nosaltres): provar, registrar els resultats i només després treure'n conclusions. Com a resultat, vam realitzar un gran nombre de proves i vam descobrir una sèrie de funcions operatives de l'arquitectura Elbrus 8C e2k (incloses les agradables) i, per descomptat, ho vam comparar amb sistemes d'emmagatzematge similars als processadors d'arquitectura Intel Xeon amd64.

Per cert, parlarem amb més detall de les proves, resultats i del futur desenvolupament dels sistemes d'emmagatzematge a Elbrus en el nostre proper seminari web "OkoloIT" el 15.10.2020 d'octubre de 15 a les 00:XNUMX. Podeu registrar-vos mitjançant l'enllaç següent.

Inscripció al webinar

banc de proves

Hem creat dos estands. Tots dos estands consisteixen en un servidor amb Linux, connectat mitjançant commutadors 16G FC a dos controladors d'emmagatzematge, en els quals s'instal·len 12 discs SAS SSD de 960 GB (11,5 TB de “capacitat bruta” o 5,7 TB de capacitat “utilitzable”, si fem servir RAID). -10).

Esquemàticament l'estand es veu així.

Elbrus VS Intel. Comparant el rendiment dels sistemes d'emmagatzematge Aerodisk Vostok i Engine

Stand núm. 1 e2k (Elbrus)

La configuració del maquinari és la següent:

  • Servidor Linux (2xIntel Xeon E5-2603 v4 (6 nuclis, 1,70 Ghz), 64 GB DDR4, 2xFC adaptador 16G 2 ports) – 1 unitat.
  • Interruptor FC 16 G – 2 peces.
  • Sistema d'emmagatzematge Aerodisk Vostok 2-E12 (2xElbrus 8C (8 nuclis, 1,20 Ghz), 32 GB DDR3, 2xFE FC-adaptador 16G 2 ports, 12xSAS SSD 960 GB) - 1 unitat.

Stand núm. 2 amd64 (Intel)

Per comparar amb una configuració similar a e2k, hem utilitzat una configuració d'emmagatzematge similar amb un processador de característiques similars a l'amd64:

  • Servidor Linux (2xIntel Xeon E5-2603 v4 (6 nuclis, 1,70 Ghz), 64 GB DDR4, 2xFC adaptador 16G 2 ports) – 1 unitat.
  • Interruptor FC 16 G – 2 peces.
  • Sistema d'emmagatzematge Aerodisk Engine N2 (2xIntel Xeon E5-2603 v4 (6 nuclis, 1,70 Ghz), 32 GB DDR4, 2xFE FC-adaptador 16G 2 ports, 12xSAS SSD 960 GB) - 1 unitat.

Nota important: els processadors Elbrus 8C utilitzats a la prova només admeten RAM DDR3, això és, per descomptat, "dolent, però no per molt de temps". Elbrus 8SV (encara no el tenim en estoc, però aviat el tindrem) és compatible amb DDR4.

Metodologia de la prova

Per generar la càrrega, hem utilitzat el popular i provat programa Flexible IO (FIO).

Tots dos sistemes d'emmagatzematge es configuren d'acord amb les nostres recomanacions de configuració, basant-se en els requisits d'alt rendiment en l'accés de blocs, de manera que utilitzem agrupacions de discos DDP (Dynamic Disk Pool). Per no distorsionar els resultats de les proves, desactivem la compressió, la deduplicació i la memòria cau RAM als dos sistemes d'emmagatzematge.

Es van crear 8 D-LUN en RAID-10, de 500 GB cadascun, amb una capacitat útil total de 4 TB (és a dir, aproximadament el 70% de la capacitat útil possible d'aquesta configuració).

S'executaran escenaris bàsics i populars per utilitzar sistemes d'emmagatzematge, en particular:

les dues primeres proves emulen el funcionament d'un SGBD transaccional. En aquest grup de proves estem interessats en IOPS i latència.

1) Lectura aleatòria en blocs petits 4k
a. Mida del bloc = 4k
b. Lectura/Escriptura = 100%/0%
c. Nombre d'obres = 8
d. Profunditat de la cua = 32
e. Caràcter de càrrega = Aleatori complet

2) Enregistrament aleatori en petits blocs 4k
a. Mida del bloc = 4k
b. Lectura/Escriptura = 0%/100%
c. Nombre d'obres = 8
d. Profunditat de la cua = 32
e. Caràcter de càrrega = Aleatori complet

les dues segones proves emulen el funcionament de la part analítica del SGBD. En aquest grup de proves també ens interessen les IOPS i la latència.

3) Lectura seqüencial en blocs petits 4k
a. Mida del bloc = 4k
b. Lectura/Escriptura = 100%/0%
c. Nombre d'obres = 8
d. Profunditat de la cua = 32
e. Caràcter de càrrega = Seqüencial

4) Enregistrament seqüencial en petits blocs 4k
a. Mida del bloc = 4k
b. Lectura/Escriptura = 0%/100%
c. Nombre d'obres = 8
d. Profunditat de la cua = 32
e. Caràcter de càrrega = Seqüencial

El tercer grup de proves emula el treball de lectura en streaming (exemple: emissions en línia, restauració de còpies de seguretat) i enregistrament en streaming (exemple: videovigilància, còpies de seguretat de gravació). En aquest grup de proves, ja no ens interessen les IOPS, sinó els MB/s i també la latència.

5) Lectura seqüencial en grans blocs de 128k
a. Mida del bloc = 128k
b. Lectura/Escriptura = 0%/100%
c. Nombre d'obres = 8
d. Profunditat de la cua = 32
e. Caràcter de càrrega = Seqüencial

6) Enregistrament seqüencial en grans blocs de 128k
a. Mida del bloc = 128k
b. Lectura/Escriptura = 0%/100%
c. Nombre d'obres = 8
d. Profunditat de la cua = 32
e. Caràcter de càrrega = Seqüencial

Cada prova durarà una hora, excloent el temps d'escalfament de la matriu de 7 minuts.

Resultats de la prova

Els resultats de la prova es resumeixen en dues taules.

Elbrus 8S (SHD Aerodisk Vostok 2-E12)

Elbrus VS Intel. Comparant el rendiment dels sistemes d'emmagatzematge Aerodisk Vostok i Engine

Intel Xeon E5-2603 v4 (sistema d'emmagatzematge Aerodisk Engine N2)

Elbrus VS Intel. Comparant el rendiment dels sistemes d'emmagatzematge Aerodisk Vostok i Engine

Els resultats van resultar molt interessants. En ambdós casos, hem fet un bon ús de la potència de processament del sistema d'emmagatzematge (70-90% d'utilització), i en aquesta situació, els pros i els contres d'ambdós processadors són clarament evidents.

En ambdues taules, les proves on els processadors "se senten segurs" i mostren bons resultats es destaquen en verd, mentre que les situacions que els processadors "no els agraden" es destaquen en taronja.

Si parlem de càrrega aleatòria en blocs petits, aleshores:

  • des del punt de vista de la lectura aleatòria, Intel està sens dubte per davant d'Elbrus, la diferència és 2 vegades;
  • des del punt de vista de l'enregistrament aleatori, definitivament és un empat, ambdós processadors van mostrar resultats aproximadament iguals i decents.

En una càrrega seqüencial en blocs petits, la imatge és diferent:

  • tant a l'hora de llegir com d'escriure, Intel està significativament (2 vegades) per davant d'Elbrus. Al mateix temps, si Elbrus té un indicador IOPS inferior al d'Intel, però sembla decent (200-300 mil), hi ha un problema evident amb els retards (són tres vegades més alt que el d'Intel). Conclusió, la versió actual d'Elbrus 8C realment "no li agraden" les càrregues seqüencials en blocs petits. És evident que hi ha feina per fer.

Però en una càrrega seqüencial amb blocs grans, la imatge és exactament la contrària:

  • tots dos processadors van mostrar resultats aproximadament iguals en MB/s, però hi ha un PERÒ... El rendiment de latència d'Elbrus és 10 (deu, Karl!!!) vegades millor (és a dir, inferior) que el d'un processador similar d'Intel (0,4/0,5 ms versus 5,1/6,5 ms). Al principi vam pensar que era un error, així que vam comprovar els resultats, vam fer una segona prova, però la segona prova va mostrar la mateixa imatge. Aquest és un avantatge seriós d'Elbrus (i de l'arquitectura e2k en general) sobre Intel (i, en conseqüència, l'arquitectura amd64). Esperem que aquest èxit es desenvolupi encara més.

Hi ha una altra característica interessant d'Elbrus, a la qual un lector atent pot prestar atenció mirant la taula. Si observeu la diferència entre el rendiment de lectura i escriptura d'Intel, a totes les proves, la lectura s'avança a l'escriptura en un 50% de mitjana. Aquesta és la norma a la qual tothom (inclosos nosaltres) estem acostumats. Si ens fixem en Elbrus, els indicadors d'escriptura estan molt més a prop dels indicadors de lectura; la lectura està per davant de l'escriptura, per regla general, entre un 10 i un 30%, no més.

Què vol dir això? El fet que a Elbrus "estimi molt" escriure, i això, al seu torn, suggereix que aquest processador serà molt útil en tasques on l'escriptura prevalgui clarament sobre la lectura (qui va dir la llei de Yarovaya?), que també és un avantatge indubtable de l'arquitectura e2k, i aquest avantatge s'ha de desenvolupar.

Conclusions i futur proper

Les proves comparatives dels processadors de gamma mitjana Elbrus i Intel per a tasques d'emmagatzematge de dades van mostrar resultats aproximadament iguals i igualment dignes, mentre que cada processador va mostrar les seves pròpies característiques interessants.

Intel va superar molt el rendiment d'Elbrus en la lectura aleatòria en blocs petits, així com en la lectura i escriptura seqüencial en blocs petits.

Quan s'escriu aleatòriament en blocs petits, ambdós processadors mostren resultats iguals.

Pel que fa a la latència, Elbrus té un aspecte significativament millor que Intel en una càrrega de streaming, és a dir. en lectura i escriptura seqüencial en grans blocs.

A més, Elbrus, a diferència d'Intel, fa igualment bé amb les càrregues de lectura i escriptura, mentre que amb Intel, llegir sempre és molt millor que escriure.
A partir dels resultats obtinguts, podem extreure una conclusió sobre l'aplicabilitat dels sistemes d'emmagatzematge de dades Aerodisk Vostok al processador Elbrus 8C en les tasques següents:

  • sistemes d'informació amb predomini de les operacions d'escriptura;
  • accés a fitxers;
  • emissions en línia;
  • CCTV;
  • còpia de seguretat;
  • contingut dels mitjans.

L'equip de l'MCST encara té alguna cosa per treballar, però el resultat de la seva feina ja és visible, que, és clar, no pot deixar d'alegrar-se.

Aquestes proves es van realitzar al nucli Linux per a e2k versió 4.19; actualment en proves beta (a MCST, a Basalt SPO, i també aquí a Aerodisk) hi ha un nucli Linux 5.4-e2k, en el qual, entre altres coses, té s'ha redissenyat seriosament el programador i moltes optimitzacions per a unitats d'estat sòlid d'alta velocitat. A més, específicament per als nuclis de la branca 5.x.x, MCST JSC llança un nou compilador LCC, la versió 1.25. Segons els resultats preliminars, en el mateix processador Elbrus 8C, un nou nucli compilat amb un nou compilador, un entorn del nucli, utilitats del sistema i biblioteques i, de fet, el programari Aerodisk VOSTOK permetran un augment encara més significatiu del rendiment. I això sense substituir l'equip: al mateix processador i amb les mateixes freqüències.

Esperem el llançament d'una versió d'Aerodisk VOSTOK basada en el nucli 5.4 a finals d'any, i tan bon punt s'acabi el treball en la nova versió, actualitzarem els resultats de les proves i també els publicarem aquí.

Si ara tornem al principi de l'article i responem a la pregunta, qui té raó: els pessimistes que diuen que Elbrus no és “res” i mai no arribaran al dia dels principals fabricants de processadors, o els optimistes que diuen que “ja gairebé ho han atrapat. amunt i aviat superarà"? Si no procedim d'estereotips i prejudicis religiosos, sinó de proves reals, els optimistes definitivament tenen raó.

Elbrus ja està mostrant bons resultats en comparació amb els processadors amd64 de nivell mitjà. L'Elbrus 8-ke està, per descomptat, lluny dels models de primera línia de processadors de servidor d'Intel o AMD, però no estava dirigit allà; els processadors 16C i 32C es llançaran amb aquesta finalitat. Després en parlarem.

Entenem que després d'aquest article hi haurà encara més preguntes sobre Elbrus, així que vam decidir organitzar un altre seminari en línia "OkoloIT" per respondre aquestes preguntes en directe.

Aquesta vegada el nostre convidat serà el director general adjunt de l'empresa MCST, Konstantin Trushkin. Podeu registrar-vos al seminari web mitjançant l'enllaç següent.

Inscripció al webinar

Gràcies a tots, com sempre, esperem crítiques constructives i preguntes interessants.

Font: www.habr.com

Afegeix comentari