Huawei Dorado V6: gwres Sichuan

Huawei Dorado V6: gwres Sichuan
Nid oedd yr haf ym Moscow eleni, a dweud y gwir, yn dda iawn. Dechreuodd yn rhy gynnar ac yn gyflym, nid oedd gan bawb amser i ymateb iddo, a daeth i ben yn barod ddiwedd mis Mehefin. Felly, pan wahoddodd Huawei fi i fynd i Tsieina, i ddinas Chengdu, lle mae eu canolfan RnD wedi'i leoli, ar ôl edrych ar ragolygon y tywydd o +34 gradd yn y cysgod, cytunais ar unwaith. Wedi’r cyfan, dydw i ddim yr un oed bellach ac mae angen i mi gynhesu fy esgyrn ychydig. Ond hoffwn nodi ei bod yn bosibl cynhesu nid yn unig yr esgyrn, ond hefyd y tu mewn, oherwydd mae talaith Sichuan, y mae Chengdu ynddi mewn gwirionedd, yn enwog am ei chariad at fwyd sbeislyd. Ond o hyd, nid blog am deithio yw hwn, felly gadewch inni ddychwelyd at brif nod ein taith - llinell newydd o systemau storio - Huawei Dorado V6. Bydd yr erthygl hon yn eich chwifio ychydig o'r gorffennol, oherwydd ... fe'i hysgrifennwyd cyn y cyhoeddiad swyddogol, ond dim ond ar ôl y datganiad y cyhoeddwyd ef. Ac felly, heddiw byddwn yn edrych yn agosach ar bopeth diddorol a blasus y mae Huawei wedi'i baratoi ar ein cyfer.

Huawei Dorado V6: gwres Sichuan
Bydd 5 model yn y llinell newydd. Gellir cael pob model ac eithrio 3000V6 mewn dwy fersiwn - SAS a NVMe. Mae'r dewis yn pennu rhyngwyneb y disgiau y gallwch eu defnyddio yn y system hon, y porthladdoedd Back-End a nifer y gyriannau disg y gallwch eu gosod yn y system. Ar gyfer NVMe, defnyddir SSDs maint palmwydd, sy'n deneuach na SSDs SAS clasurol 2.5 ″ a gellir eu gosod mewn hyd at 36 darn. Y llinell newydd yw All Flash ac nid oes unrhyw ffurfweddiadau gyda disgiau.

Huawei Dorado V6: gwres Sichuan
Palm NVMe SSD

Yn fy marn i, mae'r Dorado 8000 a 18000 yn edrych fel y modelau mwyaf diddorol. Mae Huawei yn eu gosod fel systemau pen uchel, a, diolch i bolisi prisio Huawei, mae'n cyferbynnu'r modelau ystod canol hyn â'r segment cystadleuwyr. Y modelau hyn y byddaf yn canolbwyntio arnynt yn fy adolygiad heddiw. Nodaf ar unwaith, oherwydd eu nodweddion dylunio, fod gan systemau rheolydd deuol iau bensaernïaeth ychydig yn wahanol, yn wahanol i Dorado 8000 a 18000, felly nid yw popeth y byddaf yn siarad amdano heddiw yn berthnasol i fodelau iau.

Un o brif nodweddion y systemau newydd oedd y defnydd o sawl sglodyn, a ddatblygwyd yn fewnol, ac mae pob un ohonynt yn caniatáu ichi ddosbarthu'r llwyth rhesymegol o brosesydd canolog y rheolydd ac ychwanegu ymarferoldeb i wahanol gydrannau.
Huawei Dorado V6: gwres Sichuan

Calon y systemau newydd yw'r proseswyr Kunpeng 920, a ddatblygwyd ar dechnolegau ARM ac a weithgynhyrchir gan Huawei yn annibynnol. Yn dibynnu ar y model, mae nifer y creiddiau, eu hamlder a nifer y proseswyr gosodedig ym mhob rheolydd yn amrywio:
Huawei Dorado V6 8000 – 2CPU, 64 craidd
Huawei Dorado V6 18000 – 4CPU, 48 craidd
Huawei Dorado V6: gwres Sichuan

Datblygodd Huawei y prosesydd hwn ar bensaernïaeth ARM, a chyn belled ag y gwn, roedd yn bwriadu ei osod i ddechrau yn y modelau Dorado 8000 a 18000 hŷn yn unig, fel oedd eisoes yn wir gyda rhai modelau V5, ond gwnaeth sancsiynau addasiadau i'r syniad hwn. Wrth gwrs, soniodd ARM hefyd am wrthod cydweithredu â Huawei yn ystod gosod sancsiynau, ond yma mae'r sefyllfa'n wahanol i Intel. Mae Huawei yn cynhyrchu'r sglodion hyn yn annibynnol, ac ni all unrhyw sancsiynau atal y broses hon. Mae torri cysylltiadau ag ARM yn bygwth colli mynediad i ddatblygiadau newydd yn unig. O ran perfformiad, dim ond ar ôl cynnal profion annibynnol y bydd yn bosibl barnu. Er imi weld sut y tynnwyd 18000M IOPS o system Dorado 1 heb unrhyw broblemau, nes i mi ei ailadrodd â'm dwylo fy hun yn fy rac, ni fyddaf yn ei gredu. Ond mewn gwirionedd mae llawer o bŵer mewn rheolwyr. Mae gan fodelau hŷn 4 rheolydd, pob un â 4 prosesydd, gan roi cyfanswm o 768 craidd.
Huawei Dorado V6: gwres Sichuan

Ond byddaf yn siarad am y creiddiau hyd yn oed yn ddiweddarach, pan edrychwn ar bensaernïaeth y systemau newydd, ond am y tro gadewch inni ddychwelyd at sglodyn arall sydd wedi'i osod yn y system. Mae'r sglodyn yn edrych fel datrysiad hynod ddiddorol Esgyn 310 (Hyd y deallaf, brawd iau yr Ascend 910, yr hwn a gyflwynwyd yn ddiweddar i'r cyhoedd). Ei dasg yw dadansoddi blociau data sy'n mynd i mewn i'r system i gynyddu'r gymhareb taro Read. Mae'n anodd dweud sut y bydd yn perfformio yn y gwaith, oherwydd ... Heddiw mae'n gweithio yn unol â thempled penodol yn unig ac nid oes ganddo'r gallu i ddysgu mewn modd deallus. Mae ymddangosiad modd deallus yn cael ei addo mewn firmware yn y dyfodol, yn fwyaf tebygol yn gynnar y flwyddyn nesaf.

Gadewch i ni symud ymlaen at bensaernïaeth. Mae Huawei wedi parhau i ddatblygu ei dechnoleg Smart Matrix ei hun, sy'n gweithredu dull rhwyll llawn o gysylltu cydrannau. Ond os yn V5 dim ond ar gyfer mynediad gan reolwyr i ddisgiau yr oedd hyn, nawr mae gan bob rheolwr fynediad i'r holl borthladdoedd ar y Back-End a Front-End.
Huawei Dorado V6: gwres Sichuan

Diolch i'r bensaernïaeth microservice newydd, mae hyn hefyd yn caniatáu cydbwyso llwyth rhwng yr holl reolwyr, hyd yn oed os mai dim ond un lun sydd. Datblygwyd yr OS ar gyfer y llinell hon o araeau o'r gwaelod i fyny, ac nid yn syml wedi'i optimeiddio ar gyfer defnyddio gyriannau Flash. Oherwydd y ffaith bod gan ein holl reolwyr fynediad i'r un porthladdoedd, os bydd rheolwr yn methu neu'n ailgychwyn, nid yw'r gwesteiwr yn colli un llwybr i'r system storio, a chynhelir newid llwybr ar lefel y system storio. Fodd bynnag, nid yw defnyddio UltraPath ar y gwesteiwr yn gwbl angenrheidiol. “Arbediad” arall wrth osod y system yw'r nifer llai o ddolenni angenrheidiol. Ac os gyda'r dull “clasurol” ar gyfer 4 rheolydd bydd angen 8 cyswllt o 2 ffatri, yna yn achos Huawei bydd hyd yn oed 2 yn ddigon (nid wyf yn siarad nawr am ddigonolrwydd mewnbwn un cyswllt).
Huawei Dorado V6: gwres Sichuan

Fel yn y fersiwn flaenorol, defnyddir storfa fyd-eang gyda drychau. Mae hyn yn caniatáu ichi golli hyd at ddau reolwr ar yr un pryd neu dri rheolydd yn olynol heb effeithio ar argaeledd. Ond mae'n werth nodi na welsom gydbwyso llwyth cyflawn rhwng y 3 rheolydd sy'n weddill pe bai un methiant yn y stondin demo. Cafodd llwyth y rheolydd a fethwyd ei gymryd drosodd yn gyfan gwbl gan un o'r rhai oedd yn weddill. Mae'n bosibl ar gyfer hyn bod angen gadael i'r system weithio'n hirach yn y cyfluniad hwn. Beth bynnag, byddaf yn gwirio hyn yn fanylach gan ddefnyddio fy mhrofion fy hun.
Mae Huawei yn gosod y systemau newydd fel systemau NVMe End-to-End, ond heddiw nid yw NVMeOF yn cael ei gefnogi eto ar y pen blaen, dim ond FC, iSCSI neu NFS. Ar ddiwedd hyn neu ddechrau'r nesaf, fel nodweddion eraill, rydym yn addo cefnogaeth RoCE.
Huawei Dorado V6: gwres Sichuan

Mae'r silffoedd hefyd wedi'u cysylltu â'r rheolwyr sy'n defnyddio RoCE, ac mae un anfantais yn gysylltiedig â hyn - absenoldeb cysylltiad "dolen" o'r silffoedd, fel yn achos SAS. Yn fy marn i, mae hyn yn dal i fod yn anfantais eithaf mawr os ydych chi'n cynllunio system weddol fawr. Y ffaith yw bod yr holl silffoedd wedi'u cysylltu mewn cyfres, ac mae methiant un o'r silffoedd yn arwain at anhygyrchedd llwyr yr holl silffoedd sy'n ei ddilyn. Yn yr achos hwn, er mwyn sicrhau goddefgarwch bai, bydd yn rhaid i ni gysylltu'r holl silffoedd â rheolwyr, sy'n golygu cynnydd yn y nifer ofynnol o borthladdoedd backend yn y system.

Ac un peth arall sy'n werth ei grybwyll yw diweddariad nad yw'n aflonyddgar (NDU). Fel y dywedais uchod, mae Huawei wedi gweithredu dull cynhwysydd o weithredu'r OS ar gyfer y llinell Dorado newydd, mae hyn yn caniatáu ichi ddiweddaru ac ailgychwyn gwasanaethau heb yr angen i ailgychwyn y rheolydd yn llwyr. Mae'n werth nodi ar unwaith y bydd rhai diweddariadau yn cynnwys diweddariadau cnewyllyn, ac yn yr achos hwn, weithiau bydd angen ailgychwyn clasurol o reolwyr yn ystod y diweddariad, ond nid bob amser. Bydd hyn yn lleihau effaith y gweithrediad hwn ar y system gynhyrchiol.

Yn ein arsenal, mae mwyafrif helaeth yr araeau yn dod o NetApp. Felly, rwy'n meddwl y bydd yn eithaf rhesymegol os byddaf yn gwneud cymhariaeth fach â systemau y mae'n rhaid i mi weithio cryn dipyn â hwy. Nid yw hyn yn ymgais i benderfynu pwy sy'n well a phwy sy'n waeth na phwy sy'n fwy manteisiol ar bensaernïaeth. Byddaf yn ceisio yn sobr a heb ffanatigiaeth gymharu dau ddull gwahanol o ddatrys yr un broblem gan wahanol werthwyr. Ydy, wrth gwrs, yn yr achos hwn byddwn yn ystyried systemau Huawei mewn “theori” a byddaf hefyd yn nodi ar wahân y pwyntiau hynny y bwriedir eu gweithredu mewn fersiynau cadarnwedd yn y dyfodol. Pa fanteision a welaf ar hyn o bryd:

  1. Nifer y gyriannau NVMe a gefnogir. Ar hyn o bryd mae gan NetApp 288 ohonyn nhw, tra bod gan Huawei 1600-6400, yn dibynnu ar y model. Ar yr un pryd, cynhwysedd defnyddiadwy Huawei Max yw 32PBe, yn union fel systemau NetApp (i fod yn fwy manwl gywir, mae ganddyn nhw 31.64PBe). Ac mae hyn er gwaethaf y ffaith bod gyriannau o'r un cyfaint yn cael eu cefnogi (hyd at 15Tb). Mae Huawei yn esbonio'r ffaith hon fel a ganlyn: ni chawsant gyfle i ymgynnull stondin mwy. Mewn theori, nid oes ganddynt unrhyw gyfyngiad cyfaint, ond yn syml nid ydynt wedi gallu profi'r ffaith hon eto. Ond yma mae'n werth nodi bod galluoedd gyriannau fflach heddiw yn uchel iawn, ac yn achos systemau NVMe rydym yn wynebu'r ffaith bod 24 gyriant yn ddigon i ddefnyddio system 2-reolwr pen uchaf. Yn unol â hynny, ni fydd cynnydd pellach yn nifer y disgiau yn y system nid yn unig yn darparu cynnydd perfformiad, ond bydd hefyd yn cael effaith wael ar y gymhareb IOPS / Tb. Wrth gwrs, mae'n werth gweld faint o yriannau y gall y systemau 4-rheolwr 8000 a 16000 eu trin, oherwydd ... Nid yw galluoedd a photensial y Kunpeng 920 yn gwbl glir o hyd.
  2. Presenoldeb Lun fel perchennog systemau NetApp. Y rhai. Dim ond un rheolydd all gyflawni gweithrediadau gyda'r lleuad, tra bod yr ail un yn pasio IO trwy'i hun yn unig. I'r gwrthwyneb, nid oes gan systemau Huawei unrhyw berchnogion a gall unrhyw un o'r rheolwyr gyflawni gweithrediadau gyda blociau data (cywasgu, dad-ddyblygu), yn ogystal â'u hysgrifennu ar ddisgiau.
  3. Nid oes unrhyw borthladd yn disgyn pan fydd un o'r rheolwyr yn methu. I rai, mae'r foment hon yn edrych yn hynod feirniadol. Y gwir amdani yw y dylai newid y tu mewn i'r system storio ddigwydd yn gyflymach nag ar yr ochr gwesteiwr. Ac os yn achos yr un NetApp, yn ymarferol canfuom rewi o tua 5 eiliad wrth dynnu'r rheolydd allan a newid llwybrau, yna gyda newid i Huawei mae'n rhaid i ni ymarfer o hyd.
  4. Nid oes angen ailgychwyn y rheolydd wrth ei ddiweddaru. Dechreuodd hyn fy mhoeni'n arbennig gyda rhyddhau fersiynau newydd a changhennau cadarnwedd yn weddol aml ar gyfer NetApps. Oes, bydd angen ailgychwyn rhai diweddariadau ar gyfer Huawei o hyd, ond nid pob un.
  5. 4 rheolydd Huawei am bris dau reolwr NetApp. Fel y dywedais uchod, diolch i bolisi prisio Huawei, gall gystadlu â'r ystod ganol gyda'i fodelau pen uchel.
  6. Presenoldeb sglodion ychwanegol mewn rheolwyr silff a chardiau porthladd, y bwriedir iddynt o bosibl wella effeithlonrwydd system.

Anfanteision a phryderon yn gyffredinol:

  1. Cysylltiad uniongyrchol silffoedd â rheolwyr neu'r angen am nifer fawr o borthladdoedd pen ôl i gysylltu pob silff â rheolwyr.
  2. Pensaernïaeth ARM a phresenoldeb nifer fawr o sglodion - pa mor effeithlon y bydd yn gweithio, ac a fydd y perfformiad yn ddigon?

Gall y mwyafrif o bryderon ac ofnau gael eu chwalu trwy brofi'r llinell newydd yn bersonol. Rwy'n gobeithio y byddant yn ymddangos ym Moscow yn fuan ar ôl eu rhyddhau ac y bydd digon ohonynt i gael un yn gyflym ar gyfer eich profion eich hun. Hyd yn hyn, gallwn ddweud bod dull y cwmni yn gyffredinol yn edrych yn ddiddorol, ac mae'r llinell newydd yn edrych yn dda iawn o'i gymharu â'i gystadleuwyr. Mae'r gweithredu terfynol yn codi llawer o gwestiynau, oherwydd Dim ond ar ddiwedd y flwyddyn y byddwn yn gweld llawer o bethau, ac efallai dim ond yn 2020.

Ffynhonnell: hab.com

Ychwanegu sylw