Huawei Dorado V6: топлина во Сечуан

Huawei Dorado V6: топлина во Сечуан
Летото во Москва оваа година беше, да бидам искрен, не многу добро. Започна прерано и брзо, немаа сите време да реагираат на тоа, а заврши веќе на крајот на јуни. Затоа, кога Huawei ме покани да одам во Кина, во градот Ченгду, каде што се наоѓа нивниот RnD центар, откако ја погледнав временската прогноза од +34 степени под сенка, веднаш се согласив. На крајот на краиштата, јас веќе не сум на иста возраст и треба малку да ги загреам коските. Но, би сакал да забележам дека беше можно да се загреат не само коските, туку и внатрешноста, бидејќи провинцијата Сечуан, во која всушност се наоѓа Ченгду, е позната по својата љубов кон зачинета храна. Но, сепак, ова не е блог за патување, па да се вратиме на главната цел на нашето патување - нова линија на системи за складирање - Huawei Dorado V6. Оваа статија ќе ве оддалечи малку од минатото, бидејќи... напишано е пред официјалното соопштение, но објавено дури по објавувањето. И така, денес одблиску ќе погледнеме се што е интересно и вкусно што ни подготви Huawei.

Huawei Dorado V6: топлина во Сечуан
Во новата линија ќе има 5 модели. Сите модели освен 3000V6 можат да се имаат во две верзии - SAS и NVMe. Изборот го одредува интерфејсот на дисковите што можете да ги користите во овој систем, портите Back-End и бројот на дискови што можете да ги инсталирате во системот. За NVMe се користат SSD-дискови со големина на дланка, кои се потенки од класичните SAS SSD-и од 2.5" и можат да се инсталираат до 36 парчиња. Новата линија е All Flash и нема конфигурации со дискови.

Huawei Dorado V6: топлина во Сечуан
Palm NVMe SSD

Според мое мислење, Dorado 8000 и 18000 изгледаат како најинтересните модели. Huawei ги позиционира како системи од високата класа и, благодарение на ценовната политика на Huawei, ги спротивставува овие модели од средната класа со сегментот на конкурентите. Токму на овие модели ќе се фокусирам во мојата денешна рецензија. Веднаш ќе забележам дека поради нивните дизајнерски карактеристики, помладите системи со двоен контролер имаат малку поинаква архитектура, различна од Dorado 8000 и 18000, така што сè за што ќе зборувам денес не е применливо за помладите модели.

Една од главните карактеристики на новите системи беше употребата на неколку чипови, развиени во куќата, од кои секој ви овозможува да го дистрибуирате логичкото оптоварување од централниот процесор на контролорот и да додадете функционалност на различни компоненти.
Huawei Dorado V6: топлина во Сечуан

Срцето на новите системи се процесорите Kunpeng 920, развиени на ARM технологиите и независно произведени од Huawei. Во зависност од моделот, бројот на јадра, нивната фреквенција и бројот на инсталирани процесори во секој контролер се разликуваат:
Huawei Dorado V6 8000 – 2CPU, 64 јадра
Huawei Dorado V6 18000 – 4CPU, 48 јадра
Huawei Dorado V6: топлина во Сечуан

Huawei го разви овој процесор на архитектурата на ARM, и колку што знам, првично планираше да го инсталира само во постарите модели Dorado 8000 и 18000, како што веќе беше случај со некои V5 модели, но санкциите направија прилагодувања на оваа идеја. Секако, АРМ зборуваше и за одбивање соработка со Huawei при воведувањето на санкциите, но овде ситуацијата е поинаква отколку кај Интел. Huawei ги произведува овие чипови независно и никакви санкции не можат да го запрат овој процес. Прекинувањето на односите со АРМ само се заканува со губење на пристапот до новите случувања. Што се однесува до перформансите, ќе може да се суди само по спроведување на независни тестови. Иако видов како 18000M IOPS беше отстранет од системот Dorado 1 без никакви проблеми, додека не го повторам со свои раце во мојот решетката, нема да верувам. Но, навистина има многу моќ во контролорите. Постарите модели се опремени со 4 контролери, секој со 4 процесори, што дава вкупно 768 јадра.
Huawei Dorado V6: топлина во Сечуан

Но, ќе зборувам за јадрата дури подоцна, кога ќе ја погледнеме архитектурата на новите системи, но засега да се вратиме на друг чип инсталиран во системот. Чипот изгледа како исклучително интересно решение Воздигни 310 година (Колку што разбрав, помладиот брат на Ascend 910, кој неодамна беше претставен на јавноста). Нејзината задача е да ги анализира податочните блокови кои влегуваат во системот за да го зголеми соодносот на хит на читање. Тешко е да се каже како ќе се претстави на работа, бидејќи ... Денес работи само според даден шаблон и нема можност да учи во интелигентен режим. Појавата на интелигентен режим е ветена во идниот фирмвер, најверојатно на почетокот на следната година.

Да преминеме на архитектурата. Huawei продолжи да развива сопствена технологија Smart Matrix, која имплементира пристап со целосна мрежа за поврзување на компоненти. Но, ако во V5 ова беше само за пристап од контролери до дискови, сега сите контролери имаат пристап до сите порти и на Back-End и на Front-End.
Huawei Dorado V6: топлина во Сечуан

Благодарение на новата микросервис архитектура, ова овозможува и балансирање на оптоварувањето помеѓу сите контролери, дури и ако има само еден лун. ОС за оваа линија на низи беше развиен од основата, а не едноставно оптимизиран за употреба на флеш-дискови. Поради фактот што сите наши контролери имаат пристап до истите порти, во случај на дефект или рестартирање на контролорот, домаќинот не губи ниту една патека до системот за складирање, а префрлувањето на патеката се врши на ниво на системот за складирање. Сепак, користењето на UltraPath на домаќинот не е строго неопходно. Друга „заштеда“ при инсталирање на системот е помалиот број на потребни врски. И ако со „класичниот“ пристап за 4 контролери ќе ни требаат 8 врски од 2 фабрики, тогаш во случајот на Huawei дури 2 ќе бидат доволни (сега не зборувам за доволноста на пропусната моќ на една врска).
Huawei Dorado V6: топлина во Сечуан

Како и во претходната верзија, се користи глобален кеш со пресликување. Ова ви овозможува да изгубите до два контролери истовремено или три контролери последователно без да влијае на достапноста. Но, вреди да се напомене дека не видовме целосно балансирање на оптоварувањето помеѓу преостанатите 3 контролери во случај на еден дефект на демо штандот. Товарот на неуспешниот контролер целосно го презеде еден од останатите. Можно е за ова да е потребно системот да работи подолго во оваа конфигурација. Во секој случај, ова ќе го проверам подетално користејќи ги моите тестови.
Huawei ги позиционира новите системи како End-to-End NVMe системи, но денес NVMeOF сè уште не е поддржан на предниот дел, само FC, iSCSI или NFS. На крајот на оваа или на почетокот на следната, како и другите функции, ни е ветена поддршка од RoCE.
Huawei Dorado V6: топлина во Сечуан

Полиците се исто така поврзани со контролорите со помош на RoCE, а има и еден недостаток поврзан со ова - отсуството на поврзување на полиците со „повратна врска“, како што беше случајот со SAS. Според мое мислење, ова е сепак прилично голем недостаток ако планирате прилично голем систем. Факт е дека сите полици се поврзани во серија, а неуспехот на една од полиците резултира со целосна непристапност на сите други што ја следат. Во овој случај, за да обезбедиме толеранција на дефекти, ќе треба да ги поврземе сите полици со контролорите, што подразбира зголемување на потребниот број на задни порти во системот.

И уште една работа што вреди да се спомене е ажурирање без пречки (NDU). Како што реков погоре, Huawei има имплементирано контејнерски пристап за управување со ОС за новата линија Dorado, ова ви овозможува да ги ажурирате и рестартирате услугите без потреба целосно да го рестартирате контролерот. Вреди да се спомене веднаш дека некои ажурирања ќе содржат ажурирања на кернелот, и во овој случај, понекогаш сè уште ќе биде потребно класично рестартирање на контролери за време на ажурирањето, но не секогаш. Ова ќе го намали влијанието на оваа операција врз продуктивниот систем.

Во нашиот арсенал, огромното мнозинство на низи се од NetApp. Затоа, мислам дека ќе биде сосема логично ако направам мала споредба со системи со кои морам доста да работам. Ова не е обид да се утврди кој е подобар, а кој полош или чија архитектура е поповолна. Ќе се обидам трезвено и без фанатизам да споредам два различни пристапи за решавање на истиот проблем од различни продавачи. Да, се разбира, во овој случај ќе ги разгледаме системите на Huawei во „теоретски“ и исто така одделно ќе ги забележам оние точки што се планира да се имплементираат во идните верзии на фирмверот. Кои предности ги гледам во моментов:

  1. Број на поддржани NVMe дискови. NetApp моментално има 288 од нив, додека Huawei има 1600-6400, во зависност од моделот. Во исто време, употребливиот капацитет на Huawei Max е 32PBe, исто како и NetApp системите (поточно, тие имаат 31.64PBe). И ова и покрај фактот што се поддржани дискови со ист волумен (до 15 Tb). Huawei го објаснува овој факт на следниов начин: немале можност да состават поголем штанд. Теоретски, тие немаат ограничување на волуменот, но едноставно сè уште не можеле да го тестираат овој факт. Но, овде вреди да се напомене дека можностите на флеш-уредите денес се многу високи, а во случајот со системите NVMe се соочуваме со фактот дека 24 дискови се доволни за да се користи врвен систем со 2 контролери. Според тоа, натамошното зголемување на бројот на дискови во системот не само што нема да обезбеди зголемување на перформансите, туку и лошо ќе влијае на односот IOPS/Tb. Се разбира, вреди да се види колку погони можат да поднесат системите со 4 контролери 8000 и 16000, бидејќи ... Способностите и потенцијалот на Kunpeng 920 сè уште не се целосно јасни.
  2. Присуството на Лун како сопственик на NetApp системите. Оние. Само еден контролер може да врши операции со Месечината, додека вториот само поминува IO низ себе. Системите на Huawei, напротив, немаат сопственици и операциите со податочни блокови (компресија, дедупликација) можат да се вршат од кој било од контролорите, како и да се запишуваат на дискови.
  3. Ниту една порта не паѓа кога некој од контролорите не успее. За некои, овој момент изгледа исклучително критичен. Заклучокот е дека префрлувањето внатре во системот за складирање треба да се случи побрзо отколку на страната на домаќинот. И ако во случајот со истиот NetApp, во пракса најдовме замрзнување од околу 5 секунди при извлекување на контролорот и префрлување патеки, тогаш со префрлување на Huawei останува да вежбаме.
  4. Нема потреба да го рестартирате контролорот при ажурирање. Ова особено почна да ме загрижува со прилично честото објавување на нови верзии и фирмверски филијали за NetApps. Да, некои ажурирања за Huawei сепак ќе бараат рестартирање, но не сите.
  5. 4 Huawei контролери по цена од два NetApp контролери. Како што реков погоре, благодарение на ценовната политика на Huawei, може да се натпреварува со средната класа со своите модели од високата класа.
  6. Присуството на дополнителни чипови во контролерите на полиците и картичките за пристаништа, кои се потенцијално наменети за подобрување на ефикасноста на системот.

Недостатоци и грижи воопшто:

  1. Директно поврзување на полиците со контролери или потреба од голем број на задни порти за поврзување на сите полици со контролери.
  2. Архитектурата на АРМ и присуството на голем број чипови - колку ефикасно ќе работи, и дали перформансите ќе бидат доволни?

Повеќето грижи и стравови може да се отстранат со лично тестирање на новата линија. Се надевам дека наскоро по објавувањето тие ќе се појават во Москва и ќе ги има доволно за брзо да добиете еден за вашите сопствени тестови. Досега, можеме да кажеме дека генерално пристапот на компанијата изгледа интересен, а новата линија изгледа многу добро во споредба со нејзините конкуренти. Конечната имплементација покренува многу прашања, бидејќи Многу работи ќе видиме дури на крајот на годината, а можеби дури во 2020 година.

Извор: www.habr.com

Додадете коментар