Huawei Dorado V6: Сычуаньская спякота

Huawei Dorado V6: Сычуаньская спякота
Лета ў Маскве сёлета выдалася, скажам сапраўды, не вельмі. Пачалося яно зарана і хутка, не ўсе паспелі на яго зрэагаваць, ды і скончылася яно ўжо ў канцы чэрвеня. Таму, калі кампанія Huawei прапанавала мне адправіцца ў Кітай, у горад Чэнду, дзе знаходзіцца іх RnD цэнтр, паглядзеўшы на прагноз надвор'я ў 34 градусаў у цені - я неадкладна пагадзіўся. Усё-такі ўзрост у мяне ўжо не той і косці свае крыху пагрэць ужо патрабуецца. Але хочацца адзначыць, што пагрэць удалося не толькі косці, але і вантробы, бо правінцыя Сычуань, у якой, уласна, і знаходзіцца Чэнду славіцца сваёй любоўю да вострай ежы. Але ўсё ж такі гэта блог не аб падарожжах, таму вернемся да галоўнай мэты нашай паездкі – новая лінейка сістэм захоўвання дадзеных – Huawei Dorado V6. Гэты артыкул будзе крыху памахваць вам з мінулага, т.я. напісана яна да афіцыйнага анонсу, але апублікавана толькі пасля рэлізу. І так, сёння мы прыгледзімся да ўсяго цікавага і смачнага, што прыгатавала нам кампанія Huawei.

Huawei Dorado V6: Сычуаньская спякота
У новай лінейцы будзе 5 мадэляў. Усе мадэлі, акрамя 3000V6 могуць быць у двух варыянтах – SAS і NVMe. Ад выбару залежыць інтэрфейс дыскаў, якія вы зможаце выкарыстоўваць у дадзенай сістэме, Back-End парты і колькасць дыскавых назапашвальнікаў, якія вы зможаце ўсталяваць у сістэму. Для NVMe выкарыстоўваюцца Palm-sized SSD, якія маюць меншую таўшчыню, у параўнанні з класічнымі 2.5» SAS SSD і іх можна ўсталяваць да 36 штук. Новая лінейка з'яўляецца All Flash і канфігурацый з дыскамі няма.

Huawei Dorado V6: Сычуаньская спякота
Palm NVMe SSD

На мой погляд найболей цікавымі мадэлямі выглядаюць Dorado 8000 і 18000. Кампанія Huawei пазіцыянуе іх як High-end сістэмы, пры гэтым, дзякуючы коштавай палітыцы Huawei, яна супрацьпастаўляе гэтыя мадэлі Mid-range сегменту канкурэнтаў. Менавіта на гэтых мадэлях я сёння і сканцэнтруюся ў сваім аглядзе. Адразу заўважу, што з-за сваіх канструктыўных асаблівасцяў, малодшыя двухкантролерныя сістэмы валодаюць некалькі іншай архітэктурай, выдатнай ад Dorado 8000 і 18000, так што не ўсё, пра што я сёння раскажу, дастасоўна да малодшых мадэляў.

Адной з асноўных асаблівай новых сістэм, стала выкарыстанне некалькіх чыпаў, уласнай распрацоўкі, кожны з якіх, дазваляе разнесці лагічную нагрузку з цэнтральнага працэсара кантролера і дадаць функцыянальнасці розным кампанентам.
Huawei Dorado V6: Сычуаньская спякота

Сэрцам новых сістэм сталі працэсары Kunpeng 920, распрацаваныя на тэхналогіях ARM і якія вырабляюцца кампаніяй Huawei самастойна. У залежнасці ад мадэлі, вар'іруецца колькасць ядраў, іх частата і колькасць устаноўленых працэсараў у кожным кантролеры:
Huawei Dorado V6 8000 - 2CPU, 64 core
Huawei Dorado V6 18000 - 4CPU, 48 core
Huawei Dorado V6: Сычуаньская спякота

Кампанія Huawei распрацавала гэты працэсар на архітэктуры ARM, і наколькі мне вядома, першапачаткова планавала ставіць яго толькі ў старэйшыя мадэлі Dorado 8000 і 18000, як гэта ўжо было з некаторымі мадэлямі V5, але санкцыі ўнеслі свае карэкціроўкі ў гэтую задумку. Вядома, кампанія ARM гэтак жа казала аб адмове супрацоўніцтва з Huawei падчас увядзення санкцый, але тут сітуацыя іншая, чым з Intel. Кампанія Huawei самастойна робіць гэтыя чыпы, і ніякія санкцыі не змогуць спыніць гэты працэс. Разрыў адносін з ARM пагражае толькі стратай доступу да новых распрацовак. Што ж тычыцца прадукцыйнасці - тут можна будзе меркаваць толькі пасля правядзення самастойных тэстаў. Хоць я і бачыў, як з сістэмы Dorado 18000 без праблем знялі 1M IOPS, пакуль уласнымі рукамі ў сябе ў стойцы я гэта не паўтару не паверу. Але магутнасцяў у кантролерах тамака сапраўды не мала. Старэйшыя мадэлі абсталяваны 4 кантролерамі, у кожным з якіх устаноўлена па 4 працэсары, што дае ў суме 768 ядраў.
Huawei Dorado V6: Сычуаньская спякота

Але пра ядра я раскажу яшчэ пазней, калі мы разгледзім архітэктуру новых сістэм, а пакуль вернемся да яшчэ аднаго чыпа, усталяванага ў сістэме. Вельмі цікавым рашэннем глядзіцца чып Узыходжанне 310 (наколькі я разумею, малодшы брат Ascend 910, які быў нядаўна прадстаўлены публіцы). Яго задача - аналіз паступаючых на сістэму блокаў дадзеных, для павышэння Read hit ratio. Пакуль складана сказаць як ён пакажа сябе ў працы, т.я. на сённяшні дзень ён працуе толькі па зададзеным шаблоне і не мае магчымасці вучыцца ў інтэлектуальным рэжыме. З'яўленне інтэлектуальнага рэжыму абяцаюць у будучых прашыўках, хутчэй за ўсё на пачатку наступнага года.

Пяройдзем да архітэктуры. Кампанія Huawei працягнула развіццё ўласнай тэхналогіі Smart Matrix, якая рэалізуе full mesh падыход да злучэння кампанентаў. Але калі ў V5 гэта было толькі для доступу з кантролераў да дыскаў, то зараз усе кантролеры маюць доступ да ўсіх партоў як на Back-End, так і на Front-End.
Huawei Dorado V6: Сычуаньская спякота

Дзякуючы новай мікрасэрвіснай архітэктуры, гэта дазваляе гэтак жа балансаваць нагрузку паміж усімі кантролерамі, нават пры наяўнасці толькі аднаго lun'а. АС для дадзенай лінейкі масіваў была распрацавана з нуля, а не проста аптымізавана для выкарыстання Flash-назапашвальнікаў. Дзякуючы таму, што ў нас усе кантролеры маюць доступ да адных і тых жа партоў, у выпадку выхаду са строю кантролера або яго перазагрузкі, хост не губляе ніводнага шляху да СХД, а пераключэнне шляхоў ажыццяўляецца на ўзроўні сістэмы захоўвання дадзеных. Пры гэтым выкарыстанне UltraPath на хасце не з'яўляецца строгай неабходнасцю. Яшчэ адной "эканоміяй" пры мантажы сістэмы з'яўляецца меншая колькасць неабходных лінкаў. І калі пры «класічным» падыходзе для 4 кантролераў нам неабходна будзе 8 лінкаў ад 2 фабрык, то ў выпадку з Huawei будзе дастаткова нават 2 (я не кажу зараз аб дастатковасці прапускной здольнасці аднаго лінка).
Huawei Dorado V6: Сычуаньская спякота

Як і ў папярэдняй версіі - выкарыстоўваецца глабальны кэш з люстраваннем. Гэта дазваляе без уплыву на даступнасць страціць да двух кантролераў адначасова ці трох кантролераў паслядоўна. Але варта адзначыць, што поўнага балансавання нагрузкі, паміж пакінутымі 3 кантролерамі ў выпадку выхаду са строю аднаго, мы на дэма стэндзе не ўбачылі. Нагрузку які выйшаў са строю кантролера, цалкам забраў на сябе адзін з пакінутых. Магчыма, што для гэтага неабходна даць сістэме папрацаваць што даўжэй у такой канфігурацыі. У любым выпадку, на ўласных тэстах я праверу гэта ўжо больш дэталёва.
Кампанія Huawei пазіцыянуе новыя сістэмы, як End-to-End NVMe сістэмы, але на сённяшні дзень на франтэндзе NVMeOF пакуль не падтрымліваецца, толькі FC, iSCSI ці NFS. У канцы гэтага ці пачатку наступнага, як і іншыя фішкі, нам абяцаюць і падтрымку RoCE.
Huawei Dorado V6: Сычуаньская спякота

Паліцы да кантролераў падключаюцца гэтак жа па сродках RoCE і з гэтым звязаны адзін недахоп – адсутнасць "пятлёвага" падлучэння паліц, як гэта было пры SAS. На мой погляд, пакуль гэта даволі вялікі недахоп, калі ў вас плануецца даволі вялікая сістэма. Справа ў тым, што ўсе паліцы падлучаюцца паслядоўна, і выйсце са строю адной з паліц вабіць і поўную недаступнасць усіх астатніх, наступных за ёй. У дадзеным выпадку, для забеспячэння адмоваўстойлівасці нам давядзецца падключаць усе паліцы да кантролераў, што цягне за сабой павелічэнне неабходнай колькасці бэкэнд партоў у сістэме.

І яшчэ адна рэч, пра якую варта сказаць – non-disruptive update (NDU). Як я ўжо казаў вышэй, кампанія Huawei рэалізавала кантэйнерны падыход у працы АС для новай лінейкі Dorado, гэта дазваляе вырабляць абнаўленне і перазапуск сэрвісаў, без неабходнасці поўнай перазагрузкі кантролера. Тут варта адразу абмовіцца, што некаторыя абнаўленні, будуць утрымоўваць абнаўленні ядра і ў гэтым выпадку класічны рэбут кантролераў часам усёткі будзе патрабавацца пры абнаўленні, але не заўсёды. Гэта дасць магчымасць зменшыць узровень уплыву гэтай аперацыі на прадуктыўную сістэму.

У нашым арсенале, пераважная большасць масіваў ад кампаніі NetApp. Таму, я думаю будзе цалкам лагічна, калі я правяду невялікае параўнанне з сістэмамі, з якімі мне даводзіцца працаваць даволі шмат. Гэта не спроба вызначыць - хто лепш, а хто горш ці чыя архітэктура больш выйгрышная. Паспрабую цвяроза і без фанатызму параўнаць два розныя падыходы да рашэння адной і той жа задачы ад розных вендараў. Так, вядома, сістэмы Huawei у дадзеным выпадку мы будзем разглядаць у "тэорыі" і тыя моманты, якія толькі плануецца рэалізавацца ў будучых версіях прашывак я буду гэтак жа асобна адзначаць. Якія плюсы мне бачацца на бягучы момант:

  1. Колькасць падтрымоўваных NVMe назапашвальнікаў. У NetApp на сённяшні дзень іх колькасць складае 288, у Huawei у залежнасці ад мадэлі – 1600-6400. Пры гэтым, Max usable capacity у Huawei роўны 32PBe, як і ў сістэм NetApp (калі быць дакладней, у іх 31.64PBe). І гэта пры тым, што падтрымліваюцца назапашвальнікі таго ж аб'ёму (да 15Tb). Кампанія Huawei гэты факт тлумачыць наступным чынам – у іх не было магчымасці сабраць стэнд большага аб'ёму. У тэорыі ў іх няма абмежавання па аб'ёме, але пратэставаць гэты факт яны пакуль проста не змаглі. Але тут варта адзначыць, што магчымасці flash-назапашвальнікаў на сённяшні дзень вельмі высокія, і ў выпадку з NVMe сістэмамі мы сутыкаемся з тым, што 24 назапашвальнікаў дастаткова для таго, каб утылізаваць топавую 2-х кантролерную сістэму. Адпаведна далейшае павелічэнне колькасці дыскаў у сістэме не толькі не дасць прыросту прадукцыйнасці, але і дрэнна адаб'ецца на суадносінах IOPS/Tb. Вядома варта паглядзець, якую колькасць назапашвальнікаў змогуць выцягнуць 4-х кантролерныя сістэме 8000 і 16000, т.к. пакуль усёткі не да канца ясныя магчымасці і патэнцыял Kunpeng 920.
  2. Наяўнасць у Lun'а ўладальніка ў сістэм NetApp. Г.зн. аперацыі з месяцам можа выконваць толькі адзін кантролер, другі ж толькі прапускае праз сябе IO. У сістэм Huawei наадварот няма ніякіх уладальнікаў і аперацыі з блокамі дадзеных (кампрэсія, дэдуплікацыя) могуць выконвацца любым з кантролераў, таксама як і запісвацца на дыскі.
  3. Адсутнасць падзення партоў пры адмове аднаго з кантролераў. Для кагосьці гэты момант выглядае вельмі крытычным. Сутнасць у тым, што пераключэнне ўнутры СГД павінна адбывацца хутчэй, чым з боку хаста. І калі ў выпадку з тым жа NetApp намі на практыцы выяўлены фрыз парадку 5 сек пры вышморгванні кантролера і пераключэнні шляхоў, то з пераключэннем на Huawei яшчэ трэба будзе папрактыкавацца.
  4. Адсутнасць неабходнасці перазапуску кантролера пры абнаўленні. Асабліва мяне гэта стала хваляваць пры даволі частым выхадзе новых версій і галінак прашыўкі для NetApp'аў. Так, некаторыя абнаўленні для Huawei будуць усё ж патрабаваць перазапуску, але не ўсё.
  5. 4 кантролера Huawei па кошце двух кантролераў NetApp. Як я ўжо казаў вышэй, дзякуючы коштавай палітыцы Huawei, яна можа сваімі Hight-end мадэлямі канкураваць з Mid-range.
  6. Наяўнасць дадатковых чыпаў у кантролерах паліц і порт-картах, якія патэнцыйна прызначаюцца для павышэння эфектыўнасці сістэмы.

Мінусы і асцярогі ў цэлым:

  1. Прамое падлучэнне паліц да кантролераў або неабходнасць вялікай колькасці back-end партоў для падлучэння ўсіх паліц да кантролераў.
  2. ARM-архітэктура і наяўнасць вялікай колькасці чыпаў – на колькі эфектыўна гэта будзе працаваць, і ці хопіць прадукцыйнасці.

Большасць асцярог і страхаў зможа развеяць уласнаручнае тэсціраванне новай лінейкі. Спадзяюся, у хуткім часе пасля рэлізу яны ўжо з'явяцца ў Маскве і іх будзе дастатковая колькасць, каб аператыўна атрымаць адну для ўласных выпрабаванняў. Пакуль можна сказаць, што ў цэлым падыход кампаніі выглядае цікава, а новая лінейка выглядае вельмі добра на фоне канкурэнтаў. вельмі шмат пытанняў выклікае канчатковая рэалізацыя, т.я. многія рэчы мы ўбачым толькі ў канцы года, а можа быць і толькі ў 2020 годзе.

Крыніца: habr.com

Дадаць каментар