Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Калі ласка, не спяшаецеся з высновамі з-за загалоўка! У нас ёсць важкія аргументы ў яго пацверджанне, і мы спакавалі іх, наколькі маглі кампактна. Прапануем вашай увазе пост аб канцэпцыі і прынцыпах працы нашай новай сістэмы захоўвання дадзеных, рэліз якой адбыўся ў студзені 2020 гады.

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Па нашым перакананні, галоўная канкурэнтная перавага сямейству СХД Dorado V6 забяспечваюць менавіта згаданыя ў загалоўку прадукцыйнасць і надзейнасць. Так-так, вось так проста, ну а за кошт якіх хітрых і не вельмі хітрых рашэнняў гэтага "проста" нам удалося дабіцца, мы сёння і пагаворым.

Для таго каб лепш расчыніць патэнцыял сістэм новага пакалення, мы распавядзем аб старэйшых прадстаўніках мадэльнага шэрагу (мадэлі 8000, 18000). Калі не пазначана іншае, маюцца на ўвазе менавіта яны.

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Пары слоў пра рынак

Каб лепш зразумець месца рашэнняў Huawei на рынку, звернемся да праверанай меркі – «магічным квадрантам» Gartner. Два гады таму ў сектары дыскавых масіваў агульнага прызначэння наша кампанія ўпэўнена ўваходзіла ў групу лідэраў, саступаючы толькі NetApp і Hewlett Packard Enterprise. Становішча Huawei на рынку цвёрдацельных СГД у 2018 годзе характарызавалася статусам "прэтэндэнт", аднак для дасягнення лідэрскіх пазіцый чагосьці не хапала.

У 2019 годзе Gartner у сваім даследаванні аб'яднаў абодва вышэйзгаданыя сектары ў адзін – «Асноўнае сховішча». У выніку Huawei ізноў апынуўся ў квадранце лідэраў, побач з такімі пастаўшчыкамі, як IBM, Hitachi Vantara і Infinidat.

Для паўнаты карціны адзначым, што 80% дадзеных для аналізу Gartner збірае на амерыканскім рынку, а гэта прыводзіць да адчувальнага перакосу на карысць тых кампаній, якія добра прадстаўлены менавіта ў ЗША. Тым часам пастаўшчыкі, якія арыентаваны на еўрапейскія і азіяцкія рынкі, аказваюцца ў заведама менш выйгрышным становішчы. І нават нягледзячы на ​​гэта, летась прадукцыя Huawei заняла годнае месца ў верхнім правым квадранце і, паводле вердыкту Gartner, "можа быць рэкамендавана да выкарыстання".

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Што новага ў Dorado V6

Лінейка прадуктаў Dorado V6, у прыватнасці, прадстаўлена сістэмамі пачатковага ўзроўню серыі 3000. Зыходна забяспечаныя двума кантролерамі, яны могуць быць гарызантальна пашыраны да 16 кантролераў, 1200 дыскаў і 192 Гбайт кэша. Таксама сістэма будзе абсталёўвацца вонкавымі партамі Fibre Channel (8/16/32 Гбіт/з) і Ethernet (1/10/25/40/100 Гбіт/з).

Адзначым, зараз згортваецца выкарыстанне пратаколаў, якія не маюць камерцыйнай паспяховасці, таму на старце мы вырашылі адмовіцца ад падтрымкі Fibre Channel over Ethernet (FCoE) і Infiniband (IB). Яны будуць дададзены ў пазнейшых версіях прашыўкі. Падтрымка NVMe over Fabric (NVMe-oF) даступная са скрынкі над Fibre Channel. У наступнай прашыўцы, выпуск якой запланаваны на чэрвень, запланавана падтрымка рэжыму NVMe over Ethernet. На наш погляд, вышэйпералічаны набор з лішкам пакрые запатрабаванні большасці кліентаў Huawei.

Файлавы доступ у бягучай версіі прашыўкі адсутнічае і з'явіцца ў адным з наступных апдэйтаў бліжэй да канца года. Рэалізацыя мяркуецца на натыўным узроўні, самімі кантролерамі з партамі Ethernet, без ужывання дадатковага абсталявання.

Асноўнае адрозненне мадэлі Dorado V6 серыі 3000 ад больш старэйшых у тым, што на бэкендзе яна падтрымлівае адзін пратакол – SAS 3.0. Адпаведна, і назапашвальнікі тамака могуць выкарыстоўвацца толькі з названым інтэрфейсам. З нашага пункта гледжання, якая забяспечваецца пры гэтым прадукцыйнасці суцэль досыць для прылады такога тыпу.

Сістэмы Dorado серый V6 5000 і 6000 адносяцца да рашэнняў сярэдняга класа. Яны таксама выкананы ў формаў-фактары 2U і абсталяваны двума кантролерамі. Адзін ад аднаго яны адрозніваюцца прадукцыйнасцю, колькасцю працэсараў, максімальным лікам дыскаў і аб'ёмам кэша. Разам з тым у архітэктурным і інжынерным плане Dorado V6 5000 і 6000 ідэнтычныя і выглядаюць аднолькава.

Да класа hi-end ставяцца сістэмы Dorado V6 серый 8000 і 18000. Выкананыя ў тыпаразмеры 4U, яны па змаўчанні маюць паасобную архітэктуру, у якой кантролеры і назапашвальнікі разнесены паасобку. У мінімальнай камплектацыі яны таксама могуць камплектавацца ўсяго двума кантролерамі, хаця заказчыкі, як правіла, просяць усталяваць чатыры і больш.

Dorado V6 8000 гарызантальна маштабуецца да 16 кантролераў, а Dorado V6 18000 – да 32. У гэтых сістэмах усталяваныя розныя працэсары з рознай колькасцю ядраў і аб'ёмам кэша. Ідэнтычнасць інжынерных рашэнняў пры ўсім пры тым захоўваецца, як і ў мадэлях класа mid-end.

Паліцы 2U з назапашвальнікамі падлучаюцца пасродкам RDMA з прапускной здольнасцю 100 Гбіт/з. Бэкенд Dorado V6 старэйшых серый таксама падтрымлівае SAS 3.0, але хутчэй на выпадак, калі SSD-назапашвальнікі з такім інтэрфейсам моцна ўпадуць у кошце. Тады ўзнікне эканамічная мэтазгоднасць іх выкарыстання нават з улікам ніжэйшай прадукцыйнасці. На бягучы ж момант розніца ў кошце паміж SSD з інтэрфейсамі SAS і NVMe гэтак малая, што рэкамендаваць падобнае рашэнне мы не гатовыя.

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Унутры кантролера

Кантралёры Dorado V6 выкананы на нашай уласнай элементнай базе. Ніякіх працэсараў ад Intel, ніякіх ASIC ад Broadcom. Такім чынам, усё да адзінага кампаненты матчынай платы, роўна як і яна сама, цалкам выведзены з-пад уплыву рызык, звязаных з санкцыйным ціскам з боку амерыканскіх кампаній. Тыя, хто на свае вочы бачыў любое наша абсталяванне, напэўна заўважалі шылды з чырвонай паласой пад лагатыпам. Яна азначае, што ў вырабе адсутнічаюць амерыканскія кампаненты. Такі афіцыйны курс Huawei – пераход на кампаненты ўласнай вытворчасці ці, ва ўсякім разе, якія выпускаюцца ў краінах, не наступных у рэчышчы палітыкі ЗША.

Вось што можна ўбачыць на самай кантролернай плаце.

  • Універсальны сеткавы інтэрфейс (чып Hisilicon 1822), які адказвае за падлучэнне да Fibre Channel ці Ethernet.
  • Які забяспечвае выдаленую даступнасць сістэмы BMC-чып, а менавіта Hisilicon 1710, для поўнафункцыянальнага дыстанцыйнага кіравання і маніторынгу сістэмы. Падобныя прымяняюцца таксама ў нашых серверах і ў іншых рашэннях.
  • Цэнтральны працэсар, у якасці якога выступае пабудаваны на архітэктуры ARM чып Kunpeng 920 вытворчасці Huawei. Менавіта ён паказаны на схеме вышэй, хоць у іншых кантролерах могуць быць усталяваныя выдатныя ад яго мадэлі з іншым лікам ядраў, іншай тактавай частатой і т. д. Ад мадэлі да мадэлі мяняецца і колькасць працэсараў у адным кантролеры. Напрыклад, у старэйшых серыях Dorado V6 на адной плаце іх чатыры.
  • Кантролер SSD (чып Hisilicon 1812e), які падтрымлівае падлучэнне як SAS-, так і NVMe-назапашвальнікаў. Дадамо, Huawei самастойна выпускае SSD, аднак не вырабляе самі вочкі NAND, аддаючы перавагу закупляць іх у чатырох найбуйных сусветных вытворцаў у выглядзе неразрэзаных крамянёвых пласцін. Распілоўванне, тэставанне і пакаванне ў чыпы Huawei вырабляе самастойна, пасля чаго выпускае іх пад уласнай гандлёвай маркай.
  • Чып штучнага інтэлекту – Ascend 310. Па змаўчанні на кантролеры ён адсутнічае і мантуецца праз асобную карту, якая займае адзін са слотаў, адведзеных пад сеткавыя адаптары. Чып прымяняецца для забеспячэння інтэлектуальных паводзін кэша, кіравання прадукцыйнасцю або працэсамі дэдуплікацыі і кампрэсіі. Усе гэтыя задачы могуць быць вырашаны і сіламі цэнтральнага працэсара, але чып ІІ дазваляе рабіць гэта нашмат больш эфектыўна.

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Асобна аб працэсарах Kunpeng

Працэсар Kunpeng уяўляе сабой сістэму на чыпе (SoC), дзе апроч вылічальнага блока прысутнічаюць апаратныя модулі, якія паскараюць розныя працэсы, напрыклад разлік кантрольных сум або выкананне «сціральнага кода» (erasure coding). У ім жа рэалізавана апаратная падтрымка SAS, Ethernet, DDR4 (ад шасці да васьмі каналаў) і інш. Усё гэта дазваляе Huawei ствараць кантролеры СХД, якія не саступаюць па прадукцыйнасці класічным рашэнням Intel.

Акрамя таго, уласныя рашэнні на базе архітэктуры ARM даюць Huawei магчымасць ствараць паўнавартасныя серверныя рашэнні і прапаноўваць іх сваім замоўцам у якасці альтэрнатывы x86.

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Новая архітэктура Dorado V6…

Унутраная архітэктура СХД Dorado V6 старэйшай серыі прадстаўлена чатырма асноўнымі субдаменамі (фабрыкамі).

Першая фабрыка з'яўляецца агульным фронтэндам (сеткавымі інтэрфейсамі, якія адказваюць за сувязь з SAN-фабрыкай ці хастамі).

Другая – набор кантролераў, кожны з якіх можа па пратаколе RDMA "дастукацца" як да любой сеткавай карты фронтэнда, так і да суседняга "рухавічка" (engine), які ўяўляе сабой скрынку з чатырма кантролерамі, а таксама агульнымі для іх блокамі харчавання і астуджэнні. Цяпер мадэлі Dorado V6 класа hi-end могуць камплектавацца двума такімі рухавікамі (адпаведна, васьмю кантролерамі).

Трэцяя фабрыка адказвае за бэкенд і складаецца з сеткавых карт RDMA 100G.

Нарэшце, чацвёртая фабрыка "ў жалезе" прадстаўлена падключаюцца інтэлектуальнымі паліцамі з назапашвальнікамі.

Падобная сіметрычная структура расчыняе ўвесь патэнцыял тэхналогіі NVMe і гарантуе высокую прадукцыйнасць і надзейнасць. Працэс уводу-высновы максімальна распаралельваецца па працэсарах і ядрам, забяспечваючы адначасовыя чытанне і запіс у мноства струменяў.

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

…і што яна нам дала

Максімальная прадукцыйнасць рашэнняў Dorado V6 прыкладна ўтрая пераўзыходзіць паказчыкі сістэм папярэдняга пакалення (таго ж класа) і можа дасягаць 20 IOPS.

Гэта злучана з тым, што ў мінулым пакаленні прылад падтрымка NVMe распаўсюджвалася толькі на прыпражныя паліцы з назапашвальнікамі. Цяпер жа яна прысутнічае на ўсіх этапах, ад хаста да SSD. Сетка бэкенда таксама зведала змены: SAS/PCIe саступілі месца RoCEv2 з прапускной здольнасцю 100 Гбіт/з.

Памяняўся і сам формаў-фактар ​​SSD. Калі раней на паліцу 2U прыходзілася 25 назапашвальнікаў, то зараз яна даведзена да 36 дыскаў фізічнага фармату palm-sized. Акрамя таго, паліцы "паразумнелі". У кожнай з іх зараз маецца адмоваўстойлівая сістэма з двух кантролераў на базе чыпаў ARM, аналагічных тым, якія ўсталяваныя ў цэнтральных кантролерах.

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Пакуль яны займаюцца толькі рэарганізацыяй дадзеных, але з выхадам новых прашывак да яе дададуцца кампрэсія і erasure coding, што дазволіць зменшыць нагрузку на асноўныя кантролеры з 15 да 5%. Перанос часткі задач на паліцу заадно вызваляе і прапускную здольнасць унутранай сеткі. І ўсё гэта істотна павялічвае патэнцыял маштабаванасці сістэмы.

Кампрэсія і дэдуплікацыя ў СГД папярэдняга пакалення выконвалася з блокамі фіксаванай даўжыні. Цяпер жа дадаўся рэжым працы з блокамі зменнай даўжыні, які пакуль трэба ўключаць прымусова. Наступныя прашыўкі, магчыма, зменяць гэтую акалічнасць.

Таксама коратка аб талерантнасці да адмоваў. Dorado V3 захоўвала працаздольнасць, калі адмаўляў адзін кантролер з двух. Dorado V6 забяспечыць даступнасць дадзеных нават у тым выпадку, калі з ладу паслядоўна выйдуць сем кантролераў з васьмі ці адначасова чатыры са складу аднаго рухавічка .

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Надзейнасць з пункту гледжання эканомікі

Нядаўна сярод заказчыкаў Huawei было праведзена апытанне аб тым, які просты асобных элементаў IT-інфраструктуры кампанія лічыць прымальным. У масе сваёй рэспандэнты памяркоўна паставіліся да гіпатэтычнай сітуацыі, у якой прыкладанне не адказвае на працягу некалькіх сотняў секунд. Для аперацыйнай сістэмы або хост-адаптара шыны крытычным часам прастою апынуліся дзясяткі секунд (па сутнасці, час перазагрузкі). Яшчэ больш высокія патрабаванні заказчыкі прад'яўляюць да сеткі: яе прапускная здольнасць не павінна знікаць больш за на 10–20 секунд. Як няцяжка здагадацца, найболей крытычна важнымі апытаныя злічылі адмовы сістэм захоўвання. З пункту гледжання прадстаўнікоў бізнесу, просты СГД не павінен перавышаць… некалькіх секунд за год!

Іншымі словамі, калі кліенцкі дадатак банка не адказвае 100 секунд, катастрафічных наступстваў гэта, хутчэй за ўсё, не выкліча. А вось калі столькі ж не працуе СГД, верагодныя спыненне бізнесу і значныя фінансавыя страты.

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

На дыяграме вышэй прыведзены кошт гадзіны працы для дзесяці найбуйнейшых банкаў (дадзеныя Forbes на 2017 год). Пагадзіцеся, калі ваша кампанія набліжаецца па памерах да кітайскіх банкаў, абгрунтаваць неабходнасць набыцця СГД за некалькі мільёнаў долараў будзе не так ужо складана. Правільна і зваротнае сцвярджэнне: калі бізнэс не нясе істотных страт пры простае, то і купляць СГД класа hi-end ён ці наўрад стане. У любым выпадку важна мець уяўленне пра тое, якога памеру дзірка пагражае ўтварыцца ў вас у кашальку, пакуль сісадмін разбіраецца з якая адмовілася працаваць сістэмай захоўвання дадзеных.

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Секунда на аварыйнае пераключэнне

У Solution A на ілюстрацыі вышэй можна пазнаць нашу сістэму папярэдняга пакалення Dorado V3. Чатыры яе кантролера працуюць парамі, а копіі кэша змяшчаюцца толькі ў двух кантролерах. Кантралёры ўнутры пары могуць пераразмяркоўваць нагрузку. У той жа час, як бачыце, тут няма "фабрык" фронтэнда і бэкенда, так што кожная з паліц з назапашвальнікамі падлучаецца да пэўнай кантролернай пары.

На схеме Solution У паказана прысутнае цяпер на рынку рашэнне ад іншага вендара (даведаліся?). Тут ужо ёсць і фронтэнд-, і бэкэнд-фабрыкі, а назапашвальнікі падключаюцца адразу да чатырох кантролераў. Праўда, у рабоце ўнутраных алгарытмаў сістэмы ёсць не відавочныя ў першым набліжэнні нюансы.

Справа прадстаўлена наша бягучая архітэктура СГД Dorado V6 з усім наборам унутраных элементаў. Разгледзім, як гэтыя сістэмы перажываюць тыповую сітуацыю - выхад аднаго кантролера з ладу.

У класічных сістэмах, да ліку якіх адносіцца і Dorado V3, перыяд, які патрабуецца на пераразмеркаванне нагрузкі пры адмове, дасягае чатырох секунд. На гэты час увод-вывад поўнасцю спыняецца. У рашэнні Solution У ад нашых калег, нягледзячы на ​​больш сучасную архітэктуру, час прастою пры адмове нават вышэй -шэсць секунд.

СГД Dorado V6 аднаўляе сваю працу ўсяго праз адну секунду пасля адмовы. Такі вынік дасягаецца дзякуючы аднастайнай унутранай RDMA-асяроддзі, якая дазваляе кантролеру звяртацца да "чужой" памяці. Другая важная акалічнасць - наяўнасць фронтэнд-фабрыкі, дзякуючы якой шлях для хаста не змяняецца. Порт застаецца ранейшым, а нагрузка проста адпраўляецца на спраўныя кантролеры драйверамі мультыпасінгу (multipassing).

Выйсце з ладу другога кантролера ў Dorado V6 адпрацоўваецца за адну секунду па той жа схеме. У Dorado V3 гэта займае каля шасці секунд, а ў рашэння іншага вендара дзевяць. Для шматлікіх СКБД падобныя інтэрвалы ўжо нельга лічыць прымальнымі, бо за гэты час сістэма пераводзіцца ў рэжым standby і перастае працаваць. Гэта перш-наперш тычыцца СКБД, якія складаюцца з мноства раздзелаў.

Выйсце са строю трэцяга кантролера Solution A перажыць не ў стане. Проста ў сілу таго, што знікае доступ да часткі дыскаў з дадзенымі. У сваю чаргу, Solution Ва ў такой сітуацыі аднаўляе працаздольнасць, на што патрабуецца, як і ў папярэднім выпадку, дзевяць секунд.

Што ў Dorado V6? Адна секунда.

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Што можна паспець за секунду

Амаль нічога, але нам гэтага і ня трэба. Яшчэ раз паўторым, што ў Dorado V6 класа hi-end фабрыка фронтэнда адвязана ад фабрыкі кантролераў. А значыць, няма і цвёрда выдзеленых партоў, якія належаць канкрэтнаму кантролеру. Перабудова пры адмове не мае на ўвазе пошуку альтэрнатыўных шляхоў або пераініцыялізацыі мультыпасінгу. Сістэма працягвае працаваць, як працавала.

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Устойлівасць да шматлікіх адмоваў

Старэйшыя мадэлі Dorado V6 без праблем перажываюць адначасовы выхад са строю двух любых (!) кантролераў са складу любых рухавікоў ». Гэта стала магчымым дзякуючы таму, што зараз рашэнне захоўвае тры копіі кэша. Таму нават пры падвойнай адмове заўсёды знойдзецца адна цэласная копія.

Сінхронная адмова ўсіх чатырох кантролераў у адным з «рухавічкоў» таксама не выкліча фатальных наступстваў, бо ўсе тры копіі кэша ў кожны момант часу размеркаваны паміж «рухавічкамі». За выкананнем такой логікі працы сочыць сама сістэма.

Нарэшце, зусім малаверагодным сцэнарам з'яўляецца паслядоўнае выйсце са строю сямі кантролераў з васьмі. Прычым мінімальны дапушчальны для падтрымання працаздольнасці інтэрвал паміж асобнымі адмовамі складае 15 хвілін. За гэты час СГД паспявае выканаць аперацыі, неабходныя для міграцыі кэша.

Апошні ацалелы кантролер будзе забяспечваць працу сховішчы дадзеных і падтрымліваць кэш на працягу пяці дзён (значэнне па змаўчанні, якое лёгка змяніць у наладах). Пасля гэтага кэш будзе адключаны, але праца СГД працягнецца.

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Якія не турбуюць апдэйты

Новая АС Dorado V6 дазваляе абнаўляць прашыўку СХД без перазагрузкі кантролераў.

Аперацыёнка, як і ў выпадку з ранейшымі рашэннямі, выканана на базе Linux, аднак шматлікія аперацыйныя працэсы перанесены з ядра ў карыстацкі рэжым. Большасць функцый, напрыклад якія адказваюць за дэдуплікацыю і кампрэсію, зараз з'яўляюцца звычайнымі, якія працуюць у фонавым рэжыме дэманамі. Дзякуючы гэтаму для абнаўлення асобных модуляў няма неабходнасці мяняць усю аперацыйную сістэму. Дапушчальны, для дадання падтрымкі новага пратаколу трэба будзе толькі выключыць які адпавядае праграмны модуль і запусціць новы.

Зразумела, што пытанні абнаўлення сістэмы цалкам усё роўна застаюцца, бо і ў ядры могуць быць элементы, якія маюць патрэбу ў апдэйце. Але такіх, паводле нашых назіранняў, менш за 6% ад агульнай колькасці. Гэта дазваляе перазагружаць кантролеры ў дзясяткі разоў радзей, чым раней.

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Катастрафоўстойлівыя рашэнні і рашэнні высокай даступнасці (HA/DR)

Dorado V6 са скрынкі гатовая да інтэграцыі ў георазмеркаваныя рашэнні, кластары гарадскога ўзроўня (metro) і патройныя дата-цэнтры.

Злева на ілюстрацыі вышэй ужо знаёмы шматлікім metro-кластар. Дзве СХД працуюць у рэжыме active / active на адлегласці да 100 км сябар ад сябра. Падобная інфраструктура з наяўнасцю аднаго або некалькіх кворумных сервераў можа падтрымлівацца рашэннямі розных кампаній, уключаючы нашу хмарную аперацыйную сістэму FusionSphere. Адмысловую важнасць у такіх праектах набываюць характарыстыкі канала паміж пляцоўкамі, усе астатнія задачы ў нашым выпадку бярэ на сябе функцыя HyperMetro, даступная, ізноў жа, са скрынкі . Магчымая інтэграцыя па Fibre Channel, а таксама па iSCSI у IP-сетках, калі ўзнікае такое запатрабаванне. Неабходнасці ў абавязковай наяўнасці выдзеленай "цёмнай" оптыкі больш няма, бо сістэма ў стане звязвацца праз наяўныя каналы.

Пры пабудове такіх сістэм адзіным апаратным патрабаваннем да СХД з'яўляецца вылучэнне партоў пад рэплікацыю. Досыць набыць ліцэнзію, запусціць кворумныя серверы – фізічныя ці віртуальныя – і забяспечыць IP-складнасць да кантролераў (10 Мбіт/з, 50 мс).

Гэтую архітэктуру лёгка перанесці на сістэму з трыма ЦАДамі (гл. правую частку ілюстрацыі). Напрыклад, калі два ЦАД працуюць у рэжыме metro-кластара, а трэцяя пляцоўка, размешчаная на адлегласці звыш 100 км, выкарыстоўвае асінхронную рэплікацыю.

Сістэма тэхналагічна падтрымлівае розныя бізнес-сцэнарыі, якія будуць рэалізаваны ў выпадку маштабнага эксцэсу.

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Выжывальнасць metro-кластара пры некалькіх адмовах

На вышэй і ніжэй таксама паказаны класічны metro-кластар, які складаецца з двух СХД і кворумнага сервера. Як бачыце, у шасці з дзевяці магчымых сцэнарыяў шматлікіх адмоў наша інфраструктура захавае працаздольнасць.

Напрыклад, у другім сцэнары, пры адмове кворумнага сервера і сінхранізацыі паміж пляцоўкамі, сістэма застаецца прадуктыўнай, бо другая пляцоўка спыняе працу. Падобныя паводзіны ўжо закладзена ва ўбудаваныя алгарытмы.

Нават пасля трох адмоў доступ да інфармацыі можа быць захаваны, калі інтэрвал паміж імі склаў хаця б 15 секунд.

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Звыклы козыр з рукава

Нагадаем, што Huawei вырабляе не толькі СГД, але і поўны спектр сеткавага абсталявання. Якога б пастаўшчыка СХД вы ні абралі, калі паміж пляцоўкамі выкарыстоўваецца сетка WDM, у 90% выпадкаў яна будзе пабудавана на рашэннях нашай кампаніі. Узнікае заканамернае пытанне: навошта збіраць заапарк сістэм, калі ўсё гарантавана сумяшчальнае паміж сабой "жалеза" можна атрымаць у аднаго вендара?

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Да пытання аб прадукцыйнасці

Мусіць, нікога ўжо не трэба пераконваць у тым, што пераход на All-Flash СГД дазваляе значна скараціць выдаткі на падтрыманне інфраструктуры, бо ўсе руцінныя аперацыі выконваюцца ў разы хутчэй. Пра гэта сведчаць усе пастаўшчыкі такога абсталявання. Між тым многія вендары пачынаюць хітраваць, калі гаворка заходзіць аб спадзе прадукцыйнасці пры ўключэнні розных рэжымаў працы СХД.

У нашай галіне шырока практыкуецца выдача СГД у тэставую эксплуатацыю на адзін-два дні. Пастаўшчык запускае 20-хвілінны тэст на пустой сістэме, атрымліваючы касмічныя паказчыкі прадукцыйнасці. А ў рэальнай эксплуатацыі хутка вылазяць "падводныя граблі". Ужо праз суткі прыгожыя значэнні IOPS зніжаюцца ўдвая-ўтрая, а калі СГД запоўніць на 80%, аказваюцца яшчэ менш. Пры ўключэнні RAID 5 замест RAID 10 губляецца яшчэ 10-15%, а ў рэжыме metro-кластара прадукцыйнасць дадаткова ўпалавінваецца.

Усё, што пералічана вышэй, не пра Dorado V6. Нашы заказчыкі маюць магчымасць запусціць тэст прадукцыйнасці на выходныя ці хаця б на ноч. Тады праяўляе сябе зборка смецця, а таксама становіцца зразумела, як актывацыя розных опцый - накшталт снэпшотаў і рэплікацыі - уплывае на велічыню дасяганых IOPS.

У Dorado V6 снэпшоты і RAID з цотнасцю практычна не ўплываюць на прадукцыйнасць (3-5% замест 10-15%). Зборка смецця (запаўненне ячэек назапашвальніка нулямі), кампрэсія, дэдуплікацыя на СГД, запоўненым на 80%, заўсёды будуць адбівацца на агульнай хуткасці апрацоўкі запытаў. Але менавіта Dorado V6 цікавая тым, што, якую б камбінацыю функцый і ахоўных механізмаў вы ні актывавалі, выніковая прадукцыйнасць СХД не ўпадзе ніжэй за 80% ад паказчыка, атрыманага без нагрузкі.

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Балансіроўка нагрузкі

Высокая прадукцыйнасць Dorado V6 дасягаецца за кошт балансавання на кожным этапе, а менавіта:

  • мультыпасінгу;
  • выкарыстання некалькіх падлучэнняў ад аднаго хаста;
  • наяўнасці фронтэнд-фабрыкі;
  • распаралельвання працы кантролераў СХД;
  • размеркавання нагрузкі па ўсіх назапашвальнікам на ўзроўні RAID 2.0+.

У прынцыпе, гэта агульная практыка. У нашы дні мала хто трымае ўсе дадзеныя на адным LUN: усё імкнуцца, каб іх было хай восем, няхай сорак, а то і яшчэ больш. Гэта відавочны і правільны падыход, які мы падзяляем. Але калі ваша задача патрабуе наяўнасці толькі аднаго LUN, які прасцей абслугоўваць, нашы архітэктурныя рашэнні дазваляюць дасягнуць на ім прадукцыйнасці 80% ад даступнай пры выкарыстанні некалькіх LUN.

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Дынамічнае планаванне загрузкі працэсараў

Размеркаванне нагрузкі на працэсары пры выкарыстанні аднаго LUN у нас рэалізавана наступным чынам: задачы яшчэ на ўзроўні LUN дробняцца на асобныя невялікія "шарды", кожны з якіх цвёрда замацоўваецца за пэўным кантролерам у "рухавічку". Гэта зроблена для таго, каб сістэма не губляла прадукцыйнасці, пакуль "скача" з гэтым кавалкам дадзеных па розных кантролерах.

Яшчэ адзін механізмам захавання высокай прадукцыйнасці - дынамічны шэдулінг, пры якім тыя ці іншыя працэсарныя ядры могуць вылучацца пад розныя пулы задач. Напрыклад, калі зараз сістэма прастойвае на ўзроўні дэдуплікацыі і кампрэсіі, то частка ядраў можа ўключыцца ў працэс абслугоўвання ўводу-вываду. Ці наадварот. Усё гэта выконваецца аўтаматычна і празрыста для карыстальніка.

Дадзеныя аб бягучай загрузцы кожнага з ядраў Dorado V6 не выводзяцца ў графічны інтэрфейс, але праз камандны радок можна звярнуцца да АС кантролера і скарыстацца звычайнай лінуксавай камандай топ.

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Падтрымка NVMe і RoCE

Як ужо згадвалася, на бягучы момант Dorado V6 цалкам падтрымлівае NVMe over Fibre Channel са скрынкі і не патрабуе ніякіх ліцэнзій. У сярэдзіне года з'явіцца падтрымка рэжыму NVMe over Ethernet. Для яе паўнавартаснага выкарыстання спатрэбіцца падтрымка Ethernet з прамым доступам у памяць (DMA) версіі v2.0 як са боку самой СХД, так і са боку камутатараў і сеткавых адаптараў. Напрыклад, такіх як Mellanox ConnectX-4 ці ConnectX-5. Можна скарыстацца і сеткавымі картамі, выкананымі на базе нашых мікрасхем. Таксама падтрымка RoCE павінна быць рэалізавана на ўзроўні аперацыйнай сістэмы.

У цэлым мы лічым Dorado V6 NVMe-арыентаванай сістэмай. Нягледзячы на ​​наяўную падтрымку Fibre Channel і iSCSI, у далейшым плануецца пераход на хуткасны Ethernet з RDMA.

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Дробка маркетынгу

Дзякуючы таму, што сістэма Dorado V6 валодае высокай устойлівасцю да збояў, добра гарызантальна маштабуецца, падтрымлівае розныя тэхналогіі міграцыі і т. д., эканамічны эфект ад яе набыцця выяўляецца з пачаткам інтэнсіўнай эксплуатацыі СХД. Мы і надалей будзем старацца зрабіць валоданне сістэмай максімальна выгадным, нават калі на першым этапе гэта не кідаецца ў вочы.

У прыватнасці, мы сфарміравалі праграму FLASH EVER, злучаную з падаўжэннем жыццёвага цыклу СХД і прызначаную для таго, каб наколькі магчыма разгрузіць замоўца пры правядзенні апгрэйдаў.

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Гэтая праграма ўключае ў сябе шэраг мер:

  • магчымасць паступовай замены кантролераў і паліц з дыскамі на новыя версіі без замены абсталявання цалкам (для сістэм Dorado V6 класа hi-end);
  • магчымасць федэратыўнага захоўвання (аб'яднанне розных версій Dorado у складзе аднаго гібрыднага кластара СХД);
  • разумную віртуалізацыю (магчымасць выкарыстоўваць абсталяванне трэцяга боку як частка рашэння Dorado).

Чаму OceanStor Dorado V6 самая хуткая і надзейная СХД

Засталося адзначыць, што няпростая сітуацыя ў свеце слаба адбілася на камерцыйных даляглядах новай сістэмы. Нягледзячы на ​​тое, што афіцыйны рэліз Dorado V6 адбыўся толькі ў студзені, мы бачым значны попыт на яе ў Кітаі, а таксама вялікую цікавасць да яе з боку расійскіх і міжнародных партнёраў з сферы фінансаў і з урадавых структур.

Апроч іншага, у сувязі з пандэміяй, колькі б яны ні працягнулася, асабліва востра ўстае пытанне аб забеспячэнні выдаленых супрацоўнікаў віртуальнымі працоўнымі сталамі. У гэтым працэсе Dorado V6 таксама магла б зняць многія пытанні. Для гэтага мы прыкладаем усе неабходныя намаганні, у тым ліку практычна дамовіліся аб уключэнні новай сістэмы ў ліст сумяшчальнасці VMware.

***

Дарэчы, не забывайце пра нашыя шматлікія вебинары, якія праводзяцца не толькі ў рускамоўным сегменце, але і на глабальным узроўні. Спіс вэбінараў на красавік даступны па спасылцы.

Крыніца: habr.com

Дадаць каментар