Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

Ние аргументираме подробно какво прави OceanStor Dorado 18000 V6 наистина висок клас система за съхранение с приличен резерв за следващите години. В същото време разсейваме често срещаните страхове относно All-Flash съхранението и показваме как Huawei извлича максимума от тях: NVMe от край до край, допълнително кеширане на SCM и цял куп други решения.
Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

Нов ландшафт на данните - ново съхранение на данни

Интензивността на данните нараства във всички индустрии. И банковият сектор е ясна илюстрация за това. През последните няколко години броят на банковите транзакции се е увеличил повече от десет пъти. Както показва BCG изследване, само в Русия в периода от 2010 г. до 2018 г. броят на безналичните транзакции с пластмасови карти показва повече от тридесет пъти увеличение - от 5,8 на 172 на човек годишно. На първо място, триумфът на микроплащанията: повечето от нас се свързаха с онлайн банкирането и банката вече е на една ръка разстояние – по телефона.

ИТ инфраструктурата на една кредитна институция трябва да е готова за подобно предизвикателство. И това наистина е предизвикателство. Освен всичко друго, ако по-рано банката трябваше да осигури наличност на данни само през работното си време, сега това е 24/7. Доскоро 5 ms се смятаха за приемлива латентност, какво от това? Сега дори 1 ms е прекалено много. За модерна система за съхранение целта е 0,5 ms.

Същото е и с надеждността: през 2010 г. се формира емпирично разбиране, че е достатъчно да се доведе нивото му до „пет десетки“ - 99,999%. Вярно, това разбиране е остаряло. През 2020 г. е абсолютно нормално бизнесът да изисква 99,9999% за съхранение и 99,99999% за цялостната архитектура. И това изобщо не е каприз, а спешна необходимост: или няма времеви прозорец за поддръжка на инфраструктурата, или е малък.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

За по-голяма яснота е удобно тези индикатори да се проектират върху равнината на парите. Най-лесният начин е на примера на финансовите институции. Графиката по-горе показва колко печели всяка от 10-те най-големи банки в света на час. Само за Industrial and Commercial Bank of China това са не по-малко от $5 млн. Точно толкова ще струва един час престой на ИТ инфраструктурата на най-голямата кредитна организация в Китай (и се вземат предвид само пропуснатите ползи в изчислението!). От тази гледна точка е ясно, че намаляването на времето на престой и повишаването на надеждността не само с няколко процента, но дори и с части от процента, са напълно рационално оправдани. Не само от съображения за повишаване на конкурентоспособността, а просто за поддържане на пазарни позиции.

Сравними промени се случват и в други отрасли. Например във въздушния транспорт: преди пандемията въздушният транспорт набираше скорост от година на година и мнозина започнаха да го използват почти като такси. Що се отнася до потребителските модели, навикът за пълна наличност на услуги се е вкоренил в обществото: при пристигането на летището трябва да се свържем с Wi-Fi, достъп до платежни услуги, достъп до карта на района и т.н. В резултат натоварването на инфраструктурата и услугите в обществените пространства се увеличи многократно. И онези подходи към неговата инфраструктура, строителство, които смятахме за приемливи дори преди година, бързо остаряват.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

Рано ли е да преминете към All-Flash?

За решаване на проблемите, споменати по-горе, по отношение на производителността, AFA - изцяло флаш масиви, т.е. масиви, изцяло изградени върху флаш - са най-подходящи. Освен ако доскоро имаше съмнения дали те са сравними по надеждност с тези, сглобени на базата на твърди дискове и хибридни. В края на краищата, твърдотелната флаш памет има показател, наречен средно време между откази или MTBF (средно време между откази). Деградацията на клетките поради I / O операции, уви, е даденост.

Така че перспективите за All-Flash бяха засенчени от въпроса как да се предотврати загуба на данни в случай, че SSD нареди да живее дълго време. Архивирането е позната опция, само времето за възстановяване би било неприемливо голямо според съвременните изисквания. Друг изход е да се настрои второ ниво на съхранение на шпинделни устройства, но с такава схема се губят някои от предимствата на системата "стриктно флаш".

Цифрите обаче говорят друго: статистиката на гигантите на цифровата икономика, включително Google, през последните години показва, че флашът е няколко пъти по-надежден от твърдите дискове. Освен това, както за кратък период от време, така и за дълъг: средно минават четири до шест години, преди флаш паметите да се повредят. По отношение на надеждността на съхранение на данни те по никакъв начин не са по-ниски от устройствата на шпинделни магнитни дискове или дори ги надминават.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

Друг традиционен аргумент в полза на шпинделните задвижвания е тяхната достъпна цена. Без съмнение цената за съхранение на терабайт на твърд диск все още е относително ниска. И ако вземете предвид само цената на оборудването, е по-евтино да запазите терабайт на шпинделно устройство, отколкото на SSD. В контекста на финансовото планиране обаче има значение не само колко е закупено дадено устройство, но и каква е общата цена на притежаването му за дълго време - от три до седем години.

От този ъгъл е съвсем различно. Дори ако пренебрегнем дедупликацията и компресията, които по правило се използват на флаш масиви и правят тяхната работа по-изгодна от икономическа гледна точка, остават такива характеристики като пространството в стелажа, заето от медиите, разсейването на топлината и консумацията на енергия. И според тях флъшът превъзхожда своите предшественици. В резултат на това TCO на флаш системи за съхранение, като се вземат предвид всички параметри, често е почти наполовина по-малък, отколкото в случая на масиви на шпинделни устройства или хибриди.

Според докладите на ESG, системите за съхранение Dorado V6 All-Flash могат да постигнат намаление на разходите за притежание до 78% за петгодишен интервал, включително чрез ефективна дедупликация и компресия, както и поради ниската консумация на енергия и разсейване на топлината. Немската аналитична компания DCIG също ги препоръчва за употреба като най-добрите по отношение на TCO налични днес.

Използването на твърди дискове позволява да се спести полезно пространство, да се намали броят на повреди, да се намали времето за поддръжка на решението, да се намали консумацията на енергия и разсейването на топлината на системите за съхранение. И се оказва, че AFA е поне икономически сравнима с традиционните масиви на шпинделни задвижвания, а често дори ги превъзхожда.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

Huawei Royal Flush

Сред нашите All-Flash хранилища, първото място принадлежи на hi-end системата OceanStor Dorado 18000 V6. И не само сред нашите: като цяло в индустрията той държи рекорда по скорост - до 20 милиона IPOS в максимална конфигурация. В допълнение, той е изключително надежден: дори ако два контролера летят наведнъж, или до седем контролера един след друг, или цял двигател наведнъж, данните ще оцелеят. Значителни предимства на „осемнадесетхилядника“ се дават от свързания в него AI, включително гъвкавостта при управление на вътрешни процеси. Нека да видим как се постига това.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

До голяма степен Huawei има преднина, защото е единственият производител на пазара, който сам прави системи за съхранение - изцяло и напълно. Имаме собствена схема, собствен микрокод, собствена услуга.

Контролерът в системите OceanStor Dorado е изграден върху процесор собствен дизайн и производство на Huawei - Kunpeng 920. Той използва контролния модул Intelligent Baseboard Management Controller (iBMC), също наш. AI чиповете, а именно Ascend 310, които оптимизират прогнозите за повреда и дават препоръки за настройки, също са на Huawei, както и I / O платките - Smart I / O модула. И накрая, контролерите в SSD са проектирани и произведени от нас. Всичко това осигури основата за създаване на интегрално балансирано и високопроизводително решение.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

През изминалата година реализирахме проект за въвеждане на тази наша най-висок клас система за съхранение в една от най-големите руски банки. В резултат на това повече от 40 единици OceanStor Dorado 18000 V6 в метро клъстера показват стабилна производителност: повече от милион IOPS могат да бъдат премахнати от всяка система и това се взема предвид закъсненията, дължащи се на разстояние.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

NVMe от край до край

Най-новите системи за съхранение на Huawei поддържат NVMe от край до край, което подчертаваме с причина. Традиционно използваните протоколи за достъп до устройства са разработени в древността на ИТ: те се основават на SCSI команди (здравей, 1980-те!), Които извличат много функции, за да осигурят обратна съвместимост. Какъвто и метод за достъп да използвате, разходите за протокол в този случай са колосални. В резултат на това за хранилища, които използват протоколи, свързани със SCSI, I / O забавянето не може да бъде по-ниско от 0,4–0,5 ms. От своя страна, като протокол, предназначен да работи с флаш памет и освободен от патерици в името на прословутата обратна съвместимост, NVMe - Non-Volatile Memory Express - събаря латентността до 0,1 ms, освен това не на системата за съхранение, а на целия стек, от хоста до дисковете. Не е изненадващо, че NVMe е в съответствие с тенденциите за развитие на съхранението на данни в обозримо бъдеще. Ние също разчитахме на NVMe - и постепенно се отдалечаваме от SCSI. Всички системи за съхранение на Huawei, произведени днес, включително линията Dorado, поддържат NVMe (като цялостна система обаче се прилага само в усъвършенстваните модели от серията Dorado V6).

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

FlashLink: Пълна шепа технологии

Основната технология за цялата линия OceanStor Dorado е FlashLink. По-точно, това е термин, който съчетава цялостен набор от технологии, които служат за осигуряване на висока производителност и надеждност. Това включва технологии за дедупликация и компресиране, функционирането на системата за разпространение на данни RAID 2.0+, разделянето на „студени“ и „горещи“ данни, последователно записване на данни с пълна лента (произволни записи, с нови и променени данни, се агрегират в голям стек и записван последователно, което увеличава скоростта на четене-запис).

Освен всичко друго, FlashLink включва два важни компонента - Wear Leveling и Global Garbage Collection. С тях трябва да се работи отделно.

Всъщност всяко твърдотелно устройство е система за съхранение в миниатюра, с голям брой блокове и контролер, който осигурява достъпност на данните. И се осигурява, наред с други неща, поради факта, че данните от "убитите" клетки се прехвърлят в "неубитите". Това гарантира, че те могат да бъдат прочетени. Има различни алгоритми за такъв трансфер. В общия случай контролерът се опитва да балансира износването на всички клетки за съхранение. Този подход има обратна страна. Когато данните се преместват вътре в SSD, броят на I/O операциите, които той изпълнява, драстично намалява. Засега това е необходимо зло.

По този начин, ако има много SSD в системата, на графиката на производителността се появява „трион“ с резки скокове и спадове. Проблемът е, че едно устройство от пула може да започне миграция на данни по всяко време и цялостната производителност се премахва едновременно от всички SSD в масива. Но инженерите на Huawei измислиха как да избегнат „триона“.

За щастие и контролерите в дисковете, и контролерът за съхранение, и фърмуерът на Huawei са „родни“, тези процеси в OceanStor Dorado 18000 V6 се стартират централно, синхронно на всички дискове в масива. Освен това, по команда на контролера за съхранение и точно когато няма голямо I/O натоварване.

Чипът с изкуствен интелект също участва в избора на точния момент за прехвърляне на данни: въз основа на статистиката на посещенията за предходните няколко месеца, той е в състояние да предвиди с най-голяма вероятност дали да очаква активни I / O в близко бъдеще и ако отговорът е отрицателен и натоварването на системата в момента е малко, тогава контролерът командва всички задвижвания: тези, които се нуждаят от Wear Leveling, трябва да го направят наведнъж и синхронно.

Освен това системният контролер вижда какво се случва във всяка клетка на устройството, за разлика от системите за съхранение на конкурентни производители: те са принудени да купуват твърдотелни носители от доставчици на трети страни, поради което детайлизирането на ниво клетка не е достъпно за администраторите на такива хранилища.

В резултат на това OceanStor Dorado 18000 V6 има много кратък период на влошаване на производителността при операцията за изравняване на износването и тя се извършва главно когато не пречи на други процеси. Това осигурява висока стабилна производителност на постоянна основа.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

Какво прави OceanStor Dorado 18000 V6 надежден

Има четири нива на надеждност в съвременните системи за съхранение на данни:

  • хардуер, на ниво устройство;
  • архитектурен, на ниво оборудване;
  • архитектурна заедно със софтуерната част;
  • кумулативен, отнасящ се до решението като цяло.

Тъй като, припомняме, нашата компания сама проектира и произвежда всички компоненти на системата за съхранение, ние осигуряваме надеждност на всяко едно от четирите нива, с възможност за щателно наблюдение какво се случва на кое от тях в момента.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

Надеждността на дисковете е гарантирана предимно от описаните по-горе Wear Leveling и Global Garbage Collection. Когато SSD изглежда като черна кутия за системата, тя няма представа как точно се износват клетките в него. За OceanStor Dorado 18000 V6 устройствата са прозрачни, което прави възможно равномерното балансиране на всички устройства в масива. По този начин се оказва, че значително се удължава живота на SSD и се осигурява високо ниво на надеждност на тяхната работа.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

Също така, надеждността на устройството се влияе от допълнителни излишни клетки в него. И заедно с обикновен резерв, системата за съхранение използва така наречените DIF клетки, които съдържат контролни суми, както и допълнителни кодове за защита на всеки блок от единична грешка, в допълнение към защитата на ниво RAID масив.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

Ключът към надеждността на архитектурата е решението SmartMatrix. Накратко, това са четири контролера, които се намират на пасивна задна платка като част от един двигател (двигател). Два от тези двигатели - съответно с осем контролера - са свързани към общи рафтове със задвижвания. Благодарение на SmartMatrix, дори ако седем от осем контролера спрат да функционират, достъпът до всички данни, както за четене, така и за запис, ще остане. И със загубата на шест от осем контролера дори ще бъде възможно да продължите операциите по кеширане.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

I/O платките на една и съща пасивна задна платка са достъпни за всички контролери, както на предния, така и на задния край. С такава схема на свързване с пълна мрежа, независимо какво се проваля, достъпът до устройствата винаги се запазва.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

Най-подходящо е да се говори за надеждността на една архитектура в контекста на режимите на повреда, срещу които системата за съхранение може да защити.

Хранилището ще преживее ситуацията без загуба, ако два контролера „паднат“, включително едновременно. Такава стабилност се постига поради факта, че всеки кеш блок със сигурност има още две копия на различни контролери, тоест общо съществува в три копия. И поне един е на различен двигател. По този начин, дори ако целият двигател спре да работи - с всичките си четири контролера - е гарантирано, че цялата информация, която е била в кеш паметта, ще бъде запазена, тъй като кешът ще бъде дублиран в поне един контролер от останалия двигател. И накрая, със серийна връзка можете да загубите до седем контролера и дори ако те бъдат елиминирани в блокове от два, - и отново всички I / O и всички данни от кеша ще бъдат запазени.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

В сравнение с хай-енд хранилища от други производители, може да се види, че само Huawei осигурява пълна защита на данните и пълна наличност дори след смъртта на два контролера или на целия двигател. Повечето доставчици използват схема с така наречените двойки контролери, към които са свързани устройства. За съжаление, в тази конфигурация, ако два контролера се повредят, съществува риск от загуба на I/O достъп до устройството.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

Уви, обективно не е изключена повреда на един компонент. В този случай производителността ще падне за известно време: необходимо е пътеките да бъдат изградени отново и достъпът до I / O операции да бъде възобновен по отношение на онези блокове, които или са дошли да пишат, но все още не са били написани, или са били поискани да бъдете прочетени. OceanStor Dorado 18000 V6 има средно време за възстановяване от приблизително една секунда, значително по-малко от най-близкия аналог в индустрията (4 s). Това се постига благодарение на същата пасивна задна платка: когато контролерът се повреди, останалите незабавно виждат неговия вход / изход и по-специално в кой блок данни не е записан; в резултат на това най-близкият контролер подхваща процеса. Оттук и възможността за възстановяване на производителността само за секунда. Трябва да добавя, че интервалът е стабилен: секунда за един контролер, секунда за друг и т.н.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

В пасивната задна платка OceanStor Dorado 18000 V6 всички платки са достъпни за всички контролери без допълнително адресиране. Това означава, че всеки контролер може да вземе I / O на всеки порт. Какъвто и входно-изходен порт да влезе, контролерът ще бъде готов да го обработи. Оттук - минималният брой вътрешни трансфери и забележимо опростяване на балансирането.

Балансирането на предния край се извършва с помощта на многопътния драйвер, а допълнителното балансиране се извършва в самата система, тъй като всички контролери виждат всички I / O портове.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

Традиционно всички масиви на Huawei са проектирани по такъв начин, че да нямат нито една точка на повреда. Горещата смяна, без рестартиране на системата, се поддава на всички нейни компоненти: контролери, захранващи модули, охлаждащи модули, I / O платки и др.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

Повишава надеждността на системата като цяло и технология като RAID-TP. Това е името на RAID група, която ви позволява да се застраховате срещу едновременен отказ на до три диска. И възстановяването на 1 TB постоянно отнема по-малко от 30 минути. Най-добрият записан резултат е осем пъти по-бърз, отколкото със същото количество данни на шпинделното задвижване. По този начин е възможно да се използват изключително обемни устройства, да речем 7,68 или дори 15 TB, и да не се притеснявате за надеждността на системата.

Важно е възстановяването да се извършва не в резервно устройство, а в свободно пространство - резервен капацитет. Всеки диск има специално пространство, използвано за възстановяване на данни след повреда. По този начин възстановяването се извършва не по схемата „много към едно“, а по схемата „много към много“, поради което е възможно значително да се ускори процесът. И докато има свободен капацитет, възстановяването може да продължи.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

Трябва да споменем и надеждността на решение от няколко хранилища - в метро клъстер или, по терминологията на Huawei, HyperMetro. Такива схеми се поддържат от цялата гама модели на нашите системи за съхранение на данни и позволяват както файлов, така и блоков достъп. Освен това на блок едно функционира както през Fibre Channel, така и чрез Ethernet (включително чрез iSCSI).

По същество говорим за двупосочна репликация от една система за съхранение към друга, при която на репликирания LUN се дава същият LUN-ID като на основния. Технологията работи предимно благодарение на съгласуваността на кешовете от две различни системи. По този начин за хоста няма значение от коя страна е: и тук, и там той вижда едно и също логическо устройство. В резултат на това нищо не ви пречи да разположите отказоустойчив клъстер, обхващащ два сайта.

За кворум се използва физическа или виртуална Linux машина. Може да се намира на третия сайт, а изискванията към ресурсите му са малки. Често срещан сценарий е да наемете виртуален сайт изключително за хостване на кворум VM.

Технологията позволява и разширение: две хранилища – в метро клъстер, допълнителен сайт – с асинхронна репликация.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

Исторически, много клиенти са формирали „зоопарк за съхранение“: куп системи за съхранение от различни производители, различни модели, различни поколения, с различна функционалност. Въпреки това, броят на хостовете може да бъде впечатляващ и често те са виртуализирани. При такива обстоятелства един от приоритетите на администрацията е бързо, еднакво и удобно предоставяне на логически дискове на хостовете, за предпочитане по начин, който не задълбава в това къде тези дискове са физически разположени. За това е създадено нашето софтуерно решение OceanStor DJ, което може единодушно да управлява различни системи за съхранение и да предоставя услуги от тях, без да е обвързано с конкретен модел за съхранение.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

Същият AI

Както вече споменахме, OceanStor Dorado 18000 V6 има вградени процесори с алгоритми за изкуствен интелект – Ascend. Те се използват, първо, за прогнозиране на повреди и второ, за формиране на препоръки за настройка, което също повишава производителността и надеждността на хранилището.

Хоризонтът на прогнозиране е два месеца: AI машината предполага какво ще се случи с голяма вероятност през това време, дали е време за разширяване, промяна на политиките за достъп и т.н. Препоръките се издават предварително, което ви позволява да планирате прозорци за поддръжка на системата напред от време.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

Следващият етап от развитието на AI от Huawei е извеждането му на глобално ниво. В хода на поддръжката на услугата - отказ или препоръки - Huawei събира информация от системите за регистриране от всички хранилища на нашите клиенти. Въз основа на събраната информация се извършва анализ на възникналите или потенциални сривове и се правят глобални препоръки - базирани не на функционирането на една конкретна система за съхранение или дори дузина, а на това, което се случва и се е случвало с хиляди такива устройства. Извадката е огромна и въз основа на нея AI алгоритмите започват да се учат изключително бързо, поради което точността на прогнозите се увеличава значително.

Съвместимост

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

През 2019-2020 г. имаше много намеци за взаимодействието на нашето оборудване с продуктите на VMware. За да ги спрем най-накрая, ние отговорно заявяваме: VMware е партньор на Huawei. Бяха проведени всички възможни тестове за съвместимостта на нашия хардуер с неговия софтуер и в резултат на това на уебсайта на VMware листът за хардуерна съвместимост изброява наличните в момента системи за съхранение на нашето производство без никакви резерви. С други думи, със софтуерната среда на VMware можете да използвате съхранение на Huawei, включително Dorado V6, с пълна поддръжка.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

Същото важи и за сътрудничеството ни с Brocade. Ние продължаваме да взаимодействаме и да тестваме нашите продукти за съвместимост и можем уверено да заявим, че нашите системи за съхранение са напълно съвместими с най-новите превключватели Brocade FC.

Huawei OceanStor Dorado 18000 V6: каква е неговата природа от висок клас

Каква е следващата?

Ние продължаваме да развиваме и подобряваме нашите процесори: те стават по-бързи, по-надеждни, тяхната производителност нараства. Ние също така подобряваме AI чиповете - на тяхна база се произвеждат и модули, които ускоряват дедупликацията и компресията. Тези, които имат достъп до нашия конфигуратор, може би са забелязали, че тези карти вече са налични за поръчка в моделите Dorado V6.

Ние също се придвижваме към допълнително кеширане на Storage Class Memory - енергонезависима памет с особено ниска латентност, около десет микросекунди на четене. Освен всичко друго, SCM дава тласък на производителността, предимно при работа с големи данни и при решаване на OLTP задачи. След следващата актуализация SCM картите трябва да станат достъпни за поръчка.

И разбира се, функционалността за достъп до файлове ще бъде разширена в цялата гама хранилища на данни на Huawei - следете за нашите актуализации.

Източник: www.habr.com