Рішення HiDC для побудови сучасної ІКТ-інфраструктури ЦОД на основі обладнання Huawei Enterprise

Окинувши поглядом з висоти пташиного польоту всі сучасні рішення Huawei Enterprise, представлені в 2020 році, ми переходимо до більш точкових та детальних розповідей про окремі ідеї та продукти, які здатні послужити основою цифрової трансформації як великих підприємств, так і державних структур. Сьогодні — про те, на основі яких концепцій та технологій Huawei пропонує будувати ЦОДи.

Рішення HiDC для побудови сучасної ІКТ-інфраструктури ЦОД на основі обладнання Huawei Enterprise

В еру «підключеного світу» завдання зберігання та обробки даних вимагають нових підходів на всіх етапах життєвого циклу ЦОДів. Вони повинні одночасно стати і простіше і розумніше, щоб впоратися з покладеною на них роллю центральних елементів інфраструктури світової цифрової економіки.

У 2018 році людство зберігало 33 зеттабайти інформації, але вже до 2025 року її сумарний обсяг має зрости більш ніж у п'ять разів. Три десятиліття досвіду в розробці ІКТ-інфраструктур дозволили Huawei добре підготуватися до «цунамі даних», що набирає сили, і запропонувати своїм партнерам і замовникам концепцію інтелектуального ЦОДу, що включає всі етапи його будівництва, експлуатації та техобслуговування. Елементи цієї концепції об'єднані під назвою HiDC.

Рішення HiDC для побудови сучасної ІКТ-інфраструктури ЦОД на основі обладнання Huawei Enterprise

Цифровізуй це

Мережею гуляє свіжий анекдот: хто найбільше прискорив цифрову трансформацію вашої компанії — CEO, CTO, рада директорів? Епідемія коронавірусу! Тільки лінивий не проводить вебінари, не пише статті, не розповідає, як і що робити. Але це все реактивні дії. Дехто готувався заздалегідь.

Не заради вихваляння — з об'єктивних причин як приклад наведемо нашу компанію, де цифрова трансформація була масштабно ініційована кілька років тому. На даний момент практично всіх співробітників ми можемо перевести на роботу з дому без будь-якої втрати ефективності. Показовою є історія з лікарнею, побудованою в місті Ухань за десять днів. Там цифрова трансформація виявила себе в тому, що всі IT-системи були розгорнуті за три доби. Тож цифрова трансформація — це не про «коли» та «навіщо», а про «як».

Рішення HiDC для побудови сучасної ІКТ-інфраструктури ЦОД на основі обладнання Huawei Enterprise

Архітектурний підхід замість стихійного розвитку

Які основні проблеми постають перед нами, коли ми починаємо будувати систему? Досі всі наші замовники працюють у режимі суміщення бізнес-завдань із прикладними сервісами та IT-рішеннями. Досить складно отримати загальне уявлення про функціонування такого комплексу, якщо його створювали шляхом додавання різних блоків. А для того, щоб будувати систему як єдиний організм, насамперед необхідний архітектурний підхід. Його ми втілили в ідеології нашого рішення HiDC.

Рішення HiDC для побудови сучасної ІКТ-інфраструктури ЦОД на основі обладнання Huawei Enterprise

Максимум цінності та мінімум вартості

Уся структура HiDC – це два основні зрізи. Перший є те, що ви звикли бачити у Huawei, — класичну інфраструктуру. Елементи другого зрізу найпростіше поєднати терміном «інтелектуальні дані».

Навіщо це потрібно? У наші дні багато компаній накопичують колосальні обсяги інформації, часто розрізненої або доступної через різні «прокладки». І взяти хоча б стандартні бази даних. Запитайте у своїх адміністраторів БД, наскільки ці бази зістиковані між собою та як використовувати відомості з них у BI-системах для ухвалення бізнес-рішень. Дивна річ, найчастіше БД дуже слабко пов'язані один з одним і функціонують як окремі «острівці». Тому в першу чергу ми замислилися над тим, якими архітектурними підходами могла б усунути цю проблему.

Рішення HiDC для побудови сучасної ІКТ-інфраструктури ЦОД на основі обладнання Huawei Enterprise

Принципи проектування архітектури HiDC

Розглянемо основні засади проектування HiDC. Це в першу чергу буде корисним не фахівцям якогось конкретного напряму, а архітекторам рішень, які можуть охопити поглядом усю панораму.

Найпоширенішими є блок конвергентних мереж та блок управління даними. І вже тут виникає поняття, про яке рідко замислюються архітектори рішень, — керування життєвим циклом даних. З класичних баз даних він перекочував до багатьох інших систем, у тому числі в хмарні та граничні (edge) обчислення.

Граничних обчислень дедалі більше. Найочевидніший приклад їх застосування - автомобіль з автопілотом, яким бажано керувати з єдиної платформи. Крім того, є тренд на «зелені» технології — більш енергоефективні, що завдають мінімальних збитків навколишньому середовищу. Домогтися і того, й іншого можна за допомогою переходу на інтелектуальні ресурси (про них далі).

Чудово, коли у нашому розпорядженні усі шість блоків структури HiDC. Щоправда, найчастіше замовники працюють у створеному раніше середовищі. Однак використання навіть одного блоку зі схеми вище здатне принести плоди. А якщо додати другий, третій і так далі, почне проявлятись синергетичний ефект. Лише поєднання мережі та розподіленої системи зберігання даних дасть більш високу продуктивність та нижчі затримки. Блоковий підхід дозволяє нам розвиватися не хаотично, як найчастіше відбувається в індустрії, а використовуючи комплексний архітектурний підхід. Ну, а відкритість самих блоків надає свободу у виборі оптимального рішення.

Рішення HiDC для побудови сучасної ІКТ-інфраструктури ЦОД на основі обладнання Huawei Enterprise

Час конвергентних мереж

Останнім часом на світовому та російському ринках ми все більш завзято просуваємо концепцію конвергентних мереж. Вже сьогодні наші замовники використовують конвергентні рішення на RoCEv2 (RDMA over Converged Ethernet v2) для побудови розподілених програмних систем зберігання даних. Головний плюс такого підходу — у його відкритості та відсутності необхідності створювати невизначену кількість розрізнених мереж.

Чому так не робили раніше? Нагадаємо, стандарт Ethernet був розроблений у 1969 році. За півстоліття в ньому накопичилося багато проблем, але в Huawei навчилися їх вирішувати. Тепер, завдяки ряду додаткових дій, ми можемо використовувати Ethernet для критично важливих додатків, високонавантажених рішень і т.д.

Рішення HiDC для побудови сучасної ІКТ-інфраструктури ЦОД на основі обладнання Huawei Enterprise

Від DCN до DCI

Наступний важливий тренд – синергетичний ефект від впровадження DCI (Data Center Interconnect). У Росії, на відміну від Китаю, щось подібне поки що можна зустріти тільки в операторів зв'язку. Коли замовники розглядають мережеві рішення для ЦОД, зазвичай вони не приділяють належної уваги глибокій інтеграції оптичних мереж та класичних IP-рішень у межах однієї точки присутності. Вони використовують звичні рішення, які працюють на IP-шарі, чого їм вистачає.

Навіщо тоді потрібен DCI? Уявіть, що адміністратор DWDM-вузла та адміністратор мережі діють незалежно. У якийсь момент збій, що виник у будь-якого з них, може серйозно знизити вашу стійкість до відмов. А якщо ми використовуємо принцип синергії, IP-маршрутизація здійснюється з урахуванням того, що відбувається на оптичній мережі. Використання такого інтелектуального сервісу помітно збільшує кількість дев'яток на рівні доступності всієї системи.

Ще однією серйозною перевагою нашого DCI є великий запас продуктивності. Підсумовуючи можливості діапазонів C і L, можна отримати близько 220 лямбд. Такий запас навряд чи буде швидко вичерпаний навіть великим корпоративним замовником, якщо врахувати, що наше рішення дозволяє передавати через кожну лямбду до 400 Гбіт/с. Надалі на тому ж обладнанні можна буде досягти 800 Гбіт/с.

Додаткова зручність забезпечується загальною керованістю, яку ми надаємо через відкриті інтерфейси. З допомогою NETCONF здійснюється управління як комутаторами, а й пристроями оптичного ущільнення, що дозволяє досягти конвергенції всіх рівнях і сприймати систему саме як інтелектуальний ресурс, а чи не «набір коробок».

Рішення HiDC для побудови сучасної ІКТ-інфраструктури ЦОД на основі обладнання Huawei Enterprise

Граничні обчислення все важливіше

Багато хто чув про Edge Computing. І тим, хто займається хмарними та класичними ЦОДами, слід мати на увазі, що ми останнім часом спостерігаємо серйозне зрушення саме у бік граничних обчислень.

Чим це спричинено? Погляньмо на загальні моделі впроваджень. Зараз чимало говорять про «розумні міста», «розумні будинки» тощо. Ця концепція дозволяє забудовнику створити додану вартість і підвищити ціну об'єкта нерухомості. «Розумний дім» упізнає свого мешканця, впускає та випускає його, надає йому деякі послуги. Згідно зі статистикою, такі послуги додають до ціни апартаментів близько 10-15% і в цілому здатні підштовхнути розвиток нових бізнес-моделей. Також раніше вже було сказано про концепти автопілотів. Незабаром розвиток технологій 5G і Wi-Fi 6 дозволить забезпечити вкрай низьку затримку при передачі даних між «розумними» будинками, автомобілями та головним ЦОДом, що проводять граничні обчислення. А значить, стане можливим виконання набагато більшої кількості операцій, пов'язаних із серйозною обробкою даних. Для вирішення таких завдань, зокрема, можна використовувати і нейронні процесори, які вже постачаються до Росії.

Перспективність змальованого щойно тренда безсумнівна. Уявимо, припустимо, інтелектуальну систему управління міським транспортом, здатну перемикати світлофори, регулювати транспортне навантаження на конкретних вулицях або навіть вживати адекватних заходів під час надзвичайних ситуацій.

Рішення HiDC для побудови сучасної ІКТ-інфраструктури ЦОД на основі обладнання Huawei Enterprise

Тепер звернемося до ресурсів, якими ми забезпечуємо реалізацію концепції HiDC.

Обчислення

Коли нам потрібно реалізувати стандартну обчислювальну систему, застосування в ній, звичайно, знаходять процесори з архітектурою x86. Але щойно виникає необхідність кастомізації, можна задуматися про різноманітні рішення.

Так, наприклад, процесори ARM в силу великої кількості ядер добре підходять для додатків з високим ступенем паралелізму. Багатопоточність дає виграш у продуктивності близько 30%.

Якщо ми критично важливі низькі затримки, на передній план виходять програмовані логічні інтегральні схеми (ПЛІС) FPGA.

Нейронні процесори передусім необхідні під час вирішення завдань машинного навчання. Якщо конкретного застосування нам необхідно 16 стійок з 8 серверами у кожному, нашпигованими нейропроцесорами, то рішення тієї самої рівня з урахуванням архітектури x86 зажадало б (!) близько 128 стійок. Як бачите, велика різноманітність типів розрахунків змушує ретельно вибирати і апаратні платформи.

Рішення HiDC для побудови сучасної ІКТ-інфраструктури ЦОД на основі обладнання Huawei Enterprise

Зберігання даних

Вже другий рік Huawei закликає партнерів, замовників, колег по галузі будувати системи зберігання даних відповідно до принципу Flash Only. І більшість наших замовників використовують механічні шпиндельні накопичувачі тільки в старих рішеннях або для архівних даних, що рідко використовуються.

Flash-системи також еволюціонують. На ринку з'являються такі системи Storage Class Memory (SCM) як Intel Optane. Цікаві розробки демонструють китайські та японські виробники. На даний момент SCM за класом обробки перевершують всі інші рішення. Поки що лише висока вартість не дозволяє використовувати їх повсюдно.

Водночас ми бачимо, що якість СГД треба підвищувати не лише на умовному бекенді, а й на фронтенді. Зараз де-факто в нових впровадженнях ми, як правило, пропонуємо та залучаємо механізми прямого доступу до пам'яті через Ethernet, але бачимо запит замовників і тому ближче до кінця року почнемо частіше використовувати NVMe over Fabrics. Причому end-to-end, щоб забезпечувати загальну архітектуру, яка, звичайно, має бути високопродуктивною та стійкою до виходу контролерів з ладу.

Система зберігання даних OceanStor Dorado – один із наших флагманських продуктів. Внутрішні випробування показали, що вона забезпечує продуктивність на рівні 20 млн IOPS, зберігаючи працездатність при поломці семи із восьми контролерів.

Навіщо така потужність? Давайте розглянемо злободенну ситуацію. Ось уже кілька місяців жителі Китаю значно більше часу проводять будинки через режим ізоляції. Інтернет-трафік на цей час зріс у середньому на 30%, а в деяких провінціях удвічі. Виросло споживання різних мережевих сервісів. І в якийсь момент ті ж банки почали відчувати серйозне додаткове навантаження, до якого їх СГД не готові.

Зрозуміло, що 20 млн IOPS зараз потрібні далеко не всім. Але що буде завтра? Наші інтелектуальні системи максимально повно розкривають потенціал нейронних процесорів, щоб забезпечити компактність трафіку, дедуплікацію, оптимізацію та оперативне відновлення даних.

Опорна мережа

2020 рік, як ми згадували у попередньому матеріалі, стане для нас роком опорних мереж. Багато замовників, особливо постачальників послуг додатків (ASP) та банки, вже думають про те, як їхні програми працюватимуть саме з погляду зв'язку з ЦОДами та між ЦОДами. Тут нам приходить на допомогу нова опорна мережа. Як приклад наведемо найбільші китайські банки, які перейшли на спрощені опорні системи, що використовують для зв'язку між ЦОДами не десяток різних протоколів, а, умовно кажучи, кілька OSPF і SRv6. При тому, що отримує організація той самий набір сервісів.

Рішення HiDC для побудови сучасної ІКТ-інфраструктури ЦОД на основі обладнання Huawei Enterprise

Інтелектуальні ресурси

Як використовувати дані? До недавнього часу існувала фрагментована система різношерстих баз даних: Microsoft SQL, MySQL, Oracle і т. д. Для роботи з ними застосовувалися рішення з області big data, здатні об'єднувати ці дані, забирати їх, працювати з ними. Усе це створювало високу навантаження ресурси.

Водночас був відсутній механізм виконання операцій із даними щодо настання якоїсь події. Рішенням стала розробка принципів керування життєвим циклом даних (DLM).

Усі чули про data lakes. З переходом від data management до data governance «цифрові озера» стали стрімко «розумнішати». У тому числі й завдяки рішенням Huawei. У наступних матеріалах ми обов'язково розповімо про весь стек використаних нами програмних технологій. Зараз важливо відзначити, що саме застосування «розумного» керування життєвим циклом даних дозволило нам спростити використання нашої мережі та серверів, а також навчитися будувати наскрізні архітектури для кращого розуміння принципів роботи з даними.

Рішення HiDC для побудови сучасної ІКТ-інфраструктури ЦОД на основі обладнання Huawei Enterprise

Інженерна інфраструктура ЦОДу

Ми публікуватимемо окремі матеріали, присвячені інженерній інфраструктурі, однак у контексті сьогоднішньої теми хотіли б згадати ті зміни, які стосуються концепції HiDC.

Довгий час використання в системах аварійного та резервного живлення (УРП) ЦОД літієвих батарей було під забороною через їхню високу пожежну небезпеку. Будь-яке механічне пошкодження або порушення цілісності батареї могло призвести до її загоряння та непередбачуваних наслідків. У зв'язку з цим УРП комплектувалися морально застарілими кислотними батареями, що мають низьку питому щільність заряду при великій масі.

У нових системах аварійного та резервного живлення Huawei застосовуються безпечні літій-залізо-фосфатні акумулятори (LFP) з інтелектуальним проактивним керуванням. При тій же ємності вони займають втричі менший обсяг, порівняно з кислотними батареями. Їх життєвий цикл становить 10–15 років, що, крім усього іншого, знижує навантаження, що створюється ними, на довкілля. Запатентована система управління в екосистемі SmartLi дозволяє застосовувати гібридні системи, що складаються з масивів батарей старого та нового типу, а система комутації допускає внесення «гарячих» змін до структури УРП з безперервним збереженням функції резервування.

Рішення HiDC для побудови сучасної ІКТ-інфраструктури ЦОД на основі обладнання Huawei Enterprise

«Розумна» експлуатація

Важливою частиною принципів експлуатації інфраструктури HiDC є ідеологія smart self-healing. У однією з наших минулих публікацій ми згадували інтелектуальну платформу O&M 1-3-5, яка здатна не лише виявити та проаналізувати небажану подію в системі, а й запропонувати адміністратору кілька варіантів повністю автоматизованого вирішення проблеми.

Функція самоаналізу дозволяє виявити неполадки приблизно за хвилину. Три хвилини йде на аналіз, і протягом п'яти хвилин формуються пропозиції щодо зміни стану системи.

Припустимо, певна помилка оператора призвела до формування замкнутої петлі процесів, що знижує продуктивність ферми віртуалізації зі 100 до 77%. Адміністратор ЦОД отримує на свій дашборд відповідне повідомлення, що містить повну візуалізацію проблеми, включаючи мережеву схему ресурсів, порушених небажаним процесом. Далі адміністратор може розпочати виправлення ситуації в ручному режимі або скористатися одним із кількох запропонованих йому автоматичних сценаріїв відновлення.


Таких сценаріїв, які можуть бути реалізовані менш ніж за десять хвилин, система знає близько 75. Причому вони покривають 90% проблем, які трапляються в ЦОДах. У цей час інженер може спокійно відповідати на дзвінки стурбованих клієнтів, будучи впевненим, що сервіс буде відновлений з хвилини на хвилину.

Рішення HiDC для побудови сучасної ІКТ-інфраструктури ЦОД на основі обладнання Huawei Enterprise

Нові ключові продукти в HiDC

Крім програмних продуктів, сюди слід зарахувати ключові рішення, що діють на рівні інфраструктури. Насамперед слід згадати нейронні процесори, що використовуються в наших ІІ-кластерах сімейства Atlas, а також сервери на базі NPU та GPU.

Крім того, не можна знову не згадати про Dorado та його рекордну продуктивність у своєму класі, якої із запасом вистачить на довгі роки. Це особливо актуально на пострадянському просторі, де за рідкісним винятком прийнято щось оновлювати лише тоді, коли воно зовсім перестає працювати. Цим пояснюються терміни служби окремих СГД, що сягають десяти років. Величезна продуктивність необхідна Dorado для того, щоб через десять років забезпечувати високу якість надання сервісів.

Рішення HiDC для побудови сучасної ІКТ-інфраструктури ЦОД на основі обладнання Huawei Enterprise

Інновації у кожному елементі

При виборі конкретних інфраструктурних рішень не можна забувати про архітектуру та сценарії її подальшого розвитку. Розрізнені продукти від різних виробників не гарантують очікуваного синергетичного ефекту, який забезпечать рішення вже оптимізовані для спільного використання.

В основі інфраструктури мають лежати правильні технології. «Правильні» - це в тому числі відкриті, що забезпечують високу пропускну здатність, що стійко функціонують при високих навантаженнях. Що стосується ЦОДів, наприклад, важливе хороше співвідношення загального енергоспоживання до IT-навантаження. Для досягнення всіх цілей треба підібрати середовище і компоненти. У сучасних умовах це ще й усе ширше застосування штучного інтелекту.

За нашими спостереженнями серед стратегічних замовників Huawei все менше тих, хто досі не використовує системи машинного навчання. Без ML просто не вдасться максимально монетизувати накопичені дані.

Система монетизації може бути різною: у банків — пропозиція нових таргетованих продуктів, у телеком-операторів — надання індивідуальних послуг та забезпечення лояльності, державні замовники — якісне управління життєвим циклом даних і високий рівень взаємодії з іншими організаціями. Адже моделі керування даними вже давно не зводяться до настроювання файрволла та забезпечення мережевої видимості своїх БД.

Від ідеї до діючого ЦОДу

Будівництво стандартного ЦОДу у найкращому разі займає від року до півтора. Наш виробничий цикл дозволяє зробити це набагато швидшим завдяки використанню групи рішень, об'єднаних під загальною назвою FusionDC 2.0. Проектування, розробка високорівневого дизайну, збирання всіх елементів ІТ-навантаження виконуються безпосередньо на заводі. За короткий час обладнання морськими контейнерами доставляється з Китаю до Росії. У результаті створення ЦОД «під ключ» можна забезпечити буквально за чотири-п'ять місяців.

Ідея prefabricated cloud data center цікава ще й тим, що розвивати ЦОД можна поетапно, додаючи до нього необхідні функціональні блоки. Такий підхід закладено у саму концепцію HiDC.


Щоб не перетворювати оглядовий матеріал у datasheet, за додатковою інформацією з HiDC ми пропонуємо відправитися на наш сайт. Там ви знайдете опис та приклади впровадження тих підходів, продуктів та рішень, про які ми розповіли. Матеріалів буде тим більше, чим вищий рівень доступу до сайту. Якщо вам надано статус «партнер», ви зможете завантажити дорожні карти HiDC, технічні презентації, відеоролики.

Ризикнемо припустити, що більшість читачів цієї статті мають компетенції мережевих архітекторів. Їм напевно буде цікаво відвідати нашу дизайн-зону. Там ми докладно розповідаємо про те, як будувати інфраструктуру мережі за правилами Huawei Validated Design (HVD). Доступні для завантаження гайдлайни допоможуть досконало розібратися, як працюють рішення компанії. Не забудьте тільки, що без авторизації вам буде доступно менше матеріалів.

***

Зорієнтуватися вам допоможуть і численні вебінари, що проводяться не лише у російськомовному сегменті, а й на міжнародному рівні. На них ми ділимося як інформацією про свої продукти, так і своєю бізнес-практикою. У тому числі розповідаємо про те, як Huawei в умовах розриву багатьох сервісних ланцюжків продовжує забезпечувати безперервну доставку своєї продукції до різних країн. Нещодавно, наприклад, був випадок, коли щойно виготовлене обладнання для ЦОДу дісталося московського замовника лише за три тижні.

Список вебінарів на квітень доступний за посиланням.

Джерело: habr.com

Додати коментар або відгук