Маніторынг у ЦАД: як мы мянялі старую BMS на новую. Частка 3

Мы працягваем наш аповяд пра тое, як мы мянялі BMS-сістэму ў нашых ЦАДах (частка 1, частка 2). Пры гэтым мы не проста памянялі рашэнне аднаго вендара на іншага, а распрацавалі сістэму з нуля пад свае патрабаванні. У заключэнне нашай гісторыі дзелімся вынікамі праведзенай працы і цікавымі рашэннямі, якія могуць быць вам карысныя.

Новы інтэрфейс

Тут, як кажуць, лепш адзін раз убачыць.

Маніторынг у ЦАД: як мы мянялі старую BMS на новую. Частка 3Стойкі.

Разбяром адрозненні.

  • Па-першае, гэта прыгожа зручны. Звярніце ўвагу, як лёгка стала адсочваць нагрузкі на модулі ("Banks" ці проста "Банкі") PDU і суму паралельных нагрузак парных модуляў. На мадэлі стойкі з новай BMS мы адразу бачым, што ніжнія парныя модулі PDU перагружаныя (сумарны ток вышэй дапушчальных 16А сіняе апавяшчэнне), а верхнія недагружаныя. У выпадку адключэння аднаго з уводаў уся нагрузка пяройдзе на другі, і пакінуты пад напругай ніжні модуль адключыцца з-за перагрузкі. Каб не дапусціць такога, служба падтрымкі ЦАД загадзя папярэдзіць кліента і адправіць рэкамендацыю, як пераразмеркаваць нагрузку.
  • Простае даданне абсталявання. У новай BMS віртуальныя датчыкі сум токаў модуляў і магутнасці стойкі ўжо дададзены ў шаблоны тыпавых стоек і ствараюцца аўтаматычна пасля дадання ў стойку PDU. У старой BMS іх даводзілася ствараць уручную, а потым перацягваць на карту, што падвышала верагоднасць памылкі з-за "чалавечага фактару".
  • Неабмежаваную прастору для творчасці. Цяпер у нас няма абмежаванняў пры стварэнні віртуальных датчыкаў. Можна будаваць абсалютна любыя матэматычныя мадэлі любых зменных. Гэта азначае, што ў нас ёсць магчымасць ствараць складаныя віртуальныя датчыкі (раней можна было толькі складаць значэнні) і лепш аналізаваць статыстыку і тэндэнцыі працы інжынерных сістэм. Гэта павышае якасць прымаемых рашэнняў па наладзе сістэм, замене абсталявання і кіраванні рэсурсамі. 
  • Зразумелы інтэрфейс. У новым інтэрфейсе няма нагрувашчвання значкоў, вентылятары круцяцца, выключальнікі "пстрыкаюць". І самае зручнае - гэта магчымасць індыкацыі стану PDU Line A / B ўнутры стоек. Мы спрабавалі зрабіць нешта падобнае ў старой BMS, але колькасць якія зліваюцца значкоў на квадратны сантыметр карты прымусіла нас ад гэтага адмовіцца.

Цяпер воку прыемна глядзець:

Маніторынг у ЦАД: як мы мянялі старую BMS на новую. Частка 3
Серверныя.

Маніторынг у ЦАД: як мы мянялі старую BMS на новую. Частка 3
Фрагмент ГРШ.

Маніторынг у ЦАД: як мы мянялі старую BMS на новую. Частка 3
Шчыт кіравання вентыляцыяй.

А яшчэ новую BMS можна ўпрыгожыць на Новы год 🙂
Маніторынг у ЦАД: як мы мянялі старую BMS на новую. Частка 3

One page – паразуменне з паўслова і без ТЗ

Мы вельмі даўно хацелі рэалізаваць яшчэ адну «фішку» у BMS: скампанаваць на адной старонцы асноўныя параметры ЦАД, каб аднаго погляду на экран было дастаткова для ацэнкі стану асноўных сістэм. Аднак мы не да канца разумелі, як яна мусіць выглядаць.

Яшчэ да пачатку распрацоўкі новай BMS мы наведалі з экскурсіямі дзясятак ЦАД у Нідэрландах. Адной з мэт было ўбачыць прыклады рэалізацыі такой старонкі.

І ні ў адным ЦАД нам яе не паказалі - дзесьці яе не было, дзесьці «прама цяпер распрацоўвалі», дзесьці гэта была «вялікая камерцыйная таямніца». Таму ў нашым ТЗ на стварэньне новай BMS дакладнае апісаньне гэтай вельмі важнай для нас старонкі адсутнічала.

У выніку мы яе прыдумалі літаральна "на хаду". Якраз у той момант прыйшлося выдалена кансультаваць калег у ЦАД. Гартаць старонкі BMS у тэлефоне ў пошуках разрозненых дадзеных было вельмі няёмка, і фактычна на сурвэтцы была накінута першая версія Адна старонка. Яе і рэалізавалі распрацоўшчыкі па фота. 

Прытрымліваючыся прыкладу асцярожных галандскіх калег, не будзем дэманстраваць выніковы варыянт нашай галоўнай старонкі, тым больш што кожны ЦАД унікальны і капіяваць сэнсу няма. Але апішам два галоўныя прынцыпы яе фармавання:

  1. Гэта табліца, звярстаная пад фармат вертыкальна размешчанага экрана смартфона (альбо манітора, але з захаваннем вертыкальнага размяшчэння), з высновай усёй важнай інфармацыі на адзін экран. Над табліцай прыводзіцца "зводка" актыўных інцыдэнтаў, таму размяшчаць іх разам зручней за ўсё апынулася ў вертыкальным фармаце. 
  2. Размяшчэнне ячэек у табліцы паўтарае архітэктуру ЦАДа (фізічную або лагічную). Мы адмовіліся ад размяшчэння сістэм у алфавітным парадку, як жадаецца на першы погляд. Паслядоўнасць адлюстроўвае глядзельныя асацыяцыі персаналу дата-цэнтра - як быццам яны фізічна маніторыць усе памяшканні і сістэмы. Гэта спрашчае пошук інфармацыі.

Па сутнасці, зараз абсалютна ўсе ключавыя характарыстыкі ЦАД згрупаваны і прадстаўлены на адным экране смартфона / манітора адказнага інжынера і кіраўніка, пры гэтым рэалізавана прывязка да фізічнай і лагічнай тапаграфіі ЦАД. 

Вось фота таго самага першага чарнавіка, хаця, вядома, затым гэтая версія была пераасэнсаваная і дапрацаваная.

Маніторынг у ЦАД: як мы мянялі старую BMS на новую. Частка 3

Квітаванне і зводка інцыдэнтаў

Раскажам пра яшчэ адно новае для нас паняцце, якое з'явілася ў выніку праекта па абнаўленні сістэмы маніторынгу.

Квітаванне - даволі рэдка сустракаемы тэрмін, які прапанаваў выкарыстоўваць распрацоўшчык новай BMS. Ён азначае пацвярджэнне таго, што аператар убачыў інцыдэнт, пацвердзіў яго і прыняў на сябе абавязкі па яго ўстараненню.  

Слова прыжылося, і зараз мы «квітуем» інцыдэнты.

Алгарытм, закладзены ў базавую версію новай BMS, нас не задаволіў. Фактычна гэта былі каментары да часопіса падзей, гэта значыць, ліквідаваныя інцыдэнты не знікалі з часопіса, а прынятыя ("квітаваныя") не адсартоўваліся ад новых.

У выніку было распрацавана акно пад назвай "зводка", у якім:

  1. Адлюстроўваюцца толькі актыўныя інцыдэнты і прылады ў сэрвісным рэжыме (без камерцыйных «сініх» апавяшчэнняў).
  2. Відавочна падзяляюцца НОВЫЯ і ПРЫНЯТЫЯ інцыдэнты.
  3. Указана, хто прыняў інцыдэнт.

Алгарытм працы дзяжурных у новай BMS наступны:

  1. Новыя інцыдэнты трапляюць у зводку і чакаюць квітавання. Доўга яны ў гэтым раздзеле знаходзіцца не могуць, адказны за абсталяванне дзяжурны павінен адразу прыняць інцыдэнт на сябе.
  2. Супрацоўнік прымае інцыдэнт на сябе, націснуўшы на галачку справа. Бо ўсе супрацоўнікі пад унікальнымі ўліковымі запісамі - аўтаматычна адлюстроўваецца, хто прыняў інцыдэнт. Пры неабходнасці пакідаецца каментар.
  3. Інцыдэнт перамяшчаецца ў раздзел "Квітаваныя", астатнія дзяжурныя і кіраўнік разумеюць, што інцыдэнтам займаецца адказны супрацоўнік.

Маніторынг у ЦАД: як мы мянялі старую BMS на новую. Частка 3
Прыклад акна зводкі з новым і ўжо квітаваным паведамленнем.

Злучыўшы акно зводкі з табліцай One page, мы атрымалі паўнавартасны галоўны экран сістэмы BMS, на якім адразу можна ўбачыць: 

  • стан асноўных сістэм ЦАД;
  • наяўнасць новых неапрацаваных інцыдэнтаў;
  • наяўнасць прынятых інцыдэнтаў і дадзеныя аб тым, хто канкрэтна іх ухіляе.

Доступ праз браўзэр і усплывальныя абвесткі на тэлефоне

Вэб-інтэрфейс, даступны з любой прылады з любой кропкі свету, – гэта ашаламляльны кантраст з «тоўстым» кліентам, цалкам зачыненым для карыстачоў звонку. 

Стары падыход цягнуў за сабой комплекс нязручнасцяў, ад праблем у арганізацыі выдаленай працы супрацоўнікаў службы маніторынгу да неабходнасці ўсталёўваць "тоўстыя" кліенты з дыстрыбутываў на працоўныя месцы персаналу ў ЦАД.

Цяпер у любой старонкі ў BMS ёсць унікальны адрас, што дазваляе дзяліцца не толькі прамым адрасам старонкі ці прылады, але і спасылкамі на ўнікальныя графікі/ справаздачы. 

Доступ у сістэму зараз ажыццяўляецца з дапамогай LDAP-аўтэнтыфікацыі праз Active Directory, што ўзмацняе ўзровень яе абароненасці. 

Мабільнасць сёння - ключавы фактар ​​якаснай працы дзяжурных інжынераў. Апроч кантролю маніторынгу ў памяшканні дзяжурнай змены, інжынеры робяць абыходы, выконваюць бягучую працу па-за «дзяжуркай» і, дзякуючы аптымізаванаму пад мабільны экран галоўнаму экрану BMS, не губляюць кантроль за тым, што адбываецца ў машзалах ні на секунду. 

Якасць кантролю павялічваецца і дзякуючы функцыянальнасці працоўных чатаў. Яны паскараюць працоўныя працэсы, дазваляючы "прывязаць" перапіску дзяжурных інжынераў да BMS. Мы, напрыклад, выкарыстоўваем дадатак Teams, якое дазваляе весці ўнутраную перапіску і атрымліваць на тэлефон усе паведамленні з BMS у выглядзе ўсплывальных Push-паведамленняў, што пазбаўляе дзяжурнага ад неабходнасці ўвесь час глядзець у экран тэлефона.

Маніторынг у ЦАД: як мы мянялі старую BMS на новую. Частка 3
 Push-апавяшчэнне на экране смартфона.

Маніторынг у ЦАД: як мы мянялі старую BMS на новую. Частка 3
А так апавяшчэнні выглядаюць у дадатку Teams.

Пры гэтым усплывальныя апавяшчэнні настроены толькі на паведамленні аб з'яўленні інцыдэнтаў, тым самым мінімізаваны які адцягвае фактар, персанал ведае: калі на экране смартфона з'явілася Push-апавяшчэнне Teams, то трэба зайсці на старонку BMS і прыняць інцыдэнт. Паведамленні аб устараненні інцыдэнтаў адсочваюцца ўжо на старонцы BMS.

Маніторынг у ЦАД: як мы мянялі старую BMS на новую. Частка 3
На фота інтэрфейс BMS у смартфоне.

Падводзячы вынік

Пры кошце абнаўлення BMS у нашага старога вендара, супастаўнай з распрацоўкай новай сістэмы з нуля (каля $100 000), розніца ў функцыянальнасці прадуктаў апынулася каласальнай. Мы атрымалі гнуткую сістэму, аптымізаваную пад нашы бізнес-задачы і працэсы. Мы таксама дабіліся істотнай эканоміі ў бягучых выдатках на падтрымку і абнаўленне сістэмы. 

Але, канешне, былі і складанасці. 

  • Па-першае, мы недаацанілі аб'ём змен, якія патрабавалася ўнесці ў базавую версію новай BMS, і не ўклаліся ў загадзя абумоўленыя тэрміны. Для нас гэта не было крытычнай праблемай, бо мы да апошняга страхаваліся і працавалі на старой сістэме, а працэс быў творчы, складаны і таму ішоў часам больш марудна, чым чакалася. Да таго ж мы заўсёды бачылі, што наш распрацоўшчык прыкладае максімум намаганняў для дасягнення лепшага выніку. Але па факце гісторыя аказалася вельмі доўгай, і нашы ключавыя спецыялісты патрацілі на яе значна больш намаганняў і часу, чым планавалі. 
  • Па-другое, нам запатрабавалася некалькі этапаў выпрабаванняў, каб адладзіць алгарытм рэзервавання віртуальных машын і каналаў сувязі. Першапачаткова збоі былі і на баку сістэмы BMS, і на баку наладкі віртуальных машын і сеткі. Гэтая адладка таксама заняла час. Балазе, падрадчыку была прадастаўлена тэставая пляцоўка ў выглядзе хмарнага сэрвісу, дзе першапачаткова тэсціраваліся ўсе наладкі і новаўвядзенні.
  • Па-трэцяе, выніковая сістэма аказалася складаней для рэдагавання канчатковым карыстальнікам. Калі раней карта ўяўляла сабой падкладку (графічны файл) і значкі, змяніць ці перамясціць якія не складала працы, то зараз гэта складаны графічны інтэрфейс з анімацыяй, які патрабуе вызначаных навыкаў для рэдагавання.

Радыкальнае абнаўленне нашай сістэмы BMS ужо сёння можна назваць важнейшым праектам мінулага года, які сур'ёзна паўплывае на якасць аперацыйнага кіравання нашымі пляцоўкамі ў будучыні. 

Стары жалезны сервер мы, вядома ж, не выкінулі, а "палегчылі": ачысцілі ад тысяч "камерцыйных" віртуальных датчыкаў і PDU і пакінулі ў ім толькі некалькі дзясяткаў самых крытычных прылад, такіх як ДГУ, КБС, кандыцыянеры, помпы, датчыкі працёкаў і тэмператур. У такім рэжыме да яго вярнулася былая хуткасць, і ён можа быць "рэзервам рэзерву". Дарэчы, пасля выдалення PDU са старой BMS у нас вызвалілася каля 1000 зараз ужо непатрэбных ліцэнзій, вы выпадкова не ведаеце, што з імі рабіць?

Крыніца: habr.com

Дадаць каментар