Мониторинг в центъра за данни: как сменихме стария BMS с новия. Част 3

Продължаваме нашата история за това как променихме BMS системата в нашите центрове за данни (част 1, част 2). В същото време ние не просто сменихме решението на един доставчик с друг, а разработихме система от нулата, която да отговаря на нашите изисквания. В края на нашата история споделяме резултатите от свършената работа и интересни решения, които могат да ви бъдат полезни.

Нов интерфейс

Тук, както се казва, е по-добре да се види веднъж.

Мониторинг в центъра за данни: как сменихме стария BMS с новия. Част 3Стелажи.

Нека да разгледаме разликите.

  • Първо, тя е красиво удобно Забележете колко лесно стана проследяването на натоварванията на PDU модулите („Банки“ или просто „Банки“) и сумата от паралелни зареждания на сдвоени модули. На модела на стелажа от новия BMS веднага виждаме, че долните сдвоени PDU модули са претоварени (общият ток е по-висок от допустимите 16A - „синьо“ известие), а горните са недостатъчно натоварени. Ако един от входовете е изключен, цялото натоварване ще се прехвърли към втория, а долният модул, който остава под напрежение, ще се изключи поради претоварване. За да предотврати това, услугата за поддръжка на центъра за данни ще предупреди клиента предварително и ще изпрати препоръка как да преразпредели натоварването.
  • Лесно добавяне на оборудване. В новия BMS виртуалните сензори за суми от модулни токове и мощност на стелажа вече са добавени към стандартните шаблони на стелажа и се създават автоматично след добавяне на PDU към стелажа. В старата BMS те трябваше да се създават ръчно и след това да се плъзгат върху картата, което увеличава вероятността от грешка поради „човешкия фактор“.
  • Неограничени възможности за творчество. Сега нямаме ограничения при създаването на виртуални сензори. Можете да изградите абсолютно всякакви математически модели на всякакви променливи. Това означава, че имаме способността да създаваме сложни виртуални сензори (преди можехме само да добавяме стойности) и да анализираме по-добре статистиките и тенденциите в работата на инженерните системи. Това подобрява качеството на взетите решения относно конфигурацията на системата, подмяната на оборудването и управлението на ресурсите. 
  • Интуитивен интерфейс. В новия интерфейс няма безпорядък от икони, вентилатори се въртят, превключватели „щракат“. И най-удобното нещо е възможността да се покаже състоянието на PDU Line A/B вътре в стелажите. Опитахме се да направим нещо подобно в старата BMS, но броят на обединените икони на квадратен сантиметър от картата ни принуди да го изоставим.

Сега е хубаво да погледнете:

Мониторинг в центъра за данни: как сменихме стария BMS с новия. Част 3
сървър.

Мониторинг в центъра за данни: как сменихме стария BMS с новия. Част 3
Фрагмент от главно табло.

Мониторинг в центъра за данни: как сменихме стария BMS с новия. Част 3
Панел за управление на вентилацията.

И новият BMS може да бъде украсен за Нова година :)
Мониторинг в центъра за данни: как сменихме стария BMS с новия. Част 3

Една страница – взаимно разбиране без дума и без технически спецификации

От много дълго време искахме да приложим друг „трик“ в BMS: да компилираме основните параметри на центъра за данни на една страница, така че един поглед към екрана да е достатъчен, за да се оцени състоянието на основните системи. Не разбрахме обаче напълно как трябва да изглежда.

Още преди да започне разработването на новата BMS, ние посетихме дузина центрове за данни в Холандия на екскурзии. Една от целите беше да се видят примери за внедряване на такава страница.

И нито един център за данни не ни го показа - в някои го нямаше, в други се „разработваше в момента“, в трети беше „голяма търговска тайна“. Ето защо в нашето задание за създаване на нова BMS нямаше точно описание на тази много важна за нас страница.

В резултат на това го измислихме буквално „в движение“. Точно в този момент трябваше дистанционно да се консултирам с колеги в центъра за данни. Беше много неудобно да превъртате страниците на BMS на телефона в търсене на разпръснати данни и всъщност първата версия беше скицирана върху салфетка Една страница. Той е реализиран от разработчиците въз основа на снимката. 

Следвайки примера на нашите предпазливи холандски колеги, ние няма да демонстрираме окончателната версия на нашата главна страница, още повече че всеки център за данни е уникален и няма смисъл да го копирате. Но нека опишем два основни принципа на неговото формиране:

  1. Това е таблица, проектирана да пасва на формата на вертикален екран на смартфон (или монитор, но поддържайки вертикално оформление), като цялата важна информация се показва на един екран. Над таблицата има „резюме“ на активните инциденти, така че беше най-удобно да ги поставите заедно във вертикален формат. 
  2. Подредбата на клетките в таблицата следва архитектурата на центъра за данни (физическа или логическа). Изоставихме подреждането на системите по азбучен ред, както би било желателно на пръв поглед. Последователността отразява визуалните асоциации на персонала на центъра за данни - сякаш те физически наблюдават всички стаи и системи. Това улеснява намирането на информация.

Всъщност сега абсолютно всички ключови характеристики на центъра за данни са групирани и представени на един екран на смартфона/монитора на отговорния инженер и мениджър, като същевременно е реализирана връзка с физическата и логическа топография на центъра за данни. 

Ето снимка на тази първа чернова, въпреки че, разбира се, след това тази версия беше преосмислена и финализирана.

Мониторинг в центъра за данни: как сменихме стария BMS с новия. Част 3

Потвърждение и резюме на инцидента

Нека поговорим за още една нова за нас концепция, която се появи в резултат на проекта за актуализиране на системата за мониторинг.

Ръкостискането е доста рядък термин, предложен от разработчика на новата BMS. Това означава потвърждение, че операторът е видял инцидента, признал го е и е поел отговорности за разрешаването му.  

Думата остана и сега ние „признаваме“ инцидентите.

Алгоритъмът, включен в основната версия на новата BMS, не ни устройваше. Всъщност това бяха коментари към дневника на събитията, тоест разрешените инциденти не изчезнаха от дневника, а приетите („потвърдени“) не бяха сортирани от новите.

В резултат на това беше разработен прозорец, наречен „резюме“, в който:

  1. Показват се само активни инциденти и устройства в сервизен режим (без търговски сини известия).
  2. Има ясно разграничение между НОВИ и ПРИЕТИ инциденти.
  3. Посочва се кой е приел инцидента.

Алгоритъмът на работа на дежурните в новата BMS е следният:

  1. Новите инциденти са включени в доклада и очакват потвърждение. Те не могат да останат дълго време в този участък, дежурният по техниката трябва незабавно да поеме инцидента.
  2. Служителят поема отговорност за инцидента, като щракне върху отметката вдясно. Тъй като всички служители са под уникални акаунти, автоматично се показва кой е приел инцидента. Ако е необходимо, оставете коментар.
  3. Инцидентът се премества в раздел „Потвърдено“, останалите дежурни и ръководителят разбират, че инцидентът се обработва от отговорния служител.

Мониторинг в центъра за данни: как сменихме стария BMS с новия. Част 3
Пример за обобщен прозорец с ново и вече потвърдено съобщение.

Като свържем прозореца с резюме с таблицата с една страница, получихме пълна начален екран BMS система, където веднага можете да видите: 

  • състояние на основните системи на ЦОД;
  • наличие на нови неотработени инциденти;
  • наличието на приети инциденти и информация за това кой конкретно ги отстранява.

Достъп от браузъра и изскачащи предупреждения на телефона

Уеб интерфейсът, достъпен от всяко устройство от всяка точка на света, е ярък контраст с „дебелия“ клиент, който е напълно затворен за външни потребители. 

Старият подход доведе до редица неудобства, от проблеми при организирането на дистанционна работа за служителите на услугите за наблюдение до необходимостта от инсталиране на „дебели“ клиенти от комплекти за разпространение на работни станции на персонала в центъра за данни.

Сега всяка страница в BMS има уникален адрес, който ви позволява да споделяте не само директния адрес на страницата или устройството, но и връзки към уникални графики/отчети. 

Достъпът до системата вече се осъществява чрез LDAP автентификация през Active Directory, което повишава нивото й на сигурност. 

Мобилността днес е ключов фактор за качествената работа на дежурните инженери. В допълнение към наблюдението на мониторинга в стаята за дежурни смени, инженерите обикалят, извършват рутинна работа извън „дежурната стая“ и благодарение на основния екран на BMS, оптимизиран за мобилни екрани, не губят контрол върху случващото се в турбинните помещения дори за секунда. 

Качеството на контрол също е подобрено благодарение на функционалността на работните чатове. Те ускоряват работните процеси, като позволяват кореспонденцията на дежурните инженери да бъде „свързана“ към BMS. Например, използваме приложението Teams, което ви позволява да водите вътрешна кореспонденция и да получавате всички съобщения от BMS на вашия телефон под формата на изскачащи Push известия, което елиминира необходимостта дежурният служител да гледа постоянно в телефона екран.

Мониторинг в центъра за данни: как сменихме стария BMS с новия. Част 3
 Push известие на екрана на смартфона.

Мониторинг в центъра за данни: как сменихме стария BMS с новия. Част 3
Ето как изглеждат известията в приложението Teams.

В същото време изскачащите известия са конфигурирани само за съобщения за възникване на инциденти, като по този начин се минимизира факторът на разсейване; персоналът знае: ако на екрана на смартфона се появи насочено известие на Teams, тогава те трябва да отидат на страницата на BMS и приемете инцидента. Съобщенията за разрешаване на инциденти се проследяват на страницата на BMS.

Мониторинг в центъра за данни: как сменихме стария BMS с новия. Част 3
Снимката показва BMS интерфейса в смартфон.

Резюмиране

Докато цената за актуализиране на BMS от стария ни доставчик беше сравнима с разработването на нова система от нулата (около $100 000), разликата във функционалността на продуктите се оказа колосална. Получихме гъвкава система, оптимизирана за нашите бизнес задачи и процеси. Освен това постигнахме значителни спестявания в текущата поддръжка на системата и разходите за надграждане. 

Но, разбира се, имаше трудности. 

  • Първо, подценихме количеството промени, които трябваше да бъдат направени в базовата версия на новата BMS и не спазихме предварително договорените срокове. За нас това не беше критичен проблем, тъй като бяхме осигурени до последния момент и работехме на старата система, а процесът беше креативен, сложен и затова понякога вървеше по-бавно от очакваното. Освен това винаги сме виждали, че нашият разработчик полага всички усилия, за да постигне най-добрия резултат. Но всъщност историята се оказа много дълга и нашите ключови специалисти отделиха много повече усилия и време за нея, отколкото бяха планирали. 
  • Второ, имахме нужда от няколко етапа на тестване, за да отстраним грешките в алгоритъма за резервиране на виртуални машини и комуникационни канали. Първоначално имаше повреди както от страна на BMS системата, така и от страна на настройката на виртуални машини и мрежата. Това отстраняване на грешки също отне време. За щастие на изпълнителя беше предоставена тестова платформа под формата на облачна услуга, където първоначално бяха тествани всички настройки и иновации.
  • Трето, получената система се оказа по-трудна за редактиране от крайния потребител. Ако преди картата се състоеше от фон (графичен файл) и икони, които бяха лесни за промяна или преместване, сега това е сложен графичен интерфейс с анимация, който изисква определени умения за редактиране.

Радикалната актуализация на нашата BMS система вече може да се нарече най-важният проект за изминалата година, който ще повлияе сериозно на качеството на оперативното управление на нашите обекти в бъдеще. 

Ние, разбира се, не изхвърлихме стария железен сървър, а го „облекчихме“: изчистихме го от хиляди „комерсиални“ виртуални сензори и PDU и оставихме в него само няколко десетки от най-критичните устройства, като дизел генератори, UPS, климатици, помпи, датчици за течове и температури В този режим предишната му скорост се е върнала и той може да бъде „резервен резерв“. Между другото, след като премахнахме PDU от стария BMS, освободихме около 1000 вече ненужни лиценза, случайно да знаеш какво да правиш с тях?

Източник: www.habr.com

Добавяне на нов коментар