Stebėjimas duomenų centre: kaip seną BMS pakeitėme nauja. 3 dalis

Tęsiame pasakojimą apie tai, kaip pakeitėme BMS sistemą savo duomenų centruose (Dalis 1, Dalis 2). Tuo pačiu metu mes ne tiesiog iškeitėme vieno pardavėjo sprendimą į kitą, bet sukūrėme sistemą nuo nulio, kad atitiktų mūsų poreikius. Savo pasakojimo pabaigoje dalinamės atlikto darbo rezultatais ir įdomiais sprendimais, kurie gali būti jums naudingi.

Nauja sąsaja

Čia, kaip sakoma, geriau vieną kartą pamatyti.

Stebėjimas duomenų centre: kaip seną BMS pakeitėme nauja. 3 dalisLentynos.

Pažvelkime į skirtumus.

  • Pirma, ji yra красиво patogiai. Atkreipkite dėmesį, kaip lengva sekti PDU modulių apkrovas („Bankai“ arba tiesiog „Bankai“) ir lygiagrečių suporuotų modulių apkrovų sumą. Naujojo BMS stovo modelyje iš karto matome, kad apatiniai suporuoti PDU moduliai yra perkrauti (bendra srovė yra didesnė už leistiną 16A - „mėlynas“ pranešimas), o viršutiniai yra per mažai apkrauti. Jei vienas iš įėjimų bus atjungtas, visa apkrova persikels į antrą, o apatinis modulis, kuris lieka įjungtas, išsijungs dėl perkrovos. Kad taip nenutiktų, duomenų centro palaikymo tarnyba iš anksto įspės klientą ir atsiųs rekomendaciją, kaip perskirstyti apkrovą.
  • Простое добавление оборудования. Naujojoje BMS virtualūs modulių srovių ir stovo galios sumų jutikliai jau pridedami prie standartinių stovo šablonų ir sukuriami automatiškai, pridėjus PDU prie stovo. Senajame BMS juos reikėjo sukurti rankiniu būdu, o paskui nuvilkti į žemėlapį, o tai padidino klaidų tikimybę dėl „žmogiškojo faktoriaus“.
  • Neribotos kūrybiškumo galimybės. Dabar kurdami virtualius jutiklius neturime jokių apribojimų. Galite sukurti visiškai bet kokius bet kokių kintamųjų matematinius modelius. Tai reiškia, kad turime galimybę kurti sudėtingus virtualius jutiklius (anksčiau galėjome tik pridėti vertes) ir geriau analizuoti statistiką bei inžinerinių sistemų veikimo tendencijas. Tai pagerina sprendimų, susijusių su sistemos konfigūravimu, įrangos keitimu ir išteklių valdymu, kokybę. 
  • Intuityvi sąsaja. Naujoje sąsajoje nėra piktogramų netvarkos, ventiliatoriai sukasi, jungikliai „spausk“. O patogiausia yra galimybė stelažų viduje nurodyti PDU Line A/B būseną. Kažką panašaus bandėme padaryti senajame BMS, bet sulietų piktogramų skaičius kvadratiniame centimetre žemėlapio privertė jį atsisakyti.

Dabar malonu pažiūrėti:

Stebėjimas duomenų centre: kaip seną BMS pakeitėme nauja. 3 dalis
Serveris.

Stebėjimas duomenų centre: kaip seną BMS pakeitėme nauja. 3 dalis
Pagrindinio skirstomojo skydo fragmentas.

Stebėjimas duomenų centre: kaip seną BMS pakeitėme nauja. 3 dalis
Vėdinimo valdymo pultas.

O naujuosius BMS galima papuošti Naujiesiems metams :)
Stebėjimas duomenų centre: kaip seną BMS pakeitėme nauja. 3 dalis

Vienas puslapis – tarpusavio supratimas be žodžio ir be techninių specifikacijų

Labai ilgai norėjome BMS įdiegti dar vieną „gudrybę“: pagrindinius duomenų centro parametrus suvesti viename puslapyje, kad pagrindinių sistemų būklei įvertinti pakaktų vieno žvilgsnio į ekraną. Tačiau mes iki galo nesupratome, kaip tai turėtų atrodyti.

Dar prieš pradedant kurti naują BMS, mes aplankėme keliolika duomenų centrų Nyderlanduose. Vienas iš tikslų buvo pamatyti tokio puslapio įgyvendinimo pavyzdžius.

Ir ne vienas duomenų centras mums tai nerodė – vienuose jo nebuvo, kituose „šiuo metu kuriama“, kituose tai buvo „didelė komercinė paslaptis“. Todėl mūsų naujos BMS kūrimo techninėse sąlygose nebuvo tikslaus šio mums labai svarbaus puslapio aprašymo.

Dėl to mes jį sugalvojome tiesiogine prasme „skraidydami“. Kaip tik tuo metu teko nuotoliniu būdu konsultuoti kolegas duomenų centre. Buvo labai nepatogu vartyti BMS puslapius telefone ieškant išsklaidytų duomenų, o iš tikrųjų pirmoji versija buvo nubraižyta ant servetėlės. vienas puslapis. Jį kūrėjai įgyvendino pagal nuotrauką. 

Atsargių kolegų olandų pavyzdžiu nedemonstruosime galutinės pagrindinio puslapio versijos, juolab kad kiekvienas duomenų centras yra unikalus ir nėra prasmės jo kopijuoti. Tačiau apibūdinkime du pagrindinius jo formavimo principus:

  1. Tai lentelė, sukurta taip, kad atitiktų vertikalaus išmaniojo telefono ekrano (arba monitoriaus, bet išlaikant vertikalų išdėstymą) formatą, visa svarbi informacija rodoma viename ekrane. Virš lentelės yra aktyvių incidentų „santrauka“, todėl juos patogiausia buvo sudėti vertikaliai. 
  2. Ląstelių išdėstymas lentelėje atitinka duomenų centro architektūrą (fizinę arba loginę). Atsisakėme sistemų išdėstymo abėcėlės tvarka, kaip būtų pageidautina iš pirmo žvilgsnio. Seka atspindi vizualines duomenų centro darbuotojų asociacijas – tarsi jie fiziškai stebėtų visas patalpas ir sistemas. Taip lengviau rasti informaciją.

Tiesą sakant, dabar absoliučiai visos pagrindinės duomenų centro charakteristikos yra sugrupuotos ir pateikiamos viename atsakingo inžinieriaus ir vadovo išmaniojo telefono/monitoriaus ekrane, o kartu įdiegtas susiejimas su duomenų centro fizine ir logine topografija. 

Štai to paties pirmojo juodraščio nuotrauka, nors, žinoma, tada ši versija buvo pergalvota ir baigta.

Stebėjimas duomenų centre: kaip seną BMS pakeitėme nauja. 3 dalis

Pripažinimas ir įvykio santrauka

Pakalbėkime apie dar vieną mums naują koncepciją, kuri atsirado įgyvendinant monitoringo sistemos atnaujinimo projektą.

Квитирование – довольно редко встречающийся термин, который предложил использовать разработчик новой BMS. Он означает подтверждение того, что оператор увидел инцидент, подтвердил его и принял на себя обязанности по его устранению.  

Žodis įstrigo, o dabar mes „pripažįstame“ incidentus.

Algoritmas, įtrauktas į bazinę naujosios BMS versiją, mums netiko. Tiesą sakant, tai buvo komentarai įvykių žurnale, tai yra, išspręsti incidentai nedingo iš žurnalo, o priimti („patvirtinti“) nebuvo rūšiuojami iš naujų.

Dėl to buvo sukurtas langas, vadinamas „santrauka“, kuriame:

  1. Rodomi tik aktyvūs incidentai ir įrenginiai, veikiantys aptarnavimo režimu (nėra komercinių mėlynų pranešimų).
  2. Yra aiškus skirtumas tarp NAUJŲ ir PRIIMTINŲ incidentų.
  3. Nurodoma, kas priėmė įvykį.

Budinčių pareigūnų darbo algoritmas naujajame BMS yra toks:

  1. Nauji incidentai įtraukti į ataskaitą ir laukia patvirtinimo. Jie negali ilgai išbūti šiame ruože, o techniką budintis asmuo turi nedelsdamas perimti įvykį.
  2. Darbuotojas prisiima atsakomybę už įvykį paspausdamas varnelę dešinėje. Kadangi visi darbuotojai turi unikalias paskyras, automatiškai rodoma, kas priėmė incidentą. Jei reikia, palik komentarą.
  3. Įvykis perkeliamas į skyrių „Pripažinta“, likę budintys pareigūnai ir vadovas supranta, kad įvykį sprendžia atsakingas darbuotojas.

Stebėjimas duomenų centre: kaip seną BMS pakeitėme nauja. 3 dalis
Suvestinės lango su nauju ir jau patvirtintu pranešimu pavyzdys.

Sujungę suvestinės langą su vieno puslapio lentele, gavome pilną Pagrindinis ekranas BMS sistema, kurioje iškart matosi: 

  • pagrindinių duomenų centrų sistemų būklė;
  • naujų neapdorotų incidentų buvimas;
  • priimtų incidentų buvimas ir informacija apie tai, kas konkrečiai juos pašalina.

Naršyklės prieiga ir telefono iššokantys įspėjimai

Žiniatinklio sąsaja, pasiekiama iš bet kurio įrenginio iš bet kurios pasaulio vietos, yra ryškus kontrastas „storajam“ klientui, kuris yra visiškai uždarytas išoriniams vartotojams. 

Senasis metodas atnešė daugybę nepatogumų – nuo ​​problemų organizuojant nuotolinį darbą, skirtą paslaugų darbuotojų stebėjimui, iki poreikio įdiegti „storus“ klientus iš paskirstymo rinkinių personalo darbo vietose duomenų centre.

Dabar bet kuris BMS puslapis turi unikalų adresą, kuris leidžia bendrinti ne tik tiesioginį puslapio ar įrenginio adresą, bet ir nuorodas į unikalius grafikus/ataskaitas. 

Dabar prieiga prie sistemos vykdoma naudojant LDAP autentifikavimą per Active Directory, o tai padidina jos saugumo lygį. 

Mobilumas šiandien yra pagrindinis kokybiško budinčių inžinierių darbo veiksnys. Be stebėjimo budėjimo pamainoje, inžinieriai atlieka ratus, atlieka įprastus darbus ne „darbo patalpose“ ir dėl pagrindinio BMS ekrano, optimizuoto mobiliesiems ekranams, nepraranda kontrolės to, kas vyksta turbinų patalpose. sekundei. 

Valdymo kokybė taip pat pagerinama dėl darbo pokalbių funkcionalumo. Jie pagreitina darbo procesus, nes leidžia „susieti“ su BMS budinčių inžinierių korespondenciją. Pavyzdžiui, mes naudojame Teams aplikaciją, kuri leidžia vesti vidinę korespondenciją ir gauti visus pranešimus iš BMS į telefoną iššokančių Push pranešimų forma, todėl budėtojui nebereikia nuolat žiūrėti į telefoną. ekranas.

Stebėjimas duomenų centre: kaip seną BMS pakeitėme nauja. 3 dalis
 Push pranešimas išmaniojo telefono ekrane.

Stebėjimas duomenų centre: kaip seną BMS pakeitėme nauja. 3 dalis
Taip pranešimai atrodo Teams programoje.

Tuo pačiu metu iššokantieji pranešimai sukonfigūruojami tik pranešimams apie įvykusius incidentus, taip sumažinant blaškymosi veiksnį; darbuotojai žino: jei išmaniojo telefono ekrane pasirodo Teams Push Notification, jie turi eiti į BMS puslapį. ir priimti įvykį. Įvykio sprendimo pranešimai sekami BMS puslapyje.

Stebėjimas duomenų centre: kaip seną BMS pakeitėme nauja. 3 dalis
Nuotraukoje parodyta BMS sąsaja išmaniajame telefone.

Sumavimas

Nors mūsų senojo pardavėjo BMS atnaujinimo kaina buvo panaši į naujos sistemos kūrimą nuo nulio (apie 100 000 USD), produktų funkcionalumo skirtumas pasirodė didžiulis. Gavome lanksčią sistemą, optimizuotą mūsų verslo užduotims ir procesams. Taip pat daug sutaupėme nuolatinio sistemos palaikymo ir atnaujinimo išlaidų. 

Bet, žinoma, buvo sunkumų. 

  • Pirma, neįvertinome pakeitimų, kuriuos reikėjo atlikti naujosios BMS bazinėje versijoje, kiekį ir nesilaikėme iš anksto sutartų terminų. Mums tai nebuvo kritinė problema, nes buvome apdrausti iki paskutinės minutės ir dirbome pagal seną sistemą, o procesas buvo kūrybiškas, sudėtingas, todėl kartais vykdavo lėčiau nei tikėtasi. Be to, visada matėme, kad mūsų kūrėjas deda visas pastangas siekdamas geriausio rezultato. Tačiau iš tikrųjų istorija pasirodė labai ilga, o pagrindiniai mūsų specialistai tam skyrė daug daugiau pastangų ir laiko, nei planavo. 
  • Antra, mums reikėjo kelių testavimo etapų, kad derintume virtualių mašinų ir ryšio kanalų rezervavimo algoritmą. Iš pradžių buvo gedimų tiek BMS sistemos pusėje, tiek virtualių mašinų ir tinklo nustatymo pusėje. Šis derinimas taip pat užtruko. Laimei, rangovui buvo suteikta bandomoji platforma debesų paslaugos pavidalu, kurioje iš pradžių buvo išbandyti visi nustatymai ir naujovės.
  • Trečia, gautą sistemą galutiniam vartotojui buvo sunkiau redaguoti. Jei anksčiau žemėlapį sudarė fonas (grafinis failas) ir piktogramos, kurias buvo lengva keisti ar perkelti, tai dabar tai sudėtinga grafinė sąsaja su animacija, kuriai reikia tam tikrų redagavimo įgūdžių.

Radikalus mūsų BMS sistemos atnaujinimas jau dabar gali būti vadinamas svarbiausiu praėjusių metų projektu, kuris ateityje rimtai paveiks mūsų aikštelių operatyvaus valdymo kokybę. 

Mes, žinoma, neišmetėme senojo geležinio serverio, o „palengvinome“: išvalėme jį nuo tūkstančių „komercinių“ virtualių jutiklių ir PDU ir palikome jame tik kelias dešimtis svarbiausių įrenginių, tokių kaip dyzelinas. generatorių komplektai, UPS, oro kondicionieriai, siurbliai, nuotėkio jutikliai ir temperatūros Šiame režime grįžo buvęs greitis ir jis gali būti „rezervas“. Beje, nuėmę PDU iš seno BMS, atlaisvinome apie 1000 dabar jau nereikalingų licencijų, gal žinote ką su jomis daryti?

Šaltinis: www.habr.com

Добавить комментарий