Monitorings datu centrā: kā mēs nomainījām veco BMS pret jaunu. 3. daļa

Mēs turpinām stāstu par to, kā mainÄ«jām BMS sistēmu savos datu centros (1. daļa, 2. daļa). Tajā paŔā laikā mēs nevis vienkārÅ”i apmainÄ«jām viena pārdevēja risinājumu pret citu, bet gan izstrādājām sistēmu no jauna, lai tā atbilstu mÅ«su prasÄ«bām. Stāsta beigās dalāmies ar paveiktā darba rezultātiem un interesantiem risinājumiem, kas var noderēt Jums.

Jauns interfeiss

Šeit, kā saka, labāk ir redzēt vienu reizi.

Monitorings datu centrā: kā mēs nomainījām veco BMS pret jaunu. 3. daļaStatīvi.

Apskatīsim atŔķirības.

  • Pirmkārt, tā ir ŠŗрŠ°ŃŠøŠ²Š¾ ērti. Ievērojiet, cik viegli ir kļuvis izsekot PDU moduļu slodzei (ā€œBankasā€ vai vienkārÅ”i ā€œBankasā€) un pārÄ« savienoto moduļu paralēlo slodžu summai. Jaunā BMS statÄ«va modelÄ« mēs uzreiz redzam, ka apakŔējie pārÄ« savienotie PDU moduļi ir pārslogoti (kopējā strāva ir lielāka par pieļaujamo 16A - ā€œzilaisā€ paziņojums), bet augŔējie ir nepietiekami noslogoti. Ja viena no ieejām tiek atvienota, visa slodze tiks pārsÅ«tÄ«ta uz otro, un pārslodzes dēļ izslēgsies apakŔējais modulis, kas paliek strāva. Lai tas nenotiktu, datu centra atbalsta dienests jau iepriekÅ” brÄ«dinās klientu un nosÅ«tÄ«s ieteikumu, kā pārdalÄ«t slodzi.
  • Viegla aprÄ«kojuma pievienoÅ”ana. Jaunajā BMS virtuālie sensori moduļu strāvu summām un statÄ«va jaudas summām jau ir pievienoti standarta statÄ«va veidnēm un tiek izveidoti automātiski pēc PDU pievienoÅ”anas statÄ«vam. Vecajā BMS tie bija jāizveido manuāli un pēc tam jāievelk kartē, kas palielināja kļūdu iespējamÄ«bu ā€œcilvēciskā faktoraā€ dēļ.
  • Neierobežotas iespējas radoÅ”umam. Tagad mums nav ierobežojumu, veidojot virtuālos sensorus. JÅ«s varat izveidot absolÅ«ti jebkurus matemātiskos modeļus no jebkura mainÄ«gā. Tas nozÄ«mē, ka mums ir iespēja izveidot sarežģītus virtuālos sensorus (iepriekÅ” varējām pievienot tikai vērtÄ«bas) un labāk analizēt statistiku un tendences inženiersistēmu darbÄ«bā. Tas uzlabo pieņemto lēmumu kvalitāti attiecÄ«bā uz sistēmas konfigurāciju, aprÄ«kojuma nomaiņu un resursu pārvaldÄ«bu. 
  • IntuitÄ«vs interfeiss. Jaunajā saskarnē nav ikonu jucekli, ventilatori griežas, slēdži ā€œklikŔķā€. Un visērtākā lieta ir iespēja norādÄ«t PDU Line A/B statusu plauktu iekÅ”pusē. Mēģinājām kaut ko lÄ«dzÄ«gu darÄ«t vecajā BMS, taču sapludināto ikonu skaits uz vienu kartes kvadrātcentimetru lika no tā atteikties.

Tagad ir patīkami skatīties:

Monitorings datu centrā: kā mēs nomainījām veco BMS pret jaunu. 3. daļa
Serveris.

Monitorings datu centrā: kā mēs nomainījām veco BMS pret jaunu. 3. daļa
Galvenā sadales paneļa fragments.

Monitorings datu centrā: kā mēs nomainījām veco BMS pret jaunu. 3. daļa
Ventilācijas vadības panelis.

Un jauno BMS var izrotāt uz Jauno gadu :)
Monitorings datu centrā: kā mēs nomainījām veco BMS pret jaunu. 3. daļa

Viena lapa ā€“ savstarpēja sapratne bez vārda un bez tehniskām specifikācijām

Ä»oti ilgu laiku vēlējāmies BMS ieviest vēl vienu ā€œtrikuā€: datu centra galvenos parametrus apkopot vienā lapā, lai pietiktu ar vienu skatienu ekrānā, lai novērtētu galveno sistēmu stāvokli. Tomēr mēs lÄ«dz galam nesapratām, kā tam vajadzētu izskatÄ«ties.

Pat pirms jaunā BMS izstrādes sākuma mēs apmeklējām duci datu centru NÄ«derlandē ekskursijās. Viens no mērÄ·iem bija aplÅ«kot piemērus Ŕādas lapas ievieÅ”anai.

Un ne viens vien datu centrs mums to neparādÄ«ja - dažos tā nebija, citos tas ā€œpatlaban tika izstrādātsā€, citos tas bija ā€œliels komercnoslēpumsā€. Tāpēc mÅ«su darba uzdevumā par jaunas BMS izveidi nebija precÄ«za apraksta par Å”o mums ļoti svarÄ«go lapu.

Rezultātā mēs to izdomājām burtiski ā€œlidojumāā€. TieÅ”i tajā brÄ«dÄ« nācās attālināti konsultēt kolēģus datu centrā. Bija ļoti neērti tālrunÄ« ritināt BMS lapas, meklējot izkaisÄ«tus datus, un patiesÄ«bā pirmā versija tika uzzÄ«mēta uz salvetes. viena lapa. To Ä«stenoja izstrādātāji, pamatojoties uz fotoattēlu. 

Sekojot mÅ«su piesardzÄ«go holandieÅ”u kolēģu piemēram, mēs nedemonstrēsim savas galvenās lapas galÄ«go versiju, jo Ä«paÅ”i tāpēc, ka katrs datu centrs ir unikāls un nav jēgas to kopēt. Bet aprakstÄ«sim divus galvenos tā veidoÅ”anas principus:

  1. Å Ä« ir tabula, kas paredzēta vertikāla viedtālruņa ekrāna formātam (vai monitoram, bet saglabājot vertikālu izkārtojumu), un visa svarÄ«gā informācija tiek parādÄ«ta vienā ekrānā. Virs tabulas ir aktÄ«vo incidentu ā€œkopsavilkumsā€, tāpēc visērtāk bija tos novietot kopā vertikālā formātā. 
  2. Å Å«nu izvietojums tabulā atbilst datu centra arhitektÅ«rai (fiziskai vai loÄ£iskai). Mēs atteicāmies no sistēmu kārtoÅ”anas alfabētiskā secÄ«bā, kā tas bÅ«tu vēlams no pirmā acu uzmetiena. SecÄ«ba atspoguļo datu centra personāla vizuālās asociācijas ā€“ it kā viņi fiziski uzraudzÄ«tu visas telpas un sistēmas. Tas atvieglo informācijas atraÅ”anu.

Faktiski tagad absolÅ«ti visi galvenie datu centra raksturlielumi ir sagrupēti un parādÄ«ti atbildÄ«gā inženiera un vadÄ«tāja viedtālruņa/monitora vienā ekrānā, vienlaikus tiek realizēta sasaiste ar datu centra fizisko un loÄ£isko topogrāfiju. 

Å eit ir Ŕī paÅ”a pirmā melnraksta fotoattēls, lai gan, protams, Ŕī versija tika pārdomāta un pabeigta.

Monitorings datu centrā: kā mēs nomainījām veco BMS pret jaunu. 3. daļa

Apstiprinājuma un incidenta kopsavilkums

Parunāsim par vēl vienu mums jaunu koncepciju, kas radās monitoringa sistēmas atjaunināŔanas projekta rezultātā.

Rokasspiediens ir diezgan rets termins, ko ierosināja jaunā BMS izstrādātājs. Tas nozÄ«mē apstiprinājumu, ka operators ir redzējis incidentu, atzinis to un uzņēmies atbildÄ«bu, lai to atrisinātu.  

Vārds ir iestrēdzis, un tagad mēs ā€œatzÄ«stamā€ incidentus.

Jaunā BMS pamata versijā iekļautais algoritms mums nederēja. Faktiski tie bija komentāri notikumu žurnālam, proti, atrisinātie incidenti no žurnāla nepazuda, un pieņemtie (ā€œapstiprinātieā€) netika Ŕķiroti no jaunajiem.

Rezultātā tika izveidots logs ar nosaukumu ā€œkopsavilkumsā€, kurā:

  1. Tiek parādīti tikai aktīvie incidenti un ierīces servisa režīmā (nav komerciālu zilu paziņojumu).
  2. Ir skaidri noŔķirti JAUNI un PIEŅEMTI incidenti.
  3. Tiek norādÄ«ts, kurÅ” notikuÅ”o pieņēmis.

Dežurantu darba algoritms jaunajā BMS ir Ŕāds:

  1. Jauni incidenti ir iekļauti ziņojumā un gaida apstiprinājumu. Viņi nevar uzturēties Å”ajā sadaļā ilgu laiku, personai, kas dežurē par aprÄ«kojumu, nekavējoties jāuzņemas atbildÄ«ba par incidentu.
  2. Darbinieks uzņemas atbildÄ«bu par notikuÅ”o, noklikŔķinot uz atzÄ«mes labajā pusē. Tā kā visiem darbiniekiem ir unikāli konti, automātiski tiek parādÄ«ts, kurÅ” pieņēma incidentu. Ja nepiecieÅ”ams, atstājiet komentāru.
  3. Incidents tiek pārcelts uz sadaļu ā€œApstiprinātsā€, pārējie dežuranti un vadÄ«tājs saprot, ka ar incidentu nodarbojas atbildÄ«gais darbinieks.

Monitorings datu centrā: kā mēs nomainījām veco BMS pret jaunu. 3. daļa
Kopsavilkuma loga piemērs ar jaunu un jau apstiprinātu ziņojumu.

Savienojot kopsavilkuma logu ar vienas lapas tabulu, mēs saņēmām pilnu galvenais ekrāns BMS sistēma, kurā uzreiz var redzēt: 

  • galveno datu centra sistēmu stāvoklis;
  • jaunu neapstrādātu incidentu klātbÅ«tne;
  • pieņemto incidentu klātbÅ«tne un informācija par to, kurÅ” tos Ä«paÅ”i novērÅ”.

Piekļuve pārlÅ«kprogrammai un tālruņa uznirstoÅ”ie brÄ«dinājumi

TÄ«mekļa saskarne, kas pieejama no jebkuras ierÄ«ces no jebkuras vietas pasaulē, ir krass kontrasts ar ā€œbiezoā€ klientu, kas ir pilnÄ«bā slēgts ārējiem lietotājiem. 

Vecā pieeja radÄ«ja virkni neērtÄ«bu, sākot no problēmām, organizējot attālinātu darbu servisa darbinieku uzraudzÄ«bā, lÄ«dz nepiecieÅ”amÄ«bai datu centra personāla darbstacijās instalēt ā€œbiezuā€ klientus no izplatÄ«Å”anas komplektiem.

Tagad jebkurai lapai BMS ir unikāla adrese, kas ļauj koplietot ne tikai tieÅ”o lapas vai ierÄ«ces adresi, bet arÄ« saites uz unikāliem grafikiem/pārskatiem. 

Piekļuve sistēmai tagad tiek veikta, izmantojot LDAP autentifikāciju, izmantojot Active Directory, kas palielina tās droŔības lÄ«meni. 

Mobilitāte mÅ«sdienās ir galvenais faktors dežurējoÅ”u inženieru kvalitatÄ«vā darbā. Papildus monitoringam dežūrtelpā inženieri veic apļus, veic rutÄ«nas darbus ārpus ā€œdežūras telpasā€ un, pateicoties mobilajiem ekrāniem optimizētajam BMS galvenajam ekrānam, nezaudē kontroli pār turbÄ«nu telpās notiekoÅ”o pat. uz sekundi. 

Pateicoties darba tērzÄ“Å”anas funkcionalitātei, tiek uzlabota arÄ« vadÄ«bas kvalitāte. Tie paātrina darba procesus, ļaujot dežurējoÅ”u inženieru saraksti ā€œsaistÄ«tā€ ar BMS. Piemēram, mēs izmantojam Teams aplikāciju, kas ļauj veikt iekŔējo korespondenci un saņemt visus ziņojumus no BMS savā tālrunÄ« uznirstoÅ”o Push paziņojumu veidā, kas novērÅ” nepiecieÅ”amÄ«bu dežurantam pastāvÄ«gi skatÄ«ties uz tālruni. ekrāns.

Monitorings datu centrā: kā mēs nomainījām veco BMS pret jaunu. 3. daļa
 Push paziņojums viedtālruņa ekrānā.

Monitorings datu centrā: kā mēs nomainījām veco BMS pret jaunu. 3. daļa
Šādi paziņojumi izskatās Teams lietotnē.

Tajā paŔā laikā uznirstoÅ”ie paziņojumi tiek konfigurēti tikai ziņojumiem par incidentu raÅ”anos, tādējādi samazinot uzmanÄ«bas novērÅ”anas faktoru; darbinieki zina: ja viedtālruņa ekrānā parādās Teams Push Notification, tad viņiem jāiet uz BMS lapu un pieņemt notikuÅ”o. NegadÄ«jumu atrisināŔanas ziņojumi tiek izsekoti BMS lapā.

Monitorings datu centrā: kā mēs nomainījām veco BMS pret jaunu. 3. daļa
Fotoattēlā redzams BMS interfeiss viedtālrunī.

Summējot

Lai gan mÅ«su vecā pārdevēja BMS atjaunināŔanas izmaksas bija salÄ«dzināmas ar jaunas sistēmas izveidi no nulles (apmēram 100 000 USD), produktu funkcionalitātes atŔķirÄ«ba izrādÄ«jās milzÄ«ga. Mēs saņēmām elastÄ«gu sistēmu, kas optimizēta mÅ«su biznesa uzdevumiem un procesiem. Mēs esam arÄ« panākuÅ”i ievērojamus ietaupÄ«jumus pastāvÄ«gā sistēmas atbalsta un jaunināŔanas izmaksās. 

Bet, protams, bija grÅ«tÄ«bas. 

  • Pirmkārt, mēs nepietiekami novērtējām izmaiņu apjomu, kas bija jāveic jaunās BMS bāzes versijā, un neievērojām iepriekÅ” saskaņotos termiņus. Mums tā nebija kritiska problēma, jo bijām apdroÅ”ināti lÄ«dz pēdējam brÄ«dim un strādājām pie vecās sistēmas, un process bija radoÅ”s, sarežģīts un tāpēc dažkārt noritēja lēnāk, nekā gaidÄ«ts. Turklāt mēs vienmēr esam redzējuÅ”i, ka mÅ«su izstrādātājs pieliek visas pÅ«les, lai sasniegtu vislabāko rezultātu. Taču patiesÄ«bā stāsts izrādÄ«jās ļoti garÅ”, un mÅ«su galvenie speciālisti tam veltÄ«ja daudz vairāk pūļu un laika, nekā bija plānojuÅ”i. 
  • Otrkārt, mums bija nepiecieÅ”ami vairāki testÄ“Å”anas posmi, lai atkļūdotu algoritmu virtuālo maŔīnu un sakaru kanālu rezervÄ“Å”anai. Sākotnēji kļūmes bija gan BMS sistēmas pusē, gan virtuālo maŔīnu un tÄ«kla iestatÄ«Å”anas pusē. ArÄ« Ŕī atkļūdoÅ”ana prasÄ«ja laiku. Par laimi, izpildÄ«tājam tika nodroÅ”ināta testa platforma mākoņpakalpojuma veidā, kurā sākotnēji tika pārbaudÄ«ti visi iestatÄ«jumi un jauninājumi.
  • TreÅ”kārt, galalietotājam izrādÄ«jās grÅ«tāk rediģēt iegÅ«to sistēmu. Ja iepriekÅ” karte sastāvēja no fona (grafiskā faila) un ikonām, kuras bija viegli mainÄ«t vai pārvietot, tad tagad tā ir sarežģīta grafiskā saskarne ar animāciju, kas prasa noteiktas rediģēŔanas prasmes.

MÅ«su BMS sistēmas radikālo atjaunināŔanu jau tagad var saukt par aizvadÄ«tā gada svarÄ«gāko projektu, kas nākotnē nopietni ietekmēs mÅ«su vietņu operatÄ«vās vadÄ«bas kvalitāti. 

Mēs, protams, neizmetām veco dzelzs serveri, bet gan ā€œatvieglinājāmā€: attÄ«rÄ«jām to no tÅ«kstoÅ”iem ā€œkomerciāloā€ virtuālo sensoru un PDU un atstājām tajā tikai dažus desmitus vissvarÄ«gāko ierīču, piemēram, dÄ«zeļdegvielu. Ä£eneratoru komplekti, UPS, gaisa kondicionieri, sÅ«kņi, noplÅ«des sensori un temperatÅ«ras Å ajā režīmā viņa agrākais ātrums ir atgriezies, un viņŔ var bÅ«t "rezerves rezervists". Starp citu, pēc PDU noņemÅ”anas no vecās BMS, mēs atbrÄ«vojām apmēram 1000 tagad nevajadzÄ«gas licences, vai jÅ«s nejauÅ”i zināt, ko ar tām darÄ«t?

Avots: www.habr.com

Pievieno komentāru