Monitoring in u data center: cumu avemu cambiatu u vechju BMS à u novu. Parte 3

Cuntinuemu a nostra storia nantu à cumu avemu cambiatu u sistema BMS in i nostri centri di dati (parte di 1, parte di 2). À u listessu tempu, ùn avemu micca solu scambià a suluzione di un venditore per un altru, ma hà sviluppatu un sistema da zero per adattà à i nostri bisogni. À a fine di a nostra storia, spartemu i risultati di u travagliu fattu è suluzioni interessanti chì ponu esse utili per voi.

Nova interfaccia

Quì, cum'è dicenu, hè megliu per vede una volta.

Monitoring in u data center: cumu avemu cambiatu u vechju BMS à u novu. Parte 3Racks.

Fighjemu e sfarenze.

  • U primu hè красиво convenientemente. Avvisate quantu hè diventatu faciule per seguità i carichi nantu à i moduli PDU ("Banchi" o semplicemente "Banchi") è a somma di carichi paralleli di moduli accoppiati. Nantu à u mudellu di rack da u novu BMS, vedemu immediatamente chì i moduli PDU più bassi sò sovraccarichi (u currente tutale hè più altu ch'è u 16A permissibile - notificazione "blu"), è i superiori sò sottumessi. Se unu di l'inputs hè disconnected, tutta a carica sarà trasfiruta à u sicondu, è u modulu più bassu chì ferma energizatu si spegnerà per via di a sobrecarga. Per impediscenu chì questu succede, u serviziu di supportu di u centru di dati avvisarà u cliente in anticipu è mandà una ricunniscenza nantu à cumu ridistribuisce a carica.
  • Facile aghjuntu di l'equipaggiu. In u novu BMS, i sensori virtuali per i sume di i currenti di moduli è a putenza di u rack sò digià aghjuntu à mudelli di rack standard è sò creati automaticamente dopu l'aghjunghje una PDU à u rack. In u vechju BMS, anu da esse creati manualmente è poi trascinati nantu à a mappa, chì hà aumentatu a probabilità di errore per u "fattore umanu".
  • Scopu illimitatu per a creatività. Avà ùn avemu micca restrizioni quandu creanu sensori virtuali. Pudete custruisce assolutamente qualsiasi mudelli matematichi di ogni variabile. Questu significa chì avemu a capacità di creà sensori virtuali cumplessi (previamente pudemu aghjunghje solu valori) è analizà megliu statistiche è tendenzi in u rendiment di i sistemi di ingegneria. Questu migliurà a qualità di e decisioni prese in quantu à a cunfigurazione di u sistema, a sustituzione di l'equipaggiu, è a gestione di risorse. 
  • Interfaccia intuitiva. In a nova interfaccia ùn ci hè micca un disordine di icone, i fan giranu, cambia "cliccate". È a cosa più còmuda hè a capacità di indicà u statutu di PDU Line A / B in i rack. Avemu pruvatu à fà qualcosa simili in l'antica BMS, ma u numeru di icone fusionati per centimetru quadru di a mappa ci hà obligatu à abbandunà.

Avà hè piacevule à vede:

Monitoring in u data center: cumu avemu cambiatu u vechju BMS à u novu. Parte 3
Servitore.

Monitoring in u data center: cumu avemu cambiatu u vechju BMS à u novu. Parte 3
Frammentu di u centralinu principale.

Monitoring in u data center: cumu avemu cambiatu u vechju BMS à u novu. Parte 3
Pannellu di cuntrollu di ventilazione.

È u novu BMS pò esse decoratu per l'annu novu :)
Monitoring in u data center: cumu avemu cambiatu u vechju BMS à u novu. Parte 3

Una pagina - cunniscenza mutuale senza una parolla è senza specificazioni tecniche

Per un tempu assai longu avemu vulutu implementà un altru "truccu" in BMS: per cumpilà i paràmetri principali di u centru di dati in una pagina, cusì chì un sguardu à u screnu hè abbastanza per valutà u statutu di i sistemi principali. Tuttavia, ùn avemu micca capitu cumplettamente ciò chì deve esse.

Ancu prima di u sviluppu di u novu BMS hà cuminciatu, avemu visitatu una decina di centri di dati in l'Olanda in escursioni. Unu di i scopi era di vede esempi di l'implementazione di una tale pagina.

È nimu un centru di dati ci hà dimustratu - in certi ùn era micca quì, in altri era "sviluppatu avà", in altri era un "grande sicretu cummerciale". Dunque, in i nostri termini di riferimentu per a creazione di un novu BMS, ùn ci era micca una descrizzione precisa di sta pagina assai impurtante per noi.

In u risultatu, l'avemu ghjuntu literalmente "à a mosca". Solu in quellu mumentu aghju avutu à cunsultà remotamente i culleghi in u centru di dati. Era assai inconveniente per scorrere e pagine di BMS nantu à u telefunu in cerca di dati spargugliati, è in fattu a prima versione hè stata sketched nantu à un napkin. Una pagina. Hè stata implementata da i sviluppatori basatu nantu à a foto. 

In seguitu à l'esempiu di i nostri prudenti culleghi Olandesi, ùn avemu micca dimustrà a versione finale di a nostra pagina principale, soprattuttu chì ogni centru di dati hè unicu è ùn ci hè nunda di cupià. Ma descrivimu dui principii principali di a so furmazione:

  1. Questa hè una tavula pensata per adattà u formatu di una pantalla di smartphone verticale (o un monitor, ma mantenendu un layout verticale), cù tutte l'infurmazioni impurtanti affissate nantu à una schermu. Sopra à a tavula hè un "summaru" di incidenti attivi, cusì era più còmuda di mette inseme in un formatu verticale. 
  2. L'arrangementu di e cellule in a tavula seguita l'architettura di u centru di dati (fisica o logica). Abandunamu l'arrangiamentu di i sistemi in ordine alfabeticu, cum'è saria desideratu à u primu sguardu. A sequenza riflette l'associazioni visuale di u persunale di u centru di dati - cum'è s'ellu era fisicu monitoraghju tutte e camere è i sistemi. Questu facenu più faciule per truvà l'infurmazioni.

In fatti, avà assulutamente tutte e caratteristiche chjave di u centru di dati sò raggruppati è presentati nantu à una schermu di u smartphone / monitor di l'ingegnere è u manager rispunsevuli, mentre chì u ligame cù a topografia fisica è logica di u centru di dati hè implementatu. 

Eccu una foto di quellu primu prughjettu, ancu s'ellu, sicuru, allora sta versione hè stata ripensata è finalizzata.

Monitoring in u data center: cumu avemu cambiatu u vechju BMS à u novu. Parte 3

Ricunniscenza è riassuntu di l'incidentu

Parlemu di un altru cuncettu novu per noi, chì hè ghjuntu in u risultatu di u prughjettu di aghjurnà u sistema di surviglianza.

Handshake hè un termini piuttostu raru chì hè statu prupostu da u sviluppatore di u novu BMS. Significa cunferma chì l'operatore hà vistu l'incidentu, l'hà ricunnisciutu è accettatu e rispunsabilità per risolve.  

A parolla hè appiccicata, è avà "ricunnoscemu" incidenti.

L'algoritmu inclusu in a versione basica di u novu BMS ùn ci cunvene micca. In fatti, questi eranu cumenti à u logu di l'avvenimenti, vale à dì, incidenti risolti ùn anu micca sparitu da u logu, è accettati ("ricunnisciutu") ùn sò micca stati sorte da novi.

In u risultatu, hè stata sviluppata una finestra chjamata "sommariu", in quale:

  1. Solu incidenti attivi è dispusitivi in ​​modu di serviziu sò visualizati (senza notificazioni blu cummerciale).
  2. Ci hè una distinzione chjara trà incidenti NEW è ACCEPTED.
  3. Hè indicatu quale hà accettatu l'incidentu.

L'algoritmu di travagliu per l'ufficiali in u novu BMS hè u seguente:

  1. I novi incidenti sò inclusi in u rapportu è aspettanu a ricunniscenza. Ùn ponu micca stà in questa sezione per un bellu pezzu; a persona di turnu per l'equipaggiu deve immediatamente piglià in contu l'incidentu.
  2. L'impiigatu assume a rispunsabilità di l'incidentu clicchendu nantu à a marca di spunta à a diritta. Siccomu tutti l'impiegati sò sottu cunti unichi, si vede automaticamente quale hà accettatu l'incidentu. Se necessariu, lasciate un cumentu.
  3. L'incidentu hè spustatu à a sezione "Ricunnisciutu", u restu di l'ufficiali di u duvere è u manager capiscenu chì l'incidentu hè trattatu da l'impiigatu rispunsevule.

Monitoring in u data center: cumu avemu cambiatu u vechju BMS à u novu. Parte 3
Esempiu di una finestra di riassuntu cù un missaghju novu è digià ricunnisciutu.

Cunnettendu a finestra di riassuntu cù a tavola Una pagina, avemu un pienu schermu principale Sistema BMS, induve pudete vede immediatamente: 

  • cundizione di i sistemi principali di u centru di dati;
  • prisenza di novi incidenti senza prucessu;
  • a prisenza di incidenti accettati è infurmazioni nantu à quale l'elimina specificamente.

Accessu à u navigatore è avvisi pop-up di u telefunu

L'interfaccia web, accessibile da ogni dispositivu da ogni locu in u mondu, hè un cuntrastu forte cù u cliente "grossu", chì hè cumplettamente chjusu à l'utilizatori esterni. 

L'approcciu anticu implicava una varietà di inconvenienti, da i prublemi in l'urganizazione di u travagliu remoto per u seguimentu di l'impiegati di u serviziu à a necessità di installà i clienti "grossi" da i kit di distribuzione in stazioni di travagliu di u persunale in u centru di dati.

Avà ogni pagina in BMS hà un indirizzu unicu, chì vi permette di sparte micca solu l'indirizzu direttu di a pagina o di u dispositivu, ma ancu ligami à grafici / rapporti unichi. 

L'accessu à u sistema hè avà realizatu per mezu di l'autentificazione LDAP attraversu Active Directory, chì aumenta u so livellu di sicurità. 

A mobilità oghje hè un fattore chjave in u travagliu di qualità di l'ingegneri di serviziu. In più di u monitoraghju di u monitoraghju in a sala di turnu, l'ingegneri facenu turni, facenu un travagliu di rutina fora di a "stanza di duty" è, grazia à a pantalla principale BMS ottimizzata per i schermi mobili, ùn perde micca u cuntrollu di ciò chì succede in e camere di turbine ancu. per una seconda. 

A qualità di cuntrollu hè ancu migliurata grazia à a funziunalità di i chats di travagliu. Acceleranu i prucessi di travagliu chì permettenu a currispundenza di l'ingegneri di serviziu per esse "ligati" à u BMS. Per esempiu, usemu l'applicazione Teams, chì vi permette di guidà a currispundenza interna è riceve tutti i missaghji da u BMS in u vostru telefunu in forma di notificazioni Push pop-up, chì elimina a necessità per l'ufficiale di guardia di fighjà constantemente u telefunu. schermu.

Monitoring in u data center: cumu avemu cambiatu u vechju BMS à u novu. Parte 3
 Push notificazione nantu à u screnu di u smartphone.

Monitoring in u data center: cumu avemu cambiatu u vechju BMS à u novu. Parte 3
Eccu cumu si vede e notificazioni in l'app Teams.

À u listessu tempu, e notificazioni pop-up sò cunfigurate solu per i missaghji nantu à l'occurrence di incidenti, minimizendu cusì u fattore di distrazione; u persunale sapi: se una Notificazione Push di Teams appare nantu à a pantalla di u smartphone, allora deve andà à a pagina BMS. è accettà l'incidentu. I missaghji di risoluzione di incidenti sò tracciati nantu à a pagina BMS.

Monitoring in u data center: cumu avemu cambiatu u vechju BMS à u novu. Parte 3
A foto mostra l'interfaccia BMS in un smartphone.

Per sintetizà

Mentre chì u costu di l'aghjurnamentu di un BMS da u nostru vechju venditore era paragunabile à u sviluppu di un novu sistema da zero (circa $ 100), a diferenza in a funziunalità di i prudutti hè stata colossale. Avemu ricevutu un sistema flexible ottimizzatu per i nostri travaglii è prucessi di cummerciale. Avemu ancu ottenutu un risparmiu significativu in u supportu di u sistema continuu è i costi di l'aghjurnamentu. 

Ma, sicuru, ci sò stati difficultà. 

  • Prima, avemu sottovalutatu a quantità di cambiamenti chì deve esse fatta à a versione di basa di u novu BMS è ùn hà micca scuntratu i termini pre-accordu. Per noi, questu ùn era micca un prublema criticu, postu chì eramu assicurati finu à l'ultimu minutu è travagliendu nantu à u vechju sistema, è u prucessu era criativu, cumplessu è per quessa, qualchì volta andava più lento di l'espertu. Inoltre, avemu sempre vistu chì u nostru sviluppatore face ogni sforzu per ottene u megliu risultatu. Ma in fattu, a storia hè stata assai longa, è i nostri specialisti chjave anu passatu assai più sforzu è tempu nantu à questu ch'elli avianu previstu. 
  • Siconda, avemu bisognu di parechje tappe di teste per debug l'algoritmu per riservà e macchine virtuali è i canali di cumunicazione. Inizialmente, ci sò stati fallimenti sia da u latu di u sistema BMS sia da u latu di a stallazione di e macchine virtuali è a reta. Stu debugging hà pigliatu ancu tempu. Fortunatamente, u cuntrattu hè statu furnitu cù una piattaforma di teste in forma di serviziu di nuvola, induve tutti i paràmetri è l'innuvazioni sò stati inizialmente pruvati.
  • Terzu, u sistema risultatu hè diventatu più difficiuli di edità da l'utilizatori finali. Se prima una mappa era custituita da un fondo (file graficu) è icone chì eranu faciuli di cambià o spustà, avà hè una interfaccia grafica cumplessa cù animazione chì richiede certe capacità di edizione.

L'aghjurnamentu radicali di u nostru sistema BMS pò digià esse chjamatu u prughjettu più impurtante di l'annu passatu, chì affetterà seriamente a qualità di a gestione operativa di i nostri siti in u futuru. 

Di sicuru, ùn avemu micca cacciatu u vechju servitore di ferru, ma "l'alleggeremu": l'avemu sguassatu di millaie di sensori virtuali "cummerciali" è PDU è lasciamu in questu solu una pochi decine di i dispositi più critichi, cum'è u diesel. gruppi elettrogeni, UPS, climatizzatori, pompe, sensori di fuga e temperature In questu modu, a so prima velocità hè tornata, è pò esse una "riserva di riserva". A propositu, dopu avè sguassatu u PDU da u vechju BMS, avemu liberatu circa 1000 licenze innecessarii avà, avete da sapè chì fà cun elli?

Source: www.habr.com

Add a comment