Monitoraggio nel data center: come abbiamo sostituito il vecchio BMS con uno nuovo. Parte 1

Monitoraggio nel data center: come abbiamo sostituito il vecchio BMS con uno nuovo. Parte 1

Cos'è il BMS

Il sistema di monitoraggio per il funzionamento dei sistemi di ingegneria in un data center è un elemento chiave dell'infrastruttura, che influisce direttamente su un indicatore così importante per un data center come la velocità di risposta del personale alle situazioni di emergenza e, di conseguenza, la durata del funzionamento ininterrotto. 

I sistemi di monitoraggio BMS (Building Monitoring System) sono offerti da molti fornitori globali di apparecchiature per data center. Durante il lavoro del Linxdatacenter in Russia, abbiamo avuto l'opportunità di conoscere diversi sistemi e di incontrare approcci diametralmente opposti dei fornitori al funzionamento di questi sistemi. 

Ti raccontiamo come abbiamo aggiornato completamente il nostro sistema BMS nell'ultimo anno e perché.  

Radice del problema

Tutto è iniziato 10 anni fa con il lancio del data center Linxdatacenter a San Pietroburgo. Il sistema BMS, secondo gli standard di settore di quegli anni, era un server fisico con software installato, a cui si accedeva tramite un programma client (il cosiddetto “thick” client). 

All’epoca erano poche le aziende che offrivano tali soluzioni sul mercato. I loro prodotti erano lo standard, l’unica risposta ad un bisogno esistente. E dobbiamo rendergli merito: sia allora che oggi, i leader di mercato generalmente svolgono il loro compito fondamentale: fornire soluzioni funzionali per i data center operativi. 

La scelta logica per noi è stata la soluzione BMS di uno dei maggiori produttori mondiali. Il sistema selezionato a quel tempo soddisfaceva tutti i requisiti per il monitoraggio di una struttura ingegneristica complessa, come un data center. 

Tuttavia, nel tempo, i requisiti e le aspettative degli utenti (ovvero noi operatori di data center) nei confronti delle soluzioni IT sono cambiati. E i grandi fornitori, come ha dimostrato un'analisi del mercato delle soluzioni proposte, non erano pronti per questo.

Il mercato IT aziendale ha subito una forte influenza dal settore B2C. Le soluzioni digitali oggi devono fornire un'esperienza confortevole per l'utente finale: questo è l'obiettivo che gli sviluppatori si prefiggono. Ciò è evidente nei miglioramenti apportati alle interfacce utente (UI) e all'esperienza utente (UX) di molte applicazioni aziendali. 

Una persona si abitua al comfort di tutto ciò che riguarda gli strumenti digitali nella vita di tutti i giorni e pone le stesse esigenze sugli strumenti che utilizza per le attività lavorative. Le persone si aspettano dalle applicazioni aziendali la stessa visibilità, intuitività, semplicità e trasparenza di cui dispongono nei servizi finanziari, nelle chiamate ai taxi o negli acquisti online. Anche gli specialisti IT che implementano soluzioni in un ambiente aziendale si sforzano di ricevere tutte le "chicche" moderne: semplice implementazione e scalabilità, tolleranza agli errori e possibilità di personalizzazione illimitate. 

I grandi fornitori internazionali spesso trascurano queste tendenze. Facendo affidamento sulla loro autorità di lunga data nel settore, le aziende spesso si rivelano categoriche e inflessibili quando lavorano con i clienti. L'illusione della propria indispensabilità non consente loro di vedere come le giovani aziende tecnologiche appaiono letteralmente sotto il loro naso, offrendo soluzioni alternative su misura per un cliente specifico e senza pagare più del dovuto per il marchio.

Svantaggi del vecchio sistema BMS 

Per noi lo svantaggio principale della soluzione BMS obsoleta esistente era il suo funzionamento lento. L'analisi di diversi eventi in cui il personale in servizio non ha risposto abbastanza rapidamente ci ha portato a comprendere che a volte si verificava un ritardo significativo nella visualizzazione degli eventi nel BMS. Allo stesso tempo, il sistema non era sovraccarico o difettoso, semplicemente le versioni dei suoi componenti (ad esempio JAVA) erano obsolete e non potevano funzionare correttamente con le nuove versioni dei sistemi operativi senza aggiornamenti. Era possibile aggiornarli solo insieme al sistema BMS e il fornitore non forniva la continuità automatica delle versioni, ovvero per noi il processo sarebbe laborioso quasi quanto il passaggio a un nuovo sistema e la nuova soluzione manterrebbe alcuni dei difetti di quello vecchio.  

Aggiungiamo qui alcune altre “piccole cose” spiacevoli:

  1. Pagamento per la connessione di nuovi dispositivi secondo il principio “un indirizzo IP – una licenza a pagamento”; 
  2. Impossibilità di aggiornare il software senza acquistare un pacchetto di supporto (questo significa aggiornare componenti gratuiti ed eliminare errori nel programma BMS stesso);
  3. Costo elevato del supporto; 
  4. Posizione su un server "di ferro", che può fallire e ha risorse di calcolo limitate;
  5. “Ridondanza” installando un secondo server hardware con un pacchetto di licenze duplicato. Allo stesso tempo, non vi è alcuna sincronizzazione dei database tra il server principale e quello di backup, il che significa trasferimento manuale del database e un lungo periodo di transizione al backup;
  6. Client utente “thick”, inaccessibile dall'esterno, senza estensione per dispositivo mobile e possibilità di accesso remoto;
  7. Un'interfaccia web ridotta all'osso, senza schede grafiche e notifiche sonore, accessibile dall'esterno, ma praticamente non utilizzata dai dipendenti per la mancanza di informazioni;
  8. Mancanza di animazione nell'interfaccia: tutta la grafica è costituita solo da un'immagine di "sfondo" e da icone statiche. Il risultato è un livello di visibilità complessivamente basso;

    Tutto assomigliava a questo:

    Monitoraggio nel data center: come abbiamo sostituito il vecchio BMS con uno nuovo. Parte 1

    Monitoraggio nel data center: come abbiamo sostituito il vecchio BMS con uno nuovo. Parte 1

  9. Una limitazione nella creazione di sensori virtuali è che è disponibile solo la funzione di addizione, mentre i modelli di sensori reali richiedono la capacità di eseguire una serie di operazioni matematiche per calcoli corretti che riflettono la realtà del funzionamento; 
  10. Impossibilità di ottenere dati in tempo reale o dall'archivio per qualsiasi scopo (ad esempio, per la visualizzazione nell'account personale del cliente);
  11. Totale mancanza di flessibilità e capacità di modificare qualsiasi cosa nel BMS per adattarlo ai processi del data center esistenti. 

Requisiti per un nuovo sistema BMS

Tenendo conto di quanto sopra, i nostri requisiti principali erano i seguenti:

  1. Due macchine indipendenti reciprocamente ridondanti con sincronizzazione automatica, in esecuzione su due diverse piattaforme cloud in diversi data center (nel nostro caso, Linxdatacenter San Pietroburgo e data center Mosca);
  2. Aggiunta gratuita di nuovi dispositivi;
  3. Aggiornamenti gratuiti del software e dei suoi componenti (ad eccezione dei miglioramenti funzionali);
  4. Codice open source, che ci consente di supportare autonomamente il sistema in caso di problemi da parte dello sviluppatore;
  5. La possibilità di ricevere e utilizzare dati dal BMS, ad esempio, su un sito web o nel tuo account personale;
  6. Accesso tramite browser WEB senza Thick Client;
  7. Utilizzo degli account dei dipendenti del dominio per accedere a BMS;
  8. Disponibilità di animazioni e tanti altri piccoli e meno piccoli desideri che si sono concretizzati in una dettagliata scheda tecnica.

L'ultima goccia

Monitoraggio nel data center: come abbiamo sostituito il vecchio BMS con uno nuovo. Parte 1

Nel momento in cui ci siamo resi conto che il data center era troppo grande per il suo BMS, la soluzione più ovvia ci è sembrata aggiornare il sistema esistente. "Non cambiano i cavalli a metà strada", giusto? 

Tuttavia, le grandi aziende, di norma, non offrono modifiche personalizzate alle loro soluzioni “raffinate” vecchie di decenni e vendute in dozzine di paesi. Mentre le giovani aziende testano un'idea o un prototipo di un prodotto futuro su potenziali consumatori e fanno affidamento sul feedback degli utenti per sviluppare il prodotto, le aziende continuano a vendere licenze per un prodotto una volta davvero interessante, ma, ahimè, oggi è obsoleto e inflessibile.

E noi stessi abbiamo sentito la differenza nell'approccio. Durante la corrispondenza con il produttore del vecchio BMS, è apparso subito chiaro che l'aggiornamento del sistema esistente proposto dal venditore avrebbe effettivamente comportato per noi l'acquisto di un nuovo sistema con trasferimento semiautomatico del database, costi elevati e insidie ​​durante il processo trasferimento, che nemmeno il produttore stesso poteva prevedere. Naturalmente, in questo caso, il costo del supporto tecnico per la soluzione aggiornata è aumentato ed è rimasta la necessità di acquistare licenze durante l'espansione.

E la cosa più spiacevole è che il nuovo sistema non è riuscito a soddisfare pienamente le nostre esigenze di prenotazione. Il sistema BMS aggiornato poteva essere implementato, come volevamo, su una piattaforma cloud, il che ci permetterebbe di abbandonare l'hardware, ma l'opzione di ridondanza non era inclusa nel prezzo. Per eseguire il backup dei dati dovremmo acquistare un secondo server virtuale BMS e un set aggiuntivo di licenze. Considerando che il costo di una licenza è di circa 76 dollari e il numero di indirizzi IP è di 1000 unità, si aggiungono fino a 76 dollari di spese aggiuntive solo per le licenze per la macchina di backup. 

La “ciliegina sulla torta” della nuova versione di BMS è stata la necessità di acquistare licenze aggiuntive “per tutti i dispositivi” – anche per il server principale. Qui è necessario chiarire che esistono dispositivi collegati al BMS tramite gateway. Il gateway ha un indirizzo IP, ma controlla diversi dispositivi (10 in media). Nel vecchio BMS, ciò richiedeva una licenza per indirizzo IP del gateway, le statistiche erano più o meno queste: “1000 indirizzi IP/licenze, 1200 dispositivi”. Il BMS aggiornato funzionava secondo un principio diverso e le statistiche sarebbero simili a queste: “1000 indirizzi IP, 1200 dispositivi/licenze”. Cioè, il venditore nella nuova versione ha cambiato il principio di assegnazione delle licenze e abbiamo dovuto acquistare circa 200 licenze in più. 

Il budget di “aggiornamento” in definitiva consisteva in quattro punti: 

  • costo della versione cloud e servizi di migrazione ad essa; 
  • licenze aggiuntive al pacchetto esistente per dispositivi connessi tramite gateway;
  • costo della versione cloud di backup;  
  • una serie di licenze per la macchina di backup. 

Il costo totale del progetto è stato di oltre $ 100! Per non parlare della necessità di acquistare in futuro licenze per nuovi dispositivi.

Di conseguenza, ci siamo resi conto che sarebbe stato più facile per noi - e forse anche più economico - ordinare un sistema creato da zero, tenendo conto di tutte le nostre esigenze e prevedendo la possibilità di ammodernamento in futuro. Ma coloro che volevano sviluppare un sistema così complesso dovevano ancora essere trovati, confrontato le proposte, selezionati e con il finalista percorso il percorso dalle specifiche tecniche all'implementazione... Leggete di questo molto presto nella seconda parte del materiale. 

Fonte: habr.com

Aggiungi un commento