Övervakning i datacentret: hur vi ersatte det gamla BMS med ett nytt. Del 3

Vi fortsätter vår berättelse om hur vi ändrade BMS-systemet i våra datacenter (Del 1, Del 2). Samtidigt bytte vi inte bara ut lösningen från en leverantör mot en annan, utan utvecklade ett system från grunden för att passa våra krav. I slutet av vår historia delar vi resultaten av det utförda arbetet och intressanta lösningar som kan vara användbara för dig.

Nytt gränssnitt

Här, som de säger, är det bättre att se en gång.

Övervakning i datacentret: hur vi ersatte det gamla BMS med ett nytt. Del 3Rack.

Låt oss titta på skillnaderna.

  • För det första, det красиво bekvämt. Lägg märke till hur lätt det har blivit att spåra lasterna på PDU-moduler ("Banker" eller helt enkelt "Banker") och summan av parallella laster av parade moduler. På rackmodellen från den nya BMS ser vi omedelbart att de nedre parade PDU-modulerna är överbelastade (den totala strömmen är högre än den tillåtna 16A - "blå" avisering), och de övre är underbelastade. Om en av ingångarna kopplas bort kommer hela lasten att överföras till den andra, och den nedre modulen som förblir spänningssatt kommer att stängas av på grund av överbelastning. För att förhindra att detta händer kommer datacentrets supporttjänst att varna klienten i förväg och skicka en rekommendation om hur man omfördelar lasten.
  • Enkelt att lägga till utrustning. I det nya BMS är virtuella sensorer för summor av modulströmmar och rackeffekt redan lagt till standardrackmallar och skapas automatiskt efter att en PDU lagts till i racket. I det gamla BMS var de tvungna att skapas manuellt och sedan dras in på kartan, vilket ökade sannolikheten för fel på grund av den "mänskliga faktorn".
  • Obegränsat utrymme för kreativitet. Nu har vi inga begränsningar när vi skapar virtuella sensorer. Du kan bygga absolut vilka matematiska modeller som helst av alla variabler. Detta innebär att vi har förmågan att skapa komplexa virtuella sensorer (tidigare kunde vi bara lägga till värden) och bättre analysera statistik och trender i prestanda hos tekniska system. Detta förbättrar kvaliteten på beslut som fattas om systemkonfiguration, utbyte av utrustning och resurshantering. 
  • Tydligt gränssnitt. I det nya gränssnittet finns det inget rörigt med ikoner, fansen snurrar, växlarna "klickar". Och det mest bekväma är möjligheten att indikera status för PDU Line A/B inuti racken. Vi försökte göra något liknande i det gamla BMS, men antalet sammanslagna ikoner per kvadratcentimeter av kartan tvingade oss att överge det.

Nu är det trevligt att titta på:

Övervakning i datacentret: hur vi ersatte det gamla BMS med ett nytt. Del 3
Server.

Övervakning i datacentret: hur vi ersatte det gamla BMS med ett nytt. Del 3
Fragment av huvudväxeln.

Övervakning i datacentret: hur vi ersatte det gamla BMS med ett nytt. Del 3
Kontrollpanel för ventilation.

Och det nya BMS kan dekoreras till det nya året  🙂
Övervakning i datacentret: hur vi ersatte det gamla BMS med ett nytt. Del 3

En sida – ömsesidig förståelse utan ett ord och utan tekniska specifikationer

Under mycket lång tid ville vi implementera ett annat "trick" i BMS: att kompilera huvudparametrarna för datacentret på en sida, så att en blick på skärmen skulle räcka för att bedöma statusen för huvudsystemen. Vi förstod dock inte helt hur det skulle se ut.

Redan innan utvecklingen av det nya BMS började besökte vi ett dussintal datacenter i Nederländerna på utflykter. Ett av målen var att se exempel på implementeringen av en sådan sida.

Och inte ett enda datacenter visade det för oss - i vissa fanns det inte där, i andra "utvecklades det just nu", i andra var det en "stor affärshemlighet". Därför fanns det ingen exakt beskrivning av denna mycket viktiga sida för oss i våra referensvillkor för skapandet av ett nytt BMS.

Som ett resultat kom vi på det bokstavligen "i farten." Just i det ögonblicket var jag tvungen att konsultera kollegor på distans i datacentret. Det var väldigt obekvämt att bläddra igenom BMS-sidorna på telefonen på jakt efter spridd data, och faktiskt skissades den första versionen på en servett En sida. Det implementerades av utvecklarna baserat på bilden. 

Efter exemplet från våra försiktiga holländska kollegor kommer vi inte att demonstrera den slutliga versionen av vår huvudsida, särskilt eftersom varje datacenter är unikt och det är ingen idé att kopiera det. Men låt oss beskriva två huvudprinciper för dess bildande:

  1. Detta är en tabell utformad för att passa formatet på en vertikal smartphoneskärm (eller en bildskärm, men med en vertikal layout), med all viktig information som visas på en skärm. Ovanför tabellen finns en "sammanfattning" av aktiva incidenter, så det var lämpligast att placera dem tillsammans i ett vertikalt format. 
  2. Arrangemanget av celler i tabellen följer datacentrets arkitektur (fysisk eller logisk). Vi övergav arrangemanget av system i alfabetisk ordning, vilket vore önskvärt vid första anblicken. Sekvensen speglar de visuella associationerna hos datacenterpersonal - som om de fysiskt övervakade alla rum och system. Detta gör det lättare att hitta information.

Faktum är att nu absolut alla nyckelegenskaper hos datacentret är grupperade och presenterade på en skärm på smartphonen/monitorn för den ansvariga ingenjören och chefen, samtidigt som länkning till datacentrets fysiska och logiska topografi implementeras. 

Här är ett foto av det allra första utkastet, även om den här versionen naturligtvis omarbetades och slutfördes.

Övervakning i datacentret: hur vi ersatte det gamla BMS med ett nytt. Del 3

Bekräftelse och incidentsammanfattning

Låt oss prata om ett annat nytt koncept för oss, som uppstod som ett resultat av projektet att uppdatera övervakningssystemet.

Handslag är en ganska sällsynt term som föreslogs av utvecklaren av det nya BMS. Det innebär en bekräftelse på att operatören såg incidenten, bekräftade den och tog ansvar för att lösa den.  

Ordet har fastnat och nu "erkänner" vi incidenter.

Algoritmen som ingår i grundversionen av nya BMS passade inte oss. I själva verket var dessa kommentarer till händelseloggen, det vill säga lösta incidenter försvann inte från loggen, och accepterade (”erkända”) sorterades inte från nya.

Som ett resultat utvecklades ett fönster som heter "sammanfattning", där:

  1. Endast aktiva incidenter och enheter i serviceläge visas (inga kommersiella blå meddelanden).
  2. Det finns en tydlig skillnad mellan NYA och ACCEPTERADE incidenter.
  3. Det anges vem som accepterat händelsen.

Arbetsalgoritmen för vakthavande befäl i det nya BMS är följande:

  1. Nya incidenter ingår i rapporten och väntar på bekräftelse. De kan inte vistas i denna sektion under lång tid, den som har tjänstgöring för utrustningen måste omedelbart ta hand om händelsen.
  2. Den anställde tar ansvar för händelsen genom att klicka på bocken till höger. Eftersom alla anställda har unika konton visas det automatiskt vem som accepterat incidenten. Lämna en kommentar vid behov.
  3. Incidenten flyttas till sektionen "Erkänd", resten av tjänstemän och chefen förstår att incidenten hanteras av ansvarig medarbetare.

Övervakning i datacentret: hur vi ersatte det gamla BMS med ett nytt. Del 3
Exempel på ett sammanfattningsfönster med ett nytt och redan bekräftat meddelande.

Genom att koppla samman sammanfattningsfönstret med tabellen En sida fick vi en full huvudskärm BMS-system, där du direkt kan se: 

  • tillståndet för de viktigaste datacentersystemen;
  • förekomst av nya obearbetade incidenter;
  • förekomsten av accepterade incidenter och information om vem som specifikt eliminerar dem.

Webbläsaråtkomst och popup-varningar på telefonen

Webbgränssnittet, tillgängligt från vilken enhet som helst från var som helst i världen, är en skarp kontrast till den "tjocka" klienten, som är helt stängd för externa användare. 

Det gamla tillvägagångssättet innebar en rad olägenheter, från problem med att organisera distansarbete för övervakning av tjänsteanställda till behovet av att installera "tjocka" klienter från distributionspaket på personalens arbetsstationer i datacentret.

Nu har vilken sida som helst i BMS en unik adress, vilket gör att du inte bara kan dela sidans eller enhetens direkta adress utan även länkar till unika grafer/rapporter. 

Tillgång till systemet sker nu genom LDAP-autentisering genom Active Directory, vilket ökar dess säkerhetsnivå. 

Mobilitet idag är en nyckelfaktor i tjänstgörande ingenjörers kvalitetsarbete. Förutom att övervaka övervakningen i tjänstgöringsrummet, gör ingenjörer rundor, utför rutinarbete utanför ”jourrummet” och tappar tack vare BMS-huvudskärmen optimerad för mobila skärmar inte kontrollen över vad som händer i turbinrummen ens för en sekund. 

Kvaliteten på kontrollen förbättras också tack vare funktionaliteten i arbetschattar. De påskyndar arbetsprocesserna genom att tillåta korrespondens från tjänstgörande ingenjörer att "länkas" till BMS. Till exempel använder vi Teams-applikationen, som låter dig föra intern korrespondens och ta emot alla meddelanden från BMS på din telefon i form av popup-push-meddelanden, vilket eliminerar behovet för vakthavande befäl att ständigt titta på telefonen skärm.

Övervakning i datacentret: hur vi ersatte det gamla BMS med ett nytt. Del 3
 Push-meddelande på smartphoneskärmen.

Övervakning i datacentret: hur vi ersatte det gamla BMS med ett nytt. Del 3
Så här ser aviseringar ut i Teams-appen.

Samtidigt konfigureras popup-meddelanden endast för meddelanden om förekomsten av incidenter, vilket minimerar distraktionsfaktorn; personalen vet: om ett Teams Push-meddelande visas på smartphoneskärmen måste de gå till BMS-sidan och acceptera händelsen. Incidentlösningsmeddelanden spåras på BMS-sidan.

Övervakning i datacentret: hur vi ersatte det gamla BMS med ett nytt. Del 3
Bilden visar BMS-gränssnittet i en smartphone.

Sammanfattningsvis

Även om kostnaden för att uppdatera ett BMS från vår gamla leverantör var jämförbar med att utveckla ett nytt system från grunden (cirka 100 000 USD), visade sig skillnaden i produkternas funktionalitet vara kolossal. Vi fick ett flexibelt system optimerat för våra affärsuppgifter och processer. Vi har också uppnått betydande besparingar i löpande systemsupport och uppgraderingskostnader. 

Men det fanns förstås svårigheter. 

  • För det första underskattade vi mängden ändringar som behövde göras i basversionen av det nya BMS och höll inte de förhandsöverenskomna tidsfristerna. För oss var detta inget kritiskt problem, eftersom vi var försäkrade till sista minuten och arbetade med det gamla systemet, och processen var kreativ, komplex och gick därför ibland långsammare än förväntat. Dessutom har vi alltid sett att vår utvecklare gör allt för att uppnå bästa resultat. Men i själva verket visade sig historien vara väldigt lång, och våra nyckelspecialister lade ner mycket mer kraft och tid på den än de hade planerat. 
  • För det andra behövde vi flera teststeg för att felsöka algoritmen för att reservera virtuella maskiner och kommunikationskanaler. Inledningsvis var det fel både på sidan av BMS-systemet och på sidan av att sätta upp virtuella maskiner och nätverket. Denna felsökning tog också tid. Lyckligtvis försågs entreprenören med en testplattform i form av en molntjänst, där alla inställningar och innovationer till en början testades.
  • För det tredje visade det sig att det resulterande systemet var svårare att redigera av slutanvändaren. Om en karta tidigare bestod av en bakgrund (grafisk fil) och ikoner som var lätta att ändra eller flytta, är det nu ett komplext grafiskt gränssnitt med animering som kräver vissa redigeringsfärdigheter.

Den radikala uppdateringen av vårt BMS-system kan redan kallas det senaste årets viktigaste projekt, vilket allvarligt kommer att påverka kvaliteten på den operativa förvaltningen av våra anläggningar i framtiden. 

Vi slängde naturligtvis inte ut den gamla järnservern utan "lättade upp den": vi rensade den från tusentals "kommersiella" virtuella sensorer och PDU:er och lämnade bara några dussin av de mest kritiska enheterna i den, som diesel. generatoraggregat, UPS, luftkonditioneringsapparater, pumpar, läckagesensorer och temperaturer I det här läget har hans tidigare hastighet återvänt, och han kan vara en "reservreserv". Förresten, efter att ha tagit bort PDU:n från det gamla BMS, frigjorde vi cirka 1000 nu onödiga licenser, råkar du veta vad du ska göra med dem?

Källa: will.com

Lägg en kommentar