Overvåking i datasenteret: hvordan vi erstattet den gamle BMS med en ny. Del 1

Overvåking i datasenteret: hvordan vi erstattet den gamle BMS med en ny. Del 1

Hva er BMS

Overvåkingssystemet for drift av tekniske systemer i et datasenter er et sentralt element i infrastrukturen, og påvirker direkte en så viktig indikator for et datasenter som hastigheten på personellrespons på nødsituasjoner og følgelig varigheten av uavbrutt drift. 

BMS (Building Monitoring System) overvåkingssystemer tilbys av mange globale leverandører av utstyr for datasentre. Under arbeidet til Linxdatacenter i Russland fikk vi muligheten til å bli kjent med forskjellige systemer og møte diametralt motsatte tilnærminger fra leverandører til driften av disse systemene. 

Vi forteller deg hvordan vi fullstendig oppdaterte BMS-systemet vårt det siste året og hvorfor.  

Roten til problemet

Det hele startet for 10 år siden med lanseringen av datasenteret Linxdatacenter i St. Petersburg. BMS-systemet, i henhold til industristandarder fra disse årene, var en fysisk server med installert programvare, tilgang til gjennom et klientprogram (den såkalte "tykke" klienten). 

Det var få selskaper som tilbød slike løsninger på markedet på den tiden. Produktene deres var standarden, det eneste svaret på et eksisterende behov. Og vi må gi dem hva de skal: Både da og i dag takler markedsledere generelt sin grunnleggende oppgave – å levere funksjonelle løsninger for drift av datasentre. 

Det logiske valget for oss var BMS-løsningen fra en av verdens største produsenter. Det valgte systemet på det tidspunktet oppfylte alle kravene for å overvåke et komplekst ingeniøranlegg, for eksempel et datasenter. 

Men over tid har kravene og forventningene til brukerne (det vil si oss, datasenteroperatører) fra IT-løsninger endret seg. Og store leverandører, som vist av en analyse av markedet for de foreslåtte løsningene, var ikke klare for dette.

IT-markedet for bedrifter har opplevd alvorlig påvirkning fra B2C-sektoren. Digitale løsninger i dag skal gi en behagelig opplevelse for sluttbrukeren – dette er målet utviklerne setter seg. Dette er tydelig i forbedringene i brukergrensesnitt (UI) og brukeropplevelse (UX) for mange bedriftsapplikasjoner. 

En person venner seg til komforten med alt knyttet til digitale verktøy i hverdagen, og stiller de samme kravene til verktøyene som han bruker til arbeidsoppgaver. Folk forventer av bedriftsapplikasjoner den samme synlighet, intuitivitet, enkelhet og gjennomsiktighet som er tilgjengelig for dem i finansielle tjenester, taxisamtaler eller netthandel. IT-spesialister som implementerer løsninger i et bedriftsmiljø streber også etter å motta alle de moderne "godbitene": enkel distribusjon og skalering, feiltoleranse og ubegrensede tilpasningsmuligheter. 

Store internasjonale leverandører overser ofte disse trendene. Ved å stole på sin langvarige autoritet i bransjen, viser selskaper seg ofte å være kategoriske og lite fleksible når de jobber med kunder. Illusjonen om deres egen uunnværlighet lar dem ikke se hvordan unge teknologibedrifter bokstavelig talt dukker opp under nesen deres, og tilbyr alternative løsninger skreddersydd for en spesifikk kunde, og uten å betale for mye for merkevaren.

Ulemper med det gamle BMS-systemet 

Den største ulempen med den eksisterende utdaterte BMS-løsningen for oss var dens sakte drift. Undersøkelse av flere hendelser der vakthavende personell ikke svarte raskt nok, førte til at vi forsto at det noen ganger var en betydelig forsinkelse i hendelser som ble vist i BMS. Samtidig var ikke systemet overbelastet eller defekt, det var bare at versjonene av komponentene (for eksempel JAVA) var utdaterte og kunne ikke fungere korrekt med nye versjoner av operativsystemer uten oppdateringer. Det var mulig å oppdatere dem bare sammen med BMS-systemet, og leverandøren ga ikke automatisk kontinuitet av versjoner, det vil si at for oss ville prosessen være nesten like arbeidskrevende som å bytte til et nytt system, og den nye løsningen ble beholdt noen av manglene til den gamle.  

La oss legge til noen flere ubehagelige "småting" her:

  1. Betaling for tilkobling av nye enheter etter prinsippet om "én IP-adresse - en betalt lisens"; 
  2. Manglende evne til å oppdatere programvare uten å kjøpe en støttepakke (dette betyr å oppdatere gratis komponenter og eliminere feil i selve BMS-programmet);
  3. Høye kostnader for støtte; 
  4. Plassering på en "jern"-server, som kan svikte og har begrensede dataressurser;
  5. "Redundans" ved å installere en annen maskinvareserver med en duplikatlisenspakke. Samtidig er det ingen synkronisering av databaser mellom hoved- og backupservere – noe som betyr manuell databaseoverføring og lang overgangstid til backup;
  6. "Tykk" brukerklient, utilgjengelig fra utsiden, uten utvidelse for en mobilenhet og alternativ for ekstern tilgang;
  7. Et nedstrippet nettgrensesnitt uten grafikkort og lydvarsler, tilgjengelig fra utsiden, men praktisk talt ikke brukt av ansatte på grunn av mangel på informasjon;
  8. Mangel på animasjon i grensesnittet - all grafikk består kun av et "bakgrunnsbilde" og statiske ikoner. Resultatet er et generelt lavt siktnivå;

    Alt så omtrent slik ut:

    Overvåking i datasenteret: hvordan vi erstattet den gamle BMS med en ny. Del 1

    Overvåking i datasenteret: hvordan vi erstattet den gamle BMS med en ny. Del 1

  9. En begrensning ved å lage virtuelle sensorer er at bare tilleggsfunksjonen er tilgjengelig, mens modeller av ekte sensorer krever muligheten til å utføre et sett med matematiske operasjoner for korrekte beregninger som gjenspeiler operasjonens realiteter; 
  10. Manglende evne til å innhente data i sanntid eller fra arkivet for noen formål (for eksempel for visning i kundens personlige konto);
  11. Fullstendig mangel på fleksibilitet og evne til å endre hva som helst i BMS for å passe eksisterende datasenterprosesser. 

Krav til nytt BMS-system

Med hensyn til ovenstående var hovedkravene våre som følger:

  1. To uavhengige gjensidig redundante maskiner med automatisk synkronisering, som kjører på to forskjellige skyplattformer i forskjellige datasentre (i vårt tilfelle Linxdatacenter St. Petersburg og Moskva datasentre);
  2. Gratis tillegg av nye enheter;
  3. Gratis programvareoppdateringer og dens komponenter (bortsett fra funksjonelle forbedringer);
  4. Åpen kildekode, slik at vi uavhengig kan støtte systemet i tilfelle problemer på utviklerens side;
  5. Muligheten til å motta og bruke data fra BMS, for eksempel på et nettsted eller i din personlige konto;
  6. Tilgang via nettleser uten en tykk klient;
  7. Bruk av domeneansattkontoer for å få tilgang til BMS;
  8. Tilgjengelighet av animasjon og mange andre små og ikke så små ønsker som materialiserte seg til en detaljert teknisk spesifikasjon.

Siste strå

Overvåking i datasenteret: hvordan vi erstattet den gamle BMS med en ny. Del 1

I det øyeblikket vi skjønte at datasenteret hadde vokst ut av BMS, så den mest åpenbare løsningen for oss å oppdatere det eksisterende systemet. "De bytter ikke hest midtveis," ikke sant? 

Imidlertid tilbyr store selskaper som regel ikke tilpassede modifikasjoner til sine tiår gamle "polerte" løsninger som selges i dusinvis av land. Mens unge selskaper tester en idé eller prototype av et fremtidig produkt på potensielle forbrukere og stoler på tilbakemeldinger fra brukere for å utvikle produktet, fortsetter selskaper å selge lisenser for et en gang veldig kult produkt, men dessverre er det i dag utdatert og lite fleksibelt.

Og vi følte forskjellen i tilnærmingen selv. Under korrespondanse med produsenten av det gamle BMS ble det raskt klart at oppdateringen av det eksisterende systemet foreslått av leverandøren faktisk ville resultere i kjøp av et nytt system for oss med halvautomatisk databaseoverføring, høye kostnader og fallgruver under overføring, som ikke engang produsenten selv kunne forutsi. Selvfølgelig, i dette tilfellet, økte kostnadene for teknisk støtte for den oppdaterte løsningen, og behovet for å kjøpe lisenser under utvidelsen gjensto.

Og det mest ubehagelige var at det nye systemet ikke fullt ut kunne tilfredsstille våre reservasjonskrav. Det oppdaterte BMS-systemet kunne implementeres, som vi ønsket, på en skyplattform, som ville tillate oss å forlate maskinvaren, men redundansalternativet var ikke inkludert i prisen. For å sikkerhetskopiere dataene, må vi kjøpe en annen virtuell BMS-server og et ekstra sett med lisenser. Med kostnaden for én lisens på rundt $76 og antall IP-adresser på 1000 enheter, gir det opp til $76 000 i ekstra utgifter bare for lisenser for sikkerhetskopieringsmaskinen. 

"Kirsebæret" i den nye versjonen av BMS var behovet for å kjøpe ytterligere lisenser "for alle enheter" - selv for hovedserveren. Her er det nødvendig å avklare at det er enheter koblet til BMS gjennom gatewayer. Gatewayen har én IP-adresse, men styrer flere enheter (10 i gjennomsnitt). I den gamle BMS-en krevde dette én lisens per gateway-IP-adresse, statistikken så omtrent slik ut: "1000 IP-adresser/lisenser, 1200 enheter." Den oppdaterte BMS fungerte på et annet prinsipp, og statistikken ville se slik ut: "1000 IP-adresser, 1200 enheter/lisenser." Det vil si at leverandøren i den nye versjonen endret prinsippet for tildeling av lisenser, og vi måtte kjøpe cirka 200 ekstra lisenser. 

"Oppdateringsbudsjettet" besto til slutt av fire punkter: 

  • kostnadene for skyversjonen og migreringstjenester til den; 
  • tilleggslisenser til den eksisterende pakken for enheter koblet til via gatewayer;
  • kostnad for backup-skyversjon;  
  • et sett med lisenser for sikkerhetskopieringsmaskinen. 

Den totale kostnaden for prosjektet var mer enn $100 000! Og dette er ikke å snakke om behovet for å kjøpe lisenser for nye enheter i fremtiden.

Som et resultat innså vi at det ville være lettere for oss – og kanskje til og med billigere – å bestille et system laget fra bunnen av, tatt i betraktning alle våre krav og sørget for muligheten for modernisering i fremtiden. Men de som ønsket å utvikle et så komplekst system måtte fortsatt finnes, sammenligne forslag, velge ut og med finalisten gå veien fra tekniske spesifikasjoner til implementering... Les om dette i andre del av materialet veldig snart. 

Kilde: www.habr.com

Legg til en kommentar