MMS-system i ett datacenter: hur vi automatiserade underhållshantering

Föreställ dig att du har ett fullt serverrum med teknisk utrustning: flera dussin luftkonditioneringsapparater, ett gäng dieselgeneratorer och avbrottsfri strömförsörjning. För att hårdvaran ska fungera som den ska kontrollerar du regelbundet dess prestanda och glöm inte förebyggande underhåll: utför provkörningar, kontrollera oljenivån, byt delar. Även för ett serverrum behöver du lagra mycket information: ett register över utrustning, en lista över förbrukningsvaror i lagret, ett schema för förebyggande underhåll, såväl som garantidokument, kontrakt med leverantörer och entreprenörer. 

Låt oss nu multiplicera antalet hallar med tio. Logistikproblem uppstod. I vilket lager ska du lagra vad så att du inte behöver springa efter varje reservdel? Hur fyller man på förråd i tid så att oplanerade reparationer inte överraskar dig? Om det finns mycket utrustning är det omöjligt att hålla allt tekniskt arbete i huvudet, och svårt på pappret. Det är här MMS, eller underhållsledningssystem, kommer till undsättning. 

MMS-system i ett datacenter: hur vi automatiserade underhållshantering
På MMS upprättar vi scheman för förebyggande och reparationsarbeten och lagrar instruktioner för ingenjörer. Alla datacenter har inte ett sådant system, många anser att det är en för dyr lösning. Men av egen erfarenhet är vi övertygade om det Det är inte verktyget som spelar roll, det är tillvägagångssättet att arbeta med information. Vi skapade det första systemet i Excel och utvecklade det gradvis till en mjukvaruprodukt. 

Med alexdropp vi bestämde oss för att dela med oss ​​av vår erfarenhet av att utveckla vårt eget MMS. Jag kommer att visa hur systemet utvecklades och hur det hjälpte till att införa bästa underhållspraxis. Alexey kommer att berätta hur han ärvde MMS, vad som har förändrats under den här tiden och hur systemet gör livet lättare för ingenjörer nu. 

Hur vi kom till vårt eget MMS

Först var det mappar. För 8-10 år sedan lagrades information i spridd form. Efter underhåll skrev vi på rapporter om utfört arbete, lagrade pappersoriginal i arkiv och skannade kopior i nätverksmappar. På samma sätt samlades information om reservdelar: reservdelar, verktyg och tillbehör i mappar uppdelade efter utrustning. Så här kan du leva om du bygger en struktur och åtkomstnivåer för dessa mappar.
Men då har du tre problem: 

  • navigering: det tar lång tid att växla mellan olika mappar. Om du vill se reparationer på specifik utrustning under flera år måste du göra många klick.
  • statistik: du kommer inte att ha det, och utan det är det svårt att förutse hur snabbt olika utrustningar går sönder eller hur många reservdelar som ska planeras för nästa år.  
  • snabba svar: ingen kommer att påminna dig om att komponenterna redan är slut och måste beställas om. Det är inte heller uppenbart att det inte är första gången som samma utrustning har havererat.  

Ett tag lagrade vi sådana här dokument, men sedan upptäckte vi Excel :)

MMS till Excel. Med tiden migrerade dokumentationsstrukturen till Excel. Den baserades på en lista över utrustning, med underhållsscheman, checklistor och länkar till intyg om slutförande av arbete som bifogats: 

MMS-system i ett datacenter: hur vi automatiserade underhållshantering

Listan över utrustning angav de viktigaste egenskaperna och platsen i datacentret:
MMS-system i ett datacenter: hur vi automatiserade underhållshantering

Resultatet är en sorts navigator från vilken du snabbt kan förstå vad som händer med utrustningen och dess underhåll. Om det behövs kan du titta på enskilda handlingar från underhållsschemat med hjälp av länkarna:

MMS-system i ett datacenter: hur vi automatiserade underhållshantering

Om du samvetsgrant underhåller ett dokument i Excel är lösningen ganska lämplig för ett litet serverrum. Men det är också tillfälligt. Även om vi använder en luftkonditionering och underhåller en gång i månaden, kommer vi att samla hundratals fel under fem år, och vår Excel kommer att svälla. Om du lägger till en annan luftkonditionering, en dieselgenerator, en UPS, måste du göra flera ark och länka ihop dem. Ju längre berättelsen är, desto svårare är det att omedelbart ta tag i den nödvändiga informationen. 

Det första "vuxna" systemet. Under 2014 genomgick vi den första Management & Operations-revisionen enligt Operational Sustainability-standarder från Uptime Institute. Vi gick igenom nästan samma Excel-program, men under loppet av ett år förbättrade vi det avsevärt: vi lade till länkar till instruktioner och checklistor för ingenjörer. Revisorerna fann att detta format var ganska fungerande. De kunde spåra all verksamhet med utrustningen och såg till att informationen var uppdaterad och att processerna var på plats. Granskningen gick sedan igenom med råge och fick 92 poäng av 100 möjliga.

Frågan uppstod: hur ska man leva vidare. Vi bestämde oss för att vi behövde ett "seriöst" MMS, tittade på flera betalprogram, men bestämde oss till slut för att skriva programvaran själva. Samma Excel användes som en utökad teknisk specifikation. Det här är uppgifterna vi ställer in för MMS. 

Vad vi ville ha från MMS

I de flesta fall är MMS en uppsättning kataloger och rapporter. Vår kataloghierarki ser ut ungefär så här:

MMS-system i ett datacenter: hur vi automatiserade underhållshantering

Den allra första katalogen på toppnivå är förteckning över byggnader: maskinrum, lager där utrustning finns.

MMS-system i ett datacenter: hur vi automatiserade underhållshantering

Nästa kommer lista över teknisk utrustning. Vi samlade in det enligt följande system:

  • Luftkonditioneringssystem: luftkonditioneringsapparater, kylare, pumpar.
  • Strömförsörjningssystem: UPS, dieselgeneratorer, fördelningskort.

MMS-system i ett datacenter: hur vi automatiserade underhållshantering
För varje utrustning samlar vi in ​​grundläggande data: typ, modell, serienummer, tillverkardata, tillverkningsår, idrifttagningsdatum, garantiperiod.

När vi har fyllt i utrustningslistan upprättar vi den underhållsprogram: hur och hur ofta man gör underhåll. I underhållsprogrammet beskriver vi uppsättning operationer, till exempel: byt ut det här batteriet, justera funktionen för en specifik del och så vidare. Vi beskriver verksamheten i en separat uppslagsbok. Om en operation upprepas i olika program, behöver vi inte beskriva den på nytt varje gång - vi tar helt enkelt en färdig från referensboken:

MMS-system i ett datacenter: hur vi automatiserade underhållshantering
Operationerna "Ändra temperaturbörvärden" och "Byta ut snabbkopplingskabelanslutningar" kommer att vara vanliga för kylaggregat och luftkonditioneringssystem från samma tillverkare.

Nu för varje utrustning vi kan skapa Underhållsschema. Vi kopplar underhållsprogrammet till specifik utrustning och själva systemet ser i programmet hur ofta underhållet behöver utföras och beräknar arbetstiden från idrifttagningsdatum:
MMS-system i ett datacenter: hur vi automatiserade underhållshanteringDu kan till och med automatisera utarbetandet av ett sådant schema med hjälp av Excel-formler.

Inte helt självklar historia: vi har en separat katalog uppskjutet arbete. Schemat är schema, men vi är alla levande människor och vi förstår att allt kan hända. Till exempel kom en förbrukningsvara inte fram i tid och tjänsten behöver schemaläggas om en vecka. Detta är en normal situation om du håller ett öga på det. Vi för statistik över uppskjutna och ej slutförda arbeten och försöker säkerställa att underhållsinställda tenderar att bli noll.  

Statistik förs också för varje utrustning olyckor och oplanerade reparationer. Vi använder statistik för att planera inköp och hitta svaga punkter i infrastrukturen. Till exempel, om en kompressor brinner ut på samma plats tre gånger i rad, är detta en signal att leta efter orsaken till haveriet.   

MMS-system i ett datacenter: hur vi automatiserade underhållshantering
Denna historia av underhåll och reparationer har samlats över 4 år för en specifik luftkonditionering.

Följande guide är reservdelar. Den tar hänsyn till vilka förbrukningsmaterial som behövs för utrustningen, var och i vilken mängd de förvaras. Här lagrar vi även information om leveranstider för att bättre kunna planera ankomster till lagret. 

Vi beräknar antalet reservdelar från den årliga statistiken över reparationer per utrustning. För alla reservdelar anger vi minimibalansen: vilka minsta reservdelar som behövs vid varje anläggning. Om reservdelarna håller på att ta slut, markeras dess kvantitet i katalogen:

MMS-system i ett datacenter: hur vi automatiserade underhållshanteringMinsta balans mellan högtryckssensorer bör vara minst två, men det finns bara en kvar. Det är dags att göra en beställning nu. 

Så fort en försändelse med reservdelar kommer in fyller vi i katalogen med uppgifterna från fakturan och anger lagringsplatsen. Vi ser omedelbart den nuvarande balansen av sådana reservdelar i lagret: 
MMS-system i ett datacenter: hur vi automatiserade underhållshantering

Vi har en separat kontaktkatalog. Vi anger uppgifter om leverantörer och entreprenörer som utför underhåll i den: 

MMS-system i ett datacenter: hur vi automatiserade underhållshantering

Intyg och elsäkerhetskontrollgrupper bifogas varje entreprenörs-ingenjörs kort. När vi gör upp ett schema kan vi se vilka specialister som har erforderligt tillstånd. 
MMS-system i ett datacenter: hur vi automatiserade underhållshantering

Sedan MMS fanns har arbetet med platstillstånd förändrats. Till exempel har dokument med metodiska instruktioner för att utföra underhåll tillkommit. Om tidigare en uppsättning operationer passade in i en liten checklista, täcker detaljerade instruktioner allt: hur man förbereder sig, vilka villkor som behövs och så vidare.   

Han kommer att berätta hur hela processen fungerar nu, med hjälp av ett exempel. alexdropp

Hur fungerar underhåll i MMS?

En gång i tiden dokumenterades arbete som slutförts för länge sedan i efterhand. Vi utförde helt enkelt underhåll och undertecknade efter det ett intyg om slutförande av arbetet. 99 % av servrarna gör detta, men av erfarenhet är detta inte tillräckligt. För att inte glömma någonting, först formar vi arbetstillstånd. Detta är ett dokument som beskriver arbetet och förutsättningarna för dess genomförande. Allt underhåll och reparation i vårt system börjar med det. Hur händer detta: 

  1. Vi tittar på nästa planerade arbeten i underhållsschemat:
    MMS-system i ett datacenter: hur vi automatiserade underhållshantering
  2. Vi skapar ett nytt tillstånd. Vi väljer en underhållsentreprenör som leder processen från vår sida och samordnar arbetet med oss. Vi anger var och när arbetet kommer att ske, väljer typ av utrustning och vilket program vi kommer att följa: 
    MMS-system i ett datacenter: hur vi automatiserade underhållshantering
  3. När du har sparat kortet, gå vidare till detaljerna. Vi anger entreprenören och kontrollerar om denne har tillstånd att utföra det arbete som krävs. Om det inte finns någon behörighet är fältet rött markerat och du kan inte utfärda en arbetsorder:  
    MMS-system i ett datacenter: hur vi automatiserade underhållshantering
  4. Vi anger specifik utrustning. Beroende på typ av arbete föreskrivs preliminära aktiviteter i underhållsprogrammet, till exempel: beställa bränsle till platsen, schemalägga en introduktionsgenomgång för ingenjörer och meddela kollegor. Listan över aktiviteter kommer att visas automatiskt, men vi kan lägga till våra egna artiklar , allt är ganska flexibelt:
    MMS-system i ett datacenter: hur vi automatiserade underhållshantering
  5. Vi sparar beställningen, skickar ett brev till den som godkänner och väntar på hans svar:
    MMS-system i ett datacenter: hur vi automatiserade underhållshantering
  6. När ingenjören kommer skriver vi ut arbetsordern direkt från systemet.
    MMS-system i ett datacenter: hur vi automatiserade underhållshantering
  7. Arbetsordern innehåller en checklista över operationer för underhållsprogrammet. Arbetsledaren på datacentret kontrollerar underhållet och kryssar i rutor.
    MMS-system i ett datacenter: hur vi automatiserade underhållshantering

    Ett tag räckte det med en kort checklista. Sedan införde vi metodologiska instruktioner, eller MOP (procedurmetod). Med hjälp av ett sådant dokument kan vilken certifierad ingenjör som helst inspektera vilken utrustning som helst. 

    Allt beskrivs så detaljerat som möjligt, ända ner till mallar för aviseringsbrev och väderförhållanden: 

    MMS-system i ett datacenter: hur vi automatiserade underhållshantering

    Det utskrivna dokumentet ser ut så här:

    MMS-system i ett datacenter: hur vi automatiserade underhållshantering

    Enligt Uptime Institutes standarder ska det finnas en sådan MOP för alla operationer. Detta är en ganska stor mängd dokumentation. Baserat på erfarenhet rekommenderar vi att du utvecklar dem gradvis, till exempel en MOP per månad.

  8. Efter arbetet utfärdar ingenjören ett färdigställandeintyg. Vi skannar det och fäster det på kortet tillsammans med skanningar av andra dokument: tillstånd och MOP. 
    MMS-system i ett datacenter: hur vi automatiserade underhållshantering
  9. I arbetsordern noterar vi utfört arbete: 
    MMS-system i ett datacenter: hur vi automatiserade underhållshantering
  10. Utrustningskortet innehåller underhållshistoriken:
    MMS-system i ett datacenter: hur vi automatiserade underhållshantering

Vi visade hur vårt system fungerar nu. Men arbetet med MMS är inte över: flera förbättringar är redan planerade. Nu lagrar vi till exempel mycket information i skanningar. I framtiden planerar vi att göra underhållet papperslöst: anslut en mobilapplikation där ingenjören kan kryssa i rutorna och omedelbart spara informationen på ett kort. 

Självklart finns det många färdiga produkter på marknaden med liknande funktioner. Men vi ville visa att även en liten Excel-fil kan utvecklas till en fullvärdig produkt. Du kan göra detta själv eller involvera entreprenörer, huvudsaken är rätt tillvägagångssätt. Och det är aldrig för sent att börja.

Källa: will.com