Să fim sinceri în privința centrului de date: cum am rezolvat problema prafului în camerele de server ale centrului de date

Să fim sinceri în privința centrului de date: cum am rezolvat problema prafului în camerele de server ale centrului de date

Bună, Habr! Sunt Taras Chirkov, directorul centrului de date Linxdatacenter din Sankt Petersburg. Și astăzi, pe blogul nostru, voi vorbi despre ce rol joacă menținerea curățeniei camerei în funcționarea normală a unui centru de date modern, cum să-l măsori corect, să-l realizăm și să-l menținem la nivelul necesar.

Declanșează puritatea

Într-o zi, un client al unui centru de date din Sankt Petersburg ne-a contactat în legătură cu un strat de praf în partea de jos a unui rafturi de echipamente. Acesta a devenit punctul de plecare al investigației, ale cărei prime ipoteze sugerau următoarele:

  • praful pătrunde în camerele serverului din tălpile pantofilor angajaților și clienților centrului de date,
  • introdus prin sistemul de ventilație,
  • ambii.

Huse pentru pantofi albastre - trimise la coșul de gunoi al istoriei

Am început cu pantofii. Pe atunci, problema curățeniei era rezolvată în mod tradițional: un recipient cu huse de pantofi la intrare. Eficacitatea abordării nu a atins nivelul dorit: a fost dificil de controlat utilizarea lor de către oaspeții centrului de date, iar formatul în sine era incomod. Au fost abandonați rapid în favoarea unei tehnologii mai avansate sub forma unei mașini de acoperire a pantofilor. Primul model al unui astfel de dispozitiv pe care l-am instalat a fost un eșec: mașina rupea prea des husele de pantofi când încerca să le pună pe pantofi, folosirea lui era mai enervantă decât ușurarea vieții.

Trecerea la experiența colegilor din Varșovia și Moscova nu a rezolvat problema, iar în cele din urmă s-a făcut alegerea în favoarea tehnologiei de topire a filmului termic pe pantofi. Folosind folie termică, puteți pune „huse de pantofi” pe pantofii cu orice talpă – chiar și un toc subțire pentru femei. Da, și filmul alunecă uneori, dar mult mai rar decât clasicele huse de pantofi albastre, iar tehnologia în sine este mult mai convenabilă pentru vizitator și mai modernă. Un alt plus important (pentru mine) este că filmul acoperă cu ușurință cele mai mari dimensiuni de pantofi, spre deosebire de husele tradiționale de pantofi, care se rupe atunci când încearcă să le pună pe mărimea 45. Pentru a face procesul mai modern, au instalat pubele cu deschidere automată a capacului folosind un senzor de mișcare.

Procesul arată astfel:  

Să fim sinceri în privința centrului de date: cum am rezolvat problema prafului în camerele de server ale centrului de date
Oaspeții au apreciat imediat inovația.

Praf in vant

După ce am pus în ordine cel mai evident canal de poluare posibilă a spațiului, ne-am ocupat de chestiuni mai subtile - aerul. Este probabil ca o parte semnificativă a prafului să pătrundă în camerele serverelor prin ventilație din cauza filtrației insuficiente sau să fie adus din stradă. Sau este totul despre calitatea proastă a curățeniei? Ancheta a continuat.

Am decis să facem măsurători ale conținutului de particule din aerul din interiorul centrului de date și am invitat un laborator specializat în monitorizarea calității aerului în camere curate cu scop special pentru a efectua această lucrare.

Personalul de laborator a măsurat numărul de puncte de control (20) și a creat un program de prelevare pentru a urmări dinamica și a crea cea mai precisă imagine. Costul întregului proces de măsurare în laborator a fost de aproximativ 1 milion de ruble, ceea ce ni s-a părut complet nepractic, dar ne-a oferit o serie de idei pentru implementare independentă. Pe parcurs, a devenit clar că laboratorul este bun, dar analizele trebuie efectuate dinamic și recurgerea constantă la serviciile lor este extrem de incomod.

După ce ne-am uitat la activitățile planificate ale laboratorului, am decis să ne uităm la dispozitive mai utilitare pentru munca independentă. Drept urmare, am reușit să găsim instrumentul necesar pentru această sarcină - un analizor de calitate a aerului. Ca aceasta:

Să fim sinceri în privința centrului de date: cum am rezolvat problema prafului în camerele de server ale centrului de date
Dispozitivul arată conținutul de particule de diferite diametre (în micrometri).

Redefinirea standardelor

Acest dispozitiv analizează numărul de particule, temperatura, umiditatea și afișează rezultatele în unități de măsură conform standardelor ISO pentru acest parametru. Afișajul arată nivelurile de particule cu diferite diametre din proba de aer.

În același timp, au făcut o greșeală cu filtrele: în acel moment, au folosit modele de filtre G4 în interiorul sălilor de servere. Acest model oferă o purificare brută a aerului, astfel încât s-a presupus posibilitatea lipsei de particule care duc la poluare. Am decis să achiziționăm filtre fine F5 pentru testare, care sunt utilizate în sistemele de aer condiționat și ventilație ca filtre de a doua etapă (post-tratare).

Investigația a fost efectuată - puteți începe măsurătorile de control. Am decis să folosim ca ghid cerințele standardului ISO 14644-1 pentru numărul de particule în suspensie.

Să fim sinceri în privința centrului de date: cum am rezolvat problema prafului în camerele de server ale centrului de date
Clasificarea camerelor curate în funcție de numărul de particule în suspensie.

S-ar părea - măsurați și comparați conform tabelului. Dar nu totul este atât de simplu: în practică, s-a dovedit a fi destul de dificil să găsești standarde de curățenie a aerului pentru camerele serverelor centrelor de date. Acest lucru nu este declarat în mod explicit nicăieri, de către nicio organizație sau institut industrial. Și doar pe forumul intern Uptime Inside Track (accesul la acesta este disponibil pentru persoanele care au absolvit programele Uptime Institute) a existat o discuție separată pe acest subiect. Pe baza rezultatelor studiului său, am fost înclinați să ne concentrăm pe standardul ISO 8 - penultimul din clasificare.

Primele măsurători au arătat că ne-am subestimat - rezultatele testelor de aer intern au arătat conformitatea cu cerințele ISO 5 în spațiile interne, care au depășit semnificativ standardele dorite de participanții Uptime Inside Track. În același timp, cu o marjă mare. Avem un centru de date, și nu un laborator biologic, desigur, dar pentru ca concentrația de particule în aer să fie egală cu ISO 8, trebuie să fie un obiect cel puțin din clasa „plantă de ciment”. Și cum același standard poate fi aplicat unui centru de date nu este foarte clar. Totodata am obtinut rezultatul la ISO 5 prin efectuarea de masuratori la filtrarea aerului cu filtre G4. Adică, praful nu poate intra în rafturi prin aer; filtrele F5 s-au dovedit a fi redundante și nici măcar nu au fost folosite.

Un rezultat negativ este și un rezultat: am continuat căutarea cauzei poluării în alte direcții, iar monitorizarea calității aerului a fost inclusă în inspecțiile trimestriale, combinate cu inspecții ale senzorilor BMS prin dispozitive verificate (cerințe ISO 9000 și audituri clienți).

Mai jos este un exemplu de raport care este completat pe baza datelor obținute în timpul măsurării. Pentru o mai mare acuratețe, măsurătorile se fac cu două dispozitive - Testo 610 și un senzor BMS. Antetul tabelului arată valorile limită pentru dispozitive. Abaterile dintre parametrii specificați sunt evidențiate automat în culoare pentru a facilita identificarea zonelor cu probleme sau a perioadelor de timp.
Să fim sinceri în privința centrului de date: cum am rezolvat problema prafului în camerele de server ale centrului de date
Totul este clar la noi: diferența dintre indicatorii dispozitivelor este minimă, iar concentrația de particule este mult mai mică decât limita maximă.

Prin intrarea din spate

Deoarece existau și alte intrări în camerele curate în afară de intrarea principală a clienților unde am instalat mașina de acoperire a pantofilor, era încă nevoie să împiedicăm pătrunderea murdăriei în centrul de date prin ele.

Este incomod să puneți/înlăturați husele de încălțăminte în timpul procedurilor de descărcare a echipamentului, așa că am găsit o mașină automată pentru curățarea tălpilor. Convenabil, funcțional, dar factorul uman îl afectează sub forma unei abordări opționale a acestui dispozitiv. În esență, la fel ca și cu husele de pantofi de la intrarea principală.

Să fim sinceri în privința centrului de date: cum am rezolvat problema prafului în camerele de server ale centrului de date

Pentru a rezolva problema, au început să caute opțiuni de curățare care nu puteau fi evitate: covoarele lipicioase cu straturi detașabile se ocupau cel mai bine de acest lucru. În timpul procesului de autorizare la ușile de intrare, vizitatorul trebuie să stea pe un astfel de covoraș, îndepărtând excesul de praf de pe tălpile pantofilor.

Să fim sinceri în privința centrului de date: cum am rezolvat problema prafului în camerele de server ale centrului de date
Agenții de curățare rup stratul superior al unui astfel de covor în fiecare zi; există 60 de straturi în total - suficiente pentru aproximativ 2 luni.

După ce am vizitat, printre altele, centrul de date Ericsson din Stockholm, am observat cum se rezolvă aceste probleme acolo: împreună cu straturile de rupere, în Suedia se folosesc covoare antibacteriene reutilizabile Dycem. Mi-a placut ideea datorita principiului reutilizarii si a capacitatii de a oferi o suprafata mare de acoperire.

Să fim sinceri în privința centrului de date: cum am rezolvat problema prafului în camerele de server ale centrului de date
Covor magic antibacterian. Păcat, nu un avion, dar ar fi putut să fie – la așa și așa preț!

Am găsit cu greu reprezentanți ai companiei în Rusia și am evaluat costul soluției pentru centrul nostru de date. Drept urmare, am obținut o cifră care a fost de aproape 100 de ori mai scumpă decât soluția cu covoare cu mai multe straturi - aproximativ același milion de ruble ca în proiectul cu măsurători de puritate a aerului. În plus, a devenit clar că este necesar să se folosească produse speciale de curățare, disponibile în mod natural doar de la acest producător. Soluția a dispărut și de la sine; ne-am hotărât pe o opțiune cu mai multe straturi.

Muncă manuală

Aș dori în special să atrag atenția asupra faptului că toate aceste măsuri nu au anulat utilizarea forței de muncă a curățeniei. În pregătirea pentru certificarea centrului de date Linxdatacenter conform standardului Uptime Institute Management & Operations, a fost necesar să se reglementeze clar acțiunile angajaților serviciului de curățenie pe teritoriul centrului de date. Au fost elaborate instrucțiuni detaliate, care prescriu unde, ce și cum trebuie să facă.

Câteva fragmente din instrucțiuni:

Să fim sinceri în privința centrului de date: cum am rezolvat problema prafului în camerele de server ale centrului de date

Să fim sinceri în privința centrului de date: cum am rezolvat problema prafului în camerele de server ale centrului de date

După cum puteți vedea, totul este prescris, literalmente fiecare aspect al muncii într-o cameră specifică, agenți de curățare, materiale etc. acceptabile pentru utilizare. Nici un detaliu nu este lăsat nesupravegheat, chiar și cel mai mic. Instrucțiune – semnată de fiecare angajat al serviciului. În sălile serverelor, încăperile electrice etc. acestea sunt eliminate numai în prezența angajaților autorizați ai centrului de date, de exemplu, inginerul de serviciu.

Dar asta nu este tot

De asemenea, sunt incluse în lista măsurilor de garantare a curățeniei în centrul de date: walk-through-uri cu o inspecție vizuală a spațiilor, inclusiv inspecții săptămânale ale rafturilor pentru a detecta resturile de sârmă rămase în interiorul acestora, resturile de ambalaje de la echipamente și componente. Pentru fiecare astfel de episod se deschide un incident, iar clientul primește o notificare despre necesitatea eliminării încălcărilor cât mai curând posibil.

De asemenea, am creat o cameră separată pentru despachetarea și instalarea echipamentelor - aceasta face, de asemenea, parte din politica de curățare a companiei.  

O altă măsură pe care am învățat-o din practica lui Ericsson este menținerea constantă a presiunii aerului în camerele serverelor: presiunea din interiorul camerelor este mai mare decât cea din exterior, astfel încât să nu existe curent de aer în interior - vom vorbi despre această soluție mai detaliat într-un articol separat.

În cele din urmă, ne-am luat asistenți robotici pentru spațiile care sunt excluse din lista celor disponibile pentru vizitarea personalului de curățenie.

Să fim sinceri în privința centrului de date: cum am rezolvat problema prafului în camerele de server ale centrului de date
Grila de deasupra nu numai că oferă +10 la protecția robotului, dar împiedică și acesta să se blocheze sub tăvile verticale de cabluri ale rafturilor.

O descoperire neașteptată ca concluzie

Curățenia în centrul de date este importantă pentru funcționarea serverului și a echipamentelor de rețea care trage aer prin el. Depășirea nivelurilor admise de praf va duce la acumularea de praf pe componente și o creștere totală a temperaturii de până la 1 grad Celsius. Praful reduce eficiența răcirii, ceea ce poate duce la costuri indirecte semnificative pe an și, de asemenea, poate afecta toleranța la defecțiuni a instalației în ansamblu.

Aceasta poate fi o presupunere speculativă, dar experții Uptime Institute care au certificat centrul de date Linxdatacenter conform standardului de calitate Management & Operations acordă cea mai mare atenție curățeniei. Și a fost și mai plăcut să primim cele mai măgulitoare evaluări în acest domeniu: centrul nostru de date din Sankt Petersburg depășește cu mult cerințele de certificare. Un expert al institutului ne-a numit „cel mai curat centru de date pe care l-a văzut”, în plus, centrul nostru de date este folosit de Uptime ca exemplu de rezolvare a problemei camerelor de server curate. De asemenea, trecem cu ușurință orice audit de client pe acest parametru - cele mai serioase cerințe ale celor mai capricioși clienți sunt satisfăcute peste măsură.

Să ne întoarcem la începutul poveștii. De unde a venit contaminarea conform chiar reclamației de la începutul articolului? Partea din rack-ul clientului care a fost motivul pentru care s-a lansat întreg proiectul „curățare în centrul de date” a fost contaminată din momentul în care rack-ul a fost importat și instalat în centrul de date. Clientul nu a curățat rack-ul în momentul în care a fost adus în camera serverului - când a verificat rafturile vecine instalate în același timp, s-a dovedit că situația cu praful era aceeași acolo. Această situație a determinat adăugarea unui element de control al curățării la lista de verificare a instalării rack-ului clientului. De asemenea, nu ar trebui să uităm niciodată de probabilitatea unor astfel de lucruri = forewarned este forearmed. Totul este despre „curățenie și dictatură” în centrul nostru de date; în următorul articol voi vorbi despre senzorii de presiune, dar deocamdată, pune întrebări în comentarii.

Sursa: www.habr.com

Adauga un comentariu