Seien wir ehrlich zum Rechenzentrum: Wie wir das Staubproblem in den Serverräumen des Rechenzentrums gelöst haben

Seien wir ehrlich zum Rechenzentrum: Wie wir das Staubproblem in den Serverräumen des Rechenzentrums gelöst haben

Hallo, Habr! Ich bin Taras Chirkov, Direktor des Rechenzentrums Linxdatacenter in St. Petersburg. Und heute werde ich in unserem Blog darüber sprechen, welche Rolle die Aufrechterhaltung der Raumreinheit im normalen Betrieb eines modernen Rechenzentrums spielt, wie man sie richtig misst, erreicht und auf dem erforderlichen Niveau hält.

Reinheit auslösen

Eines Tages kontaktierte uns ein Kunde eines Rechenzentrums in St. Petersburg wegen einer Staubschicht am Boden eines Geräteregals. Dies wurde zum Ausgangspunkt der Untersuchung, deren erste Hypothesen Folgendes nahelegten:

  • Staub dringt über die Schuhsohlen von Rechenzentrumsmitarbeitern und Kunden in die Serverräume ein,
  • über die Lüftungsanlage eingebracht,
  • beide.

Blaue Schuhüberzüge – landen im Mülleimer der Geschichte

Wir haben mit Schuhen angefangen. Das Problem der Sauberkeit wurde damals auf traditionelle Weise gelöst: ein Container mit Schuhüberziehern am Eingang. Die Wirksamkeit des Ansatzes erreichte nicht das gewünschte Niveau: Es war schwierig, ihre Nutzung durch Gäste des Rechenzentrums zu kontrollieren, und das Format selbst war unpraktisch. Sie wurden schnell zugunsten einer fortschrittlicheren Technologie in Form einer Schuhüberzugsmaschine aufgegeben. Das erste Modell eines solchen Geräts, das wir installiert haben, war ein Fehlschlag: Die Maschine riss zu oft Schuhüberzüge beim Versuch, sie über die Schuhe zu ziehen, ihre Verwendung war eher ärgerlich als das Leben einfacher zu machen.

Der Rückgriff auf die Erfahrungen der Kollegen in Warschau und Moskau löste das Problem nicht, und am Ende fiel die Wahl auf die Technologie des Aufklebens von Thermofolie auf Schuhe. Mithilfe von Thermofolie können Sie Schuhe mit jeder Sohle – sogar einem dünnen Damenabsatz – mit „Überschuhen“ überziehen. Ja, die Folie verrutscht auch manchmal, aber deutlich seltener als die klassischen blauen Überschuhe, und die Technik selbst ist für den Besucher deutlich komfortabler und moderner. Ein weiterer (für mich) wichtiger Pluspunkt ist, dass die Folie problemlos die größten Schuhgrößen abdeckt, im Gegensatz zu herkömmlichen Schuhüberzügen, die beim Anziehen bei Größe 45 reißen. Um den Prozess moderner zu gestalten, installierten sie Behälter mit automatischer Öffnung des Deckels mithilfe eines Bewegungssensors.

Der Prozess sieht so aus:  

Seien wir ehrlich zum Rechenzentrum: Wie wir das Staubproblem in den Serverräumen des Rechenzentrums gelöst haben
Die Gäste waren von der Innovation sofort begeistert.

Staub im Wind

Nachdem wir den offensichtlichsten Kanal möglicher Weltraumverschmutzung in Ordnung gebracht hatten, wandten wir uns subtileren Dingen zu – der Luft. Es ist wahrscheinlich, dass ein erheblicher Teil des Staubs aufgrund unzureichender Filterung über die Belüftung in die Serverräume gelangt oder von der Straße eingeschleppt wird. Oder liegt es an der schlechten Qualität der Reinigung? Die Ermittlungen gingen weiter.

Wir beschlossen, Messungen des Partikelgehalts in der Luft im Rechenzentrum durchzuführen und beauftragten mit der Durchführung dieser Arbeiten ein Labor, das auf die Überwachung der Luftqualität in speziellen Reinräumen spezialisiert ist.

Das Laborpersonal maß die Anzahl der Kontrollpunkte (20) und erstellte einen Probenahmeplan, um die Dynamik zu verfolgen und ein möglichst genaues Bild zu erstellen. Die Kosten für den gesamten Labormessprozess betrugen etwa 1 Million Rubel, was uns völlig unpraktisch erschien, uns aber eine Reihe von Ideen für die unabhängige Umsetzung lieferte. Dabei stellte sich heraus, dass das Labor gut ist, die Analysen jedoch dynamisch durchgeführt werden müssen und die ständige Inanspruchnahme seiner Dienste äußerst umständlich ist.

Nachdem wir uns die geplanten Aktivitäten des Labors angesehen hatten, entschieden wir uns, nach nützlicheren Geräten für unabhängiges Arbeiten zu suchen. Dadurch ist es uns gelungen, das für diese Aufgabe erforderliche Werkzeug zu finden – einen Luftqualitätsanalysator. So was:

Seien wir ehrlich zum Rechenzentrum: Wie wir das Staubproblem in den Serverräumen des Rechenzentrums gelöst haben
Das Gerät zeigt den Gehalt an Partikeln unterschiedlichen Durchmessers (in Mikrometern) an.

Standards neu definieren

Dieses Gerät analysiert die Anzahl der Partikel, die Temperatur und die Luftfeuchtigkeit und zeigt die Ergebnisse in Maßeinheiten gemäß ISO-Standards für diesen Parameter an. Das Display zeigt den Gehalt an Partikeln mit unterschiedlichen Durchmessern in der Luftprobe an.

Gleichzeitig machten sie einen Fehler bei den Filtern: Sie verwendeten damals G4-Filtermodelle in Serverräumen. Dieses Modell sorgt für eine grobe Luftreinigung, daher wurde davon ausgegangen, dass fehlende Partikel zu einer Verschmutzung führen können. Wir haben uns für die Anschaffung von F5-Feinfiltern zum Testen entschieden, die in Klima- und Lüftungsanlagen als Filter der zweiten Stufe (Nachbehandlung) eingesetzt werden.

Die Untersuchung ist abgeschlossen – Sie können mit den Kontrollmessungen beginnen. Wir haben uns entschieden, uns an den Anforderungen der Norm ISO 14644-1 für die Anzahl der Schwebeteilchen zu orientieren.

Seien wir ehrlich zum Rechenzentrum: Wie wir das Staubproblem in den Serverräumen des Rechenzentrums gelöst haben
Klassifizierung von Reinräumen nach der Anzahl der Schwebeteilchen.

Es scheint - messen und vergleichen Sie anhand der Tabelle. Doch nicht alles ist so einfach: In der Praxis erwies es sich als recht schwierig, Luftreinheitsstandards für Serverräume von Rechenzentren zu finden. Dies wird nirgendwo, von keiner Organisation oder Brancheninstitution ausdrücklich angegeben. Und nur im internen Uptime Inside Track-Forum (Zugriff darauf steht Personen zur Verfügung, die eine Ausbildung in den Uptime Institute-Programmen abgeschlossen haben) gab es eine gesonderte Diskussion zu diesem Thema. Aufgrund der Ergebnisse seiner Studie waren wir geneigt, uns auf die ISO 8-Norm zu konzentrieren – die vorletzte in der Klassifizierung.

Schon die ersten Messungen zeigten, dass wir uns selbst unterschätzt hatten – die Ergebnisse von Innenlufttests zeigten die Einhaltung der ISO 5-Anforderungen in Innenräumen, was die von den Uptime Inside Track-Teilnehmern gewünschten Standards deutlich übertraf. Gleichzeitig mit großem Spielraum. Wir haben ein Rechenzentrum und natürlich kein biologisches Labor, aber damit die Partikelkonzentration in der Luft ISO 8 entspricht, muss es sich mindestens um ein Objekt der Klasse „Zementwerk“ handeln. Und wie derselbe Standard auf ein Rechenzentrum angewendet werden kann, ist nicht ganz klar. Gleichzeitig haben wir das Ergebnis bei ISO 5 durch Messungen bei der Luftfilterung mit G4-Filtern erhalten. Das heißt, Staub kann nicht über die Luft in die Racks gelangen; die F5-Filter erwiesen sich als überflüssig und wurden nicht einmal verwendet.

Ein negatives Ergebnis ist auch ein Ergebnis: Wir haben die Suche nach der Ursache der Verschmutzung in andere Richtungen fortgesetzt und die Überwachung der Luftqualität in vierteljährliche Inspektionen einbezogen, kombiniert mit Inspektionen von BMS-Sensoren durch verifizierte Geräte (ISO 9000-Anforderungen und Kundenaudits).

Nachfolgend finden Sie ein Beispiel für einen Bericht, der auf der Grundlage der während der Messung gewonnenen Daten erstellt wird. Für eine höhere Genauigkeit werden die Messungen mit zwei Geräten durchgeführt – Testo 610 und einem BMS-Sensor. In der Kopfzeile der Tabelle sind die Grenzwerte für Geräte aufgeführt. Abweichungen in den vorgegebenen Parametern werden automatisch farblich hervorgehoben, um die Identifizierung von Problembereichen oder Zeiträumen zu erleichtern.
Seien wir ehrlich zum Rechenzentrum: Wie wir das Staubproblem in den Serverräumen des Rechenzentrums gelöst haben
Bei uns ist alles klar: Der Unterschied in den Indikatoren der Geräte ist minimal und die Partikelkonzentration liegt deutlich unter dem Höchstwert.

Durch den Hintereingang

Da es neben dem Hauptkundeneingang, an dem wir die Schuhüberzugsmaschine installierten, noch weitere Eingänge zu den Reinräumen gab, musste dennoch verhindert werden, dass Schmutz durch diese in das Rechenzentrum gelangte.

Das An- und Ausziehen von Schuhüberzügen beim Entladen der Ausrüstung ist umständlich. Deshalb haben wir eine automatische Maschine zum Reinigen von Sohlen gefunden. Praktisch, funktional, aber der menschliche Faktor beeinflusst es in Form einer optionalen Herangehensweise an dieses Gerät. Im Wesentlichen das Gleiche wie bei den Schuhüberzügen am Haupteingang.

Seien wir ehrlich zum Rechenzentrum: Wie wir das Staubproblem in den Serverräumen des Rechenzentrums gelöst haben

Um das Problem zu lösen, begann man, nach Reinigungsmöglichkeiten zu suchen, die sich nicht vermeiden ließen: Klebrige Teppiche mit abnehmbaren Schichten schafften dies am besten. Bei der Autorisierung an den Eingangstüren muss sich der Besucher auf eine solche Matte stellen und überschüssigen Staub von den Schuhsohlen entfernen.

Seien wir ehrlich zum Rechenzentrum: Wie wir das Staubproblem in den Serverräumen des Rechenzentrums gelöst haben
Täglich reißen Reinigungskräfte die oberste Schicht eines solchen Teppichs ab, insgesamt sind es 60 Schichten – genug für etwa 2 Monate.

Nachdem ich unter anderem das Ericsson-Rechenzentrum in Stockholm besucht habe, habe ich gesehen, wie diese Probleme dort gelöst werden: Neben Abreißschichten werden in Schweden wiederverwendbare antibakterielle Dycem-Teppiche verwendet. Die Idee gefiel mir aufgrund des Prinzips der Wiederverwendbarkeit und der Möglichkeit, einen großen Abdeckungsbereich bereitzustellen.

Seien wir ehrlich zum Rechenzentrum: Wie wir das Staubproblem in den Serverräumen des Rechenzentrums gelöst haben
Magischer antibakterieller Teppich. Schade, kein Flugzeug, aber es hätte eins sein können – zu dem und dem Preis!

Es war für uns schwierig, Vertreter des Unternehmens in Russland zu finden und die Kosten der Lösung für unser Rechenzentrum abzuschätzen. Als Ergebnis erhielten wir einen Wert, der fast 100-mal teurer war als die Lösung mit mehrschichtigen Teppichen – ungefähr die gleichen 1 Million Rubel wie im Projekt mit Luftreinheitsmessungen. Darüber hinaus wurde deutlich, dass es notwendig war, spezielle Reinigungsmittel zu verwenden, die es natürlich nur bei diesem Hersteller gibt. Auch die Lösung verschwand von selbst, wir entschieden uns für eine mehrschichtige Variante.

Handarbeit

Ich möchte besonders darauf aufmerksam machen, dass all diese Maßnahmen nicht dazu geführt haben, dass der Einsatz von Reinigungskräften entfällt. In Vorbereitung auf die Zertifizierung des Linxdatacenter-Rechenzentrums nach dem Uptime Institute Management & Operations-Standard war es notwendig, die Handlungen der Mitarbeiter des Reinigungsdienstes auf dem Gebiet des Rechenzentrums klar zu regeln. Es wurden detaillierte Anweisungen erstellt, die vorschrieben, wo, was und wie zu tun war.

Ein paar Auszüge aus der Anleitung:

Seien wir ehrlich zum Rechenzentrum: Wie wir das Staubproblem in den Serverräumen des Rechenzentrums gelöst haben

Seien wir ehrlich zum Rechenzentrum: Wie wir das Staubproblem in den Serverräumen des Rechenzentrums gelöst haben

Wie Sie sehen, ist alles vorgeschrieben, buchstäblich jeder Aspekt der Arbeit in einem bestimmten Raum, Reinigungsmittel, Materialien usw. sind für die Verwendung akzeptabel. Kein einziges Detail bleibt unbeachtet, auch nicht das kleinste. Anweisung – von jedem Servicemitarbeiter unterzeichnet. In Serverräumen, Elektroräumen usw. Sie werden nur in Anwesenheit autorisierter Mitarbeiter des Rechenzentrums, beispielsweise des diensthabenden Ingenieurs, entfernt.

Aber das ist nicht alles

Ebenfalls in der Liste der Maßnahmen zur Gewährleistung der Sauberkeit im Rechenzentrum enthalten: Begehungen mit visueller Inspektion der Räumlichkeiten, einschließlich wöchentlicher Inspektionen der Racks, um darin verbliebene Drahtreste sowie Verpackungsreste von Geräten und Komponenten zu erkennen. Für jede dieser Episoden wird ein Vorfall eröffnet und der Kunde erhält eine Benachrichtigung über die Notwendigkeit, Verstöße so schnell wie möglich zu beseitigen.

Außerdem haben wir einen separaten Raum zum Auspacken und Aufstellen der Ausrüstung geschaffen – auch dies ist Teil der Reinigungspolitik des Unternehmens.  

Eine weitere Maßnahme, die wir aus der Praxis von Ericsson gelernt haben, ist die Aufrechterhaltung eines konstanten Luftdrucks in Serverräumen: Der Druck innerhalb der Räume ist höher als draußen, so dass kein Luftzug entsteht – auf diese Lösung gehen wir in einem separaten Artikel näher ein.

Schließlich haben wir uns Roboterassistenten für Räumlichkeiten besorgt, die von der Liste der für den Besuch des Reinigungspersonals zur Verfügung stehenden Räume ausgeschlossen sind.

Seien wir ehrlich zum Rechenzentrum: Wie wir das Staubproblem in den Serverräumen des Rechenzentrums gelöst haben
Das Gitter oben erhöht nicht nur den Schutz des Roboters um +10, sondern verhindert auch, dass er unter den vertikalen Kabelkanälen der Racks hängen bleibt.

Ein unerwarteter Fund als Fazit

Sauberkeit im Rechenzentrum ist wichtig für den Betrieb von Server- und Netzwerkgeräten, die Luft durch das Rechenzentrum ziehen. Bei Überschreitung der zulässigen Staubkonzentration kommt es zu Staubansammlungen auf Bauteilen und einer Gesamttemperaturerhöhung von bis zu 1 Grad Celsius. Staub verringert die Kühleffizienz, was zu erheblichen indirekten Kosten pro Jahr führen und sich auch auf die Fehlertoleranz der gesamten Anlage auswirken kann.

Dies mag eine spekulative Annahme sein, aber die Experten des Uptime Institute, die das Linxdatacenter-Rechenzentrum nach dem Management & Operations-Qualitätsstandard zertifiziert haben, legen größten Wert auf Sauberkeit. Und umso erfreulicher war es, in diesem Bereich die schmeichelhaftesten Bewertungen zu erhalten: Unser Rechenzentrum in St. Petersburg übertrifft die Zertifizierungsanforderungen deutlich. Ein Institutsexperte bezeichnete uns als „das sauberste Rechenzentrum, das er je gesehen hat“. Darüber hinaus dient unser Rechenzentrum Uptime als Beispiel für die Lösung des Problems sauberer Serverräume. Außerdem bestehen wir jedes Kundenaudit hinsichtlich dieses Parameters problemlos – die anspruchsvollsten Anforderungen der launischsten Kunden werden über alle Maßen erfüllt.

Kehren wir zum Anfang der Geschichte zurück. Woher kam die Kontamination laut der Beschwerde am Anfang des Artikels? Der Teil des Racks des Kunden, der der Grund für den Start des gesamten Projekts „Clean in the Data Center“ war, war vom Moment des Imports und der Installation des Racks im Rechenzentrum an kontaminiert. Der Kunde hatte das Rack nicht gereinigt, als es in den Serverraum gebracht wurde – bei der Überprüfung benachbarter gleichzeitig installierter Racks stellte sich heraus, dass die Situation mit Staub dort genauso war. Diese Situation führte dazu, dass der Rack-Installations-Checkliste des Kunden ein Reinigungskontrollpunkt hinzugefügt wurde. Wir sollten auch nie die Wahrscheinlichkeit solcher Dinge vergessen = Vorgewarnt ist gewappnet. Hier dreht sich alles um „Sauberkeit und Diktatur“ in unserem Rechenzentrum; im nächsten Artikel werde ich über Drucksensoren sprechen, aber stellen Sie vorerst Fragen in den Kommentaren.

Source: habr.com

Kommentar hinzufügen