說實話資料中心:我們是如何解決資料中心伺服器機房灰塵問題的

說實話資料中心:我們是如何解決資料中心伺服器機房灰塵問題的

你好,哈布爾! 我是聖彼得堡 Linxdatacenter 資料中心主任 Taras Chirkov。 今天在我們的部落格中,我將討論保持房間清潔度在現代資料中心的正常運作中扮演什麼角色,如何正確測量它、實現它並將其保持在所需的水平。

觸發純度

有一天,聖彼得堡一家資料中心的客戶聯絡我們,詢問設備機架底部有一層灰塵。 這成為調查的起點,第一個假設如下:

  • 灰塵從資料中心員工和客戶的鞋底進入伺服器機房,
  • 透過通風系統引入,
  • 兩個都。

藍色鞋套-被丟進歷史的垃圾箱

我們從鞋子開始。 當時的清潔問題是用傳統方式解決:入口處放一個裝有鞋套的容器。 此方法的有效性沒有達到預期的水平:很難控制資料中心訪客的使用,而且格式本身也不方便。 它們很快就被放棄,取而代之的是鞋套機等更先進的技術。 我們安裝的第一個模型是失敗的:當試圖將鞋套放在鞋子上時,機器經常會撕裂鞋套,它的使用比讓生活更輕鬆更煩人。

參考華沙和莫斯科同事的經驗並沒有解決問題,最後選擇了將熱敏膜熔合到鞋子上的技術。 使用熱敏薄膜,您可以將“鞋套”放在任何鞋底的鞋子上,甚至是女式細鞋跟。 是的,薄膜有時也會滑落,但比經典的藍色鞋套少得多,而且技術本身對遊客來說更方便,也更現代。 另一個(對我來說)重要的優點是,該薄膜可以輕鬆覆蓋最大的鞋子尺碼,這與傳統的鞋套不同,傳統的鞋套在嘗試將鞋子穿上 45 碼時會撕裂。 為了使這個過程更加現代化,他們安裝了使用運動感應器自動打開蓋子的垃圾箱。

過程如下所示:  

說實話資料中心:我們是如何解決資料中心伺服器機房灰塵問題的
客人們立即對這項創新表示讚賞。

風中的塵埃

在整理了可能的太空污染最明顯的管道之後,我們開始討論更微妙的問題——空氣。 由於過濾不充分,很大一部分灰塵可能會透過通風進入伺服器機房,或從街道帶入。 還是清潔品質差造成的? 調查仍在繼續。

我們決定對資料中心內空氣中的顆粒物含量進行測量,並邀請了專門監測專用無塵室空氣品質的實驗室來進行這項工作。

實驗室工作人員測量了控制點的數量 (20) 並創建了採樣計劃來追蹤動態並創建最準確的圖片。 整個實驗室測量過程的成本約為1萬盧布,這對我們來說似乎完全不切實際,但它給了我們一些獨立實施的想法。 一路走來,我們發現實驗室是好的,但分析必須動態地進行,不斷地求助於他們的服務是極其不方便的。

在研究了實驗室計劃的活動後,我們決定尋找更實用的設備來進行獨立工作。 結果,我們設法找到了完成這項任務所需的工具——空氣品質分析儀。 像這樣:

說實話資料中心:我們是如何解決資料中心伺服器機房灰塵問題的
此裝置顯示不同直徑(微米)顆粒的含量。

重新定義標準

本設備分析顆粒數量、溫度、濕度,並根據該參數的 ISO 標準以測量單位顯示結果。 顯示幕顯示空氣樣本中不同直徑顆粒的含量。

同時,他們在過濾器方面也犯了一個錯誤:當時他們在伺服器機房內使用了G4過濾器模型。 該模型提供了粗略的空氣淨化,因此假設了丟失顆粒導致污染的可能性。 我們決定購買F5精細過濾器進行測試,用於空調和通風系統作為二級過濾器(後處理)。

調查已經進行—您可以開始控制測量。 我們決定使用 ISO 14644-1 標準對懸浮顆粒數量的要求作為指引。

說實話資料中心:我們是如何解決資料中心伺服器機房灰塵問題的
潔淨室依懸浮顆粒物的數量分類。

看起來-根據表格進行測量和比較。 但事情並非如此簡單:在實務上,發現資料中心伺服器機房的空氣清潔度標準相當困難。 任何組織或行業機構都沒有明確說明這一點。 只有在內部 Uptime Inside Track 論壇(完成 Uptime Institute 計劃培訓的人員才能訪問該論壇)上有關此主題的單獨討論。 根據其研究結果,我們傾向於關注 ISO 8 標準 - 分類中倒數第二個標準。

第一次測量顯示我們低估了自己 - 內部空氣測試結果顯示內部場所符合 ISO 5 要求,這大大超出了 Uptime Inside Track 參與者期望的標準。 同時,還有較大的餘裕。 我們有一個資料中心,當然不是生物實驗室,但要使空氣中的顆粒濃度等於 ISO 8,它必須至少是「水泥廠」等級的對象。 而同樣的標準如何應用在資料中心還不是很清楚。 同時,我們透過使用 G5 過濾器過濾空氣時進行測量,獲得了 ISO 4 的結果。 也就是說,灰塵無法通過空氣進入機架;F5 過濾器被證明是多餘的,甚至沒有被使用。

陰性結果也是結果:我們繼續向其他方向尋找污染原因,將空氣品質監測納入季度檢查,並結合經過驗證的設備對 BMS 感測器的檢查(ISO 9000 要求和客戶審核)。

以下是根據測量期間獲得的數據填寫的報告範例。 為了獲得更高的精度,使用兩台設備進行測量 - Testo 610 和 BMS 感測器。 表頭顯示了設備的限值。 指定參數的偏差會自動以顏色突出顯示,以便於識別問題區域或時間段。
說實話資料中心:我們是如何解決資料中心伺服器機房灰塵問題的
我們很清楚:設備指標的差異很小,顆粒物濃度遠低於最大限值。

透過後門

由於除了我們安裝套鞋機的主要客戶入口之外,無塵室還有其他入口,因此仍需要防止灰塵通過這些入口進入資料中心。

設備卸貨過程中穿脫鞋套不方便,所以我們找到了自動鞋底清洗機。 方便、實用,但人為因素會以該設備的可選方法的形式影響它。 與正門的鞋套基本相同。

說實話資料中心:我們是如何解決資料中心伺服器機房灰塵問題的

為了解決這個問題,他們開始尋找不可避免的清潔方案:帶有可拆卸層的黏性地毯是最好的解決方案。 在入口處的授權過程中,訪客必須站在這樣的墊子上,清除鞋底上多餘的灰塵。

說實話資料中心:我們是如何解決資料中心伺服器機房灰塵問題的
清潔工每天都會撕掉這種地毯的頂層;總共有 60 層 - 足夠使用大約 2 個月。

除此之外,在參觀了斯德哥爾摩的愛立信資料中心後,我注意到這些問題是如何解決的:瑞典使用了可重複使用的抗菌 Dycem 地毯以及可撕下層。 我喜歡這個想法,因為它具有可重複使用原則和提供大覆蓋區域的能力。

說實話資料中心:我們是如何解決資料中心伺服器機房灰塵問題的
神奇抗菌地毯。 遺憾的是,不是飛機,但它本來可以——以這樣那樣的價格!

我們費了很大勁才找到該公司在俄羅斯的代表,並評估了我們資料中心解決方案的成本。 結果,我們得到的數字幾乎比多層地毯解決方案貴 100 倍 - 大約與空氣純度測量項目中的 1 萬盧布相同。 此外,很明顯有必要使用特殊的清潔產品,這些產品自然只能從該製造商處獲得。 該解決方案本身也消失了;我們選擇了多層選項。

體力勞動

我特別想提請注意的是,所有這些措施並沒有取消清潔工的勞動力。 在準備根據 Uptime Institute 管理和營運標準對 Linxdatacenter 資料中心進行認證時,有必要明確規範資料中心範圍內清潔服務員工的行為。 制定了詳細的指示,規定了他們需要在哪裡、做什麼以及如何做。

說明中的一些摘錄:

說實話資料中心:我們是如何解決資料中心伺服器機房灰塵問題的

說實話資料中心:我們是如何解決資料中心伺服器機房灰塵問題的

正如您所看到的,一切都是規定的,實際上是特定房間中工作的每個方面、清潔劑、材料等都可以使用。 沒有一個細節被忽視,即使是最小的細節。 說明 – 由每位服務員工簽署。 在伺服器機房、電氣室等。 僅在授權資料中心員工(例如值班工程師)在場時才可移除。

但這還不是全部

確保資料中心清潔度的措施清單中還包括:對場所進行目視檢查,包括每週檢查機架以檢測留在其中的線屑、設備和組件的包裝殘留物。 對於每個此類事件,都會開啟一個事件,並且客戶會收到有關需要盡快消除違規行為的通知。

此外,我們還創建了一個單獨的房間用於拆包和安裝設備——這也是公司清潔政策的一部分。  

我們從愛立信的實踐中學到的另一個措施是保持伺服器機房的氣壓恆定:機房內部的壓力大於外部,因此不會有向內的氣流- 我們將在另一篇文章中更詳細地討論這個解決方案。

最後,我們為那些被排除在清潔人員可以訪問的場所之外的場所配備了機器人助手。

說實話資料中心:我們是如何解決資料中心伺服器機房灰塵問題的
頂部的網格不僅可以為機器人提供 +10 的保護,還可以防止其卡在機架的垂直電纜橋架下。

意外的發現作為結論

資料中心的清潔度對於透過其中吸入空氣的伺服器和網路設備的運作非常重要。 超過允許的灰塵水平將導致組件上灰塵積聚,並且總溫度升高最多 1 攝氏度。 灰塵會降低冷卻效率,每年產生大量間接成本,也會影響整個設施的容錯能力。

這可能是一個推測性的假設,但 Uptime Institute 的專家對 Linxdatacenter 資料中心進行了管理和營運品質標準認證,他們對清潔度給予了極大的關注。 更令人高興的是,我們在該領域獲得了最令人稱讚的評估:我們位於聖彼得堡的資料中心嚴重超出了認證要求。 一位研究所專家稱我們為“他所見過的最乾淨的資料中心”,而且我們的資料中心也被Uptime用作如何解決乾淨伺服器機房問題的範例。 此外,我們可以輕鬆地通過任何客戶對此參數的審核 - 最反复無常的客戶的最嚴格的要求得到了無法估量的滿足。

讓我們回到故事的開頭。 根據文章開頭的投訴,污染來自哪裡? 整個「資料中心清潔」計畫啟動的客戶機架部分從機架進口並安裝到資料中心的那一刻起就受到污染。 客戶在將機架帶入機房時並未對機架進行清潔,當檢查同時安裝的相鄰機架時,發現同樣有灰塵的情況。 這種情況促使客戶的機架安裝清單中新增了清潔控制項目。 我們也不應該忘記發生這種事情的可能性=預先警告就是做好準備。 這都是關於我們資料中心的「清潔和獨裁」;在下一篇文章中我將討論壓力感測器,但現在請在評論中提出問題。

來源: www.habr.com

添加評論