坦白数据中心:我们是如何解决数据中心机房的灰尘问题的

坦白数据中心:我们是如何解决数据中心机房的灰尘问题的

嘿哈布尔! 我是圣彼得堡 Linxdatacenter 数据中心的主管 Taras Chirkov。 今天,在我们的博客中,我将讨论保持房间清洁度在现代数据中心正常运行中的作用,如何正确测量、实现和保持在正确的水平。

纯度触发器

有一天,圣彼得堡一家数据中心的一位客户联系我们,询问设备机架底部有一层灰尘。 这成为调查的起点,第一个假设如下:

  • 灰尘从数据中心员工和客户的鞋底进入服务器机房,
  • 通过通风系统,
  • 两个都。

蓝色鞋套——进入历史的垃圾箱

我们从鞋子开始。 当时解决清洁问题的传统方式是:入口处放一个带鞋套的容器。 该方法的有效性没有达到预期的水平:数据中心的客人很难控制它们的使用,格式本身也不方便。 它很快就被放弃了,取而代之的是更先进的鞋套机技术。 我们安装的此类设备的第一个型号失败了:在尝试将鞋套套在鞋子上时,机器经常撕破鞋套,使用它比让生活更轻松更烦人。

参考了华沙和莫斯科同事的经验并没有解决问题,因此选择了热熔胶粘在鞋子上的技术。 借助热敏胶片,您可以在任何鞋底的鞋子上套上“鞋套”——直至女性细跟。 是的,薄膜有时也会脱落,但比经典的蓝色鞋套要少得多,而且技术本身对游客来说方便很多倍,也更现代。 另一个重要的(对我来说)优点是薄膜可以轻松覆盖最大的鞋码,不像传统的鞋套在尝试穿上 45 码时会撕裂。 为了使流程更加现代化,垃圾箱安装了通过运动传感器自动打开盖子的功能。

这个过程看起来像这样:  

坦白数据中心:我们是如何解决数据中心机房的灰尘问题的
客人们立即对这项创新表示赞赏。

风中的尘埃

整理好最明显的可能污染太空的渠道后,我们开始处理更微妙的问题——空气。 由于过滤不充分,很可能有很大一部分灰尘通过通风进入服务器机房,或者从街道带入。 还是清洁质量差? 调查继续进行。

我们决定对数据中心内空气中的颗粒物含量进行测量,并请来专门从事专用洁净室空气质量控制的实验室来开展这项工作。

实验室工作人员测量了控制点的数量 (20),编制了采样时间表以跟踪动态并创建最准确的图片。 实验室整个测量过程的成本大约是1万卢布,这在我们看来完全不合适,但给出了一些独立实施的思路。 一路走来,很明显实验室很好,但分析必须在动态中进行,而且不断求助于他们的服务非常不方便。

在查看了实验室的计划活动后,我们决定寻找更实用的独立工作设备。 因此,我们设法找到了完成这项任务所需的工具——空气质量分析仪。 这是一个:

坦白数据中心:我们是如何解决数据中心机房的灰尘问题的
该设备显示不同直径(以微米为单位)的颗粒含量。

重新定义标准

该设备分析颗粒数量、温度、湿度,并根据该参数的 ISO 标准以测量单位显示结果。 显示屏显示空气样本中不同直径颗粒的水平。

同时,他们也反对过滤器:当时,服务器机房内使用的是 G4 过滤器模型。 该模型提供了粗略的空气净化,因此,假设了通过导致污染的颗粒的可能性。 我们决定采购F5精细过滤器进行测试,用于空调和通风系统作为第二级净化(后处理)的过滤器。

调查已经进行 - 您可以继续控制测量。 我们决定使用 ISO 14644-1 标准对悬浮颗粒量的要求作为指导。

坦白数据中心:我们是如何解决数据中心机房的灰尘问题的
根据悬浮颗粒的数量对洁净室进行分类。

看起来-根据表格进行测量和比较。 但并非一切都那么简单:在实践中,事实证明很难找到数据中心服务器机房的空气纯度标准。 这在任何地方都没有明确说明,任何组织或行业机构都没有明确说明。 并且只有在内部论坛 Uptime Inside Track(接受过 Uptime Institute 计划培训的人员可以访问)上,才有关于此主题的单独讨论。 根据其研究结果,他们倾向于关注 ISO 8 标准——该分类中的倒数第二个标准。

最初的测量表明我们低估了自己——室内空气测试的结果表明室内区域符合 ISO 5 要求,这大大超过了 Uptime Inside Track 参与者所期望的标准。 同时-有很大的余地。 我们有一个数据中心,当然不是生物实验室,但要使空气中的颗粒物浓度等于 ISO 8,它必须至少是“水泥厂”级别的对象。 如何将相同的标准应用于数据中心还不是很清楚。 同时,我们通过在使用 G5 过滤器进行空气过滤期间进行测量,获得了 ISO 4 的结果。 也就是说,灰尘无法通过空气进入机架,F5 过滤器被证明是多余的,甚至没有使用。

负面结果也是一个结果:我们继续从其他方向寻找污染原因,并将空气质量控制纳入季度检查,并结合经过验证的设备(ISO 9000 要求和客户审核)对 BMS 传感器进行检查。

以下是根据测量期间获得的数据填写的报告示例。 为了获得更高的准确性,测量由两个设备进行 - Testo 610 和 BMS 传感器。 表格的标题显示了设备的限值。 指定参数的偏差会自动用颜色高亮显示,方便识别问题区域或时间段。
坦白数据中心:我们是如何解决数据中心机房的灰尘问题的
我们都很清楚:设备性能的差异很小,颗粒浓度远低于极限。

通过后门

由于除客户主入口外,无尘室还有其他入口,我们在主入口安装了鞋套机,因此仍然有必要防止灰尘通过它们进入数据中心。

在卸设备的过程中穿脱鞋套不方便,所以我们找到了清洁鞋底的机器。 方便、实用,但人为因素会影响该设备的可选方法。 事实上,与主入口处的鞋套相同。

坦白数据中心:我们是如何解决数据中心机房的灰尘问题的

为了解决这个问题,他们开始寻找无法避免的清洁方法:带有可剥离层的粘性地毯效果最好。 在入口处的授权过程中,访客必须站在这样的地毯上,清除鞋底多余的灰尘。

坦白数据中心:我们是如何解决数据中心机房的灰尘问题的
清洁工每天都会撕掉这种地毯的表层,总共有 60 层——足够使用大约 2 个月。

在参观了斯德哥尔摩的爱立信数据中心后,我注意到这些问题在那里是如何解决的:除了可撕裂层,瑞典还使用 Dycem 可重复使用的抗菌地毯。 我喜欢这个想法,因为可重用性原则和提供大覆盖区域的能力。

坦白数据中心:我们是如何解决数据中心机房的灰尘问题的
神奇抗菌地毯。 很遗憾,不是飞机,但它可以 - 以这样的价格!

我们好不容易找到了俄罗斯公司的代表,并为我们的数据中心估算了解决方案的成本。 结果,我们得到的数字几乎是多层地毯解决方案的 100 倍 - 与空气纯度测量项目中的成本大约相同 1 万卢布。 此外,事实证明需要使用特殊的清洁产品,自然只能从该制造商处获得。 这个决定也自己消失了,我们选择了一个多层版本。

体力劳动

我特别想提请注意,所有这些措施并没有取消清洁工的使用。 作为根据 Uptime Institute 管理和运营标准对 Linxdatacenter 数据中心进行认证的准备工作的一部分,有必要明确规范清洁服务员工在数据中心范围内的行为。 制定了详细的说明,规定了他们应该在哪里、做什么以及如何做。

手册中的一些摘录:

坦白数据中心:我们是如何解决数据中心机房的灰尘问题的

坦白数据中心:我们是如何解决数据中心机房的灰尘问题的

如您所见,一切都是规定好的,从字面上看,特定房间的工作、清洁产品、材料等的每个方面都可以使用。 没有一个细节,即使是最小的细节,也没有被忽视。 简报 - 在服务的每个员工的签名下。 在服务器机房、电气室等。 只有在获得授权的数据中心员工(例如值班工程师)在场的情况下才能移除它们。

但这还不是全部

在确保数据中心清洁度的措施清单上还有:步行对场所进行目视检查,包括每周检查机架以检测留在其中的电线废料、设备和组件的包裹残留物。 对于每个这样的情节,都会启动一个事件,客户会收到有关需要尽快消​​除违规行为的通知。

此外,为了打开包装和安装设备,我们创建了一个单独的房间——这也是公司清洁政策的一部分。  

我们从爱立信的实践中学到的另一项措施是保持服务器机房的空气供应恒定:机房内的压力比外面大,所以里面没有气流——我们将在另一篇文章中更详细地讨论这个解决方案。

最后,我们为自己的场所配备了机器人助手,这些助手不在可供清洁人员访问的列表中。

坦白数据中心:我们是如何解决数据中心机房的灰尘问题的
顶部的格栅不仅为机器人提供了 +10 的保护,而且还使其不会卡在机架的垂直电缆槽下方。

一个意想不到的发现作为结论

数据中心的清洁度对于服务器和网络设备的运行非常重要,这些设备会自行吸入空气。 超过灰尘限制会导致灰尘积聚在组件上,并导致整体温度升高高达 1 摄氏度。 灰尘会降低冷却效率,就一年而言,这会转化为巨大的间接成本,并会影响整个设施的容错能力。

我们可以说这是一个推测性的假设,但对 Linxdatacenter 数据中心进行运营管理 (Management & Operations) 质量标准认证的 Uptime Institute 专家最重视清洁度。 更令人高兴的是,在该领域获得了最受好评的评估:我们在圣彼得堡的数据中心严重超过了认证要求。 一位研究所专家称我们为“他见过的最干净的数据中心”,而且我们的数据中心被Uptime作为如何解决机房清洁问题的例子。 此外,我们可以轻松通过此参数的任何客户审核 - 可以满足最反复无常的客户的最严格要求。

让我们回到故事的开头。 文章开头同一个投诉的污染是从哪里来的? 引发整个“数据中心清洁”项目的客户机架部分,从机架被运进数据中心并安装到数据中心的那一刻起就被污染了。 客户在将机架带入服务器机房时尚未清洁机架——当检查同时安装的相邻机架时,发现那里的灰尘情况是一样的。 这种情况促使在客户的机架安装清单中添加清洁控制点。 这种事情的可能性也永远不应该被忘记=预先警告,因此武装。 这就是我们数据中心的“纯粹和独裁”,在下一篇文章中我将讨论压力传感器,但现在,请在评论中提问。

来源: habr.com

添加评论