数据中心的机器人:人工智能如何发挥作用?

在经济数字化转型的过程中,人类不得不建设越来越多的数据处理中心。 数据中心本身也必须进行转型:其容错和能源效率问题现在比以往任何时候都更加重要。 设施消耗大量电力,其中关键 IT 基础设施发生故障会给企业带来高昂的代价。 人工智能和机器学习技术正在为工程师提供帮助——近年来,它们越来越多地被用来创建更先进的数据中心。 这种方法提高了设施的可用性,减少了故障数量并降低了运营成本。

它是如何工作的呢?

人工智能和机器学习技术用于根据从各种传感器收集的数据自动制定运营决策。 通常,此类工具与 DCIM(数据中心基础设施管理)类系统集成,允许您预测紧急情况的发生,并优化 IT 设备、工程基础设施甚至服务人员的操作。 通常,制造商会向数据中心所有者提供云服务,以积累和处理来自许多客户的数据。 此类系统概括了运营不同数据中心的经验,因此比本地产品运行得更好。

IT基础设施管理

HPE推广云预测分析服务 资讯视界 管理基于 Nimble Storage 和 HPE 3PAR StoreServ 存储系统、HPE ProLiant DL/ML/BL 服务器、HPE Apollo 机架系统和 HPE Synergy 平台构建的 IT 基础设施。 InfoSight 分析设备中安装的传感器的读数,每秒处理超过一百万个事件,并不断自我学习。 该服务不仅可以检测故障,还可以在 IT 基础设施出现问题(设备故障、存储容量耗尽、虚拟机性能下降等)之前对其进行预测。 对于预测分析,VoltDB 软件部署在云端,使用自回归预测模型和概率方法。 Tegile Systems 为混合存储系统提供了类似的解决方案:IntelliCare Cloud Analytics 云服务监控设备的运行状况、性能和资源使用情况。 Dell EMC 在其高性能计算解决方案中也使用了人工智能和机器学习技术。 类似的例子还有很多;几乎所有领先的计算设备和数据存储系统制造商现在都在走这条路。

电源和冷却

人工智能在数据中心的另一个应用领域与工程基础设施的管理有关,尤其是冷却,其在设施总能耗中所占的份额可能超过30%。 谷歌是最早考虑智能冷却的公司之一:2016 年,它与 DeepMind 一起开发了 人工智能系统 用于监控各个数据中心组件,从而将空调能源成本降低了 40%。 最初只是给工作人员提示,后来经过改进,现在可以独立控制机房制冷。 部署在云端的神经网络处理来自数千个室内和室外传感器的数据:它根据服务器负载、温度、室外风速和许多其他参数做出决策。 云系统提供的指令被发送到数据中心,并由本地系统再次检查安全性,而工作人员可以随时关闭自动模式并开始手动管理冷却。 Nlyte Software 与 IBM Watson 团队共同创建 决定,它收集有关温度和湿度、能源消耗和 IT 设备负载的数据。 它允许您优化工程子系统的运行,并且不需要连接到制造商的云基础设施——如果需要,该解决方案可以直接部署在数据中心。

其他例子

市场上有很多针对数据中心的创新智能解决方案,并且新的解决方案不断出现。 Wave2Wave 创建了一个机器人光纤电缆交换系统,可以自动组织数据中心内流量交换节点(Meet Me Rooms)的交叉连接。 ROOT Data Center 和 LitBit 开发的系统使用人工智能来监控备用柴油发电机组,Romonet 创建了用于优化基础设施的自学习软件解决方案。 Vigilent 创建的解决方案使用机器学习来预测故障并优化数据中心场所的温度条件。 数据中心流程自动化引入人工智能、机器学习和其他创新技术的时间相对较晚,但如今已成为行业发展最有前途的领域之一。 当今的数据中心已经变得太大、太复杂,无法进行有效的手动管理。

来源: habr.com

添加评论