基于华为企业设备构建数据中心现代ICT基础设施的HiDC解决方案

在鸟瞰了 2020 年推出的所有现代华为企业解决方案后,我们接下来将介绍有关个人想法和产品的更有针对性和更详细的故事,这些想法和产品可以作为大型企业和政府机构数字化转型的基础。 今天我们来聊聊华为提出的构建数据中心的理念和技术。

基于华为企业设备构建数据中心现代ICT基础设施的HiDC解决方案

在互联世界时代,数据存储和处理挑战需要在数据中心生命周期的各个阶段采用新方法。 它们必须同时变得更简单、更智能,以应对其作为全球数字经济基础设施核心要素的角色。

2018 年,人类存储了 33 ZB 的信息,但到 2025 年,其总量将增加五倍以上。 三十年ICT基础设施发展经验,使华为能够应对日益严峻的“数据海啸”,为合作伙伴和客户提供智能数据中心的理念,包括建设、运营和维护的各个阶段。 这个概念的各个元素统一在通用名称 HiDC 下。

基于华为企业设备构建数据中心现代ICT基础设施的HiDC解决方案

数字化

网络上流传着一个新鲜的笑话:谁对你们公司的数字化转型加速最快——CEO、CTO、董事会? 冠状病毒流行! 只有懒惰的人才不会举办网络研讨会,不会写文章,不会告诉人们如何做以及做什么。 但这些都是反应性的行为。 有些是提前准备好的。

不是为了吹牛,出于客观原因,我们以我们公司为例,几年前就大规模启动了数字化转型。 目前,我们几乎可以将所有员工转移到家里工作,而不会造成任何效率损失。 武汉市十天内建成一家医院的故事就具有代表性。 在那里,数字化转型的表现是三天内就完成了所有IT系统的部署。 因此,数字化转型不是“何时”和“为什么”的问题,而是“如何”的问题。

基于华为企业设备构建数据中心现代ICT基础设施的HiDC解决方案

架构方法而不是自发开发

当我们开始构建某个系统时,我们面临的主要问题是什么? 到目前为止,我们所有的客户都以业务任务与应用服务和IT解决方案相结合的方式工作。 如果只是通过添加各种块来创建这样一个综合体,那么很难对它的功能有一个总体了解。 为了将系统构建为单一有机体,首先需要一种架构方法。 这就是我们在 HiDC 解决方案的理念中所体现的内容。

基于华为企业设备构建数据中心现代ICT基础设施的HiDC解决方案

最大价值和最小成本

整个HiDC结构由两个主要切片组成。 第一个是大家在华为看到的——经典基础设施。 第二个切片的元素最容易与术语“智能数据”结合起来。

为什么这是必要的? 如今,许多公司积累了大量信息,这些信息通常分散或通过各种类型的“垫片”访问。 是的,至少采用普通数据库。 询问数据库管理员这些数据库如何组合在一起,以及如何在 BI 系统中使用它们的信息来做出业务决策。 令人惊讶的是,数据库彼此之间的连接通常非常松散,并且充当单独的“孤岛”。 因此,我们首先思考什么样的架构方法可以消除这个问题。

基于华为企业设备构建数据中心现代ICT基础设施的HiDC解决方案

HiDC架构设计原理

我们来看看HiDC设计的基本原理。 这主要不是对任何特定领域的专家有用,而是对能够了解整个全景的解决方案架构师有用。

最常见的是融合网络块和数据管理块。 这里出现了一个解决方案架构师很少考虑的概念:数据生命周期管理。 它已经从经典数据库迁移到许多其他系统,包括云和边缘计算。

边缘计算变得越来越普遍。 最明显的使用例子是带有自动驾驶仪的汽车,建议从单一平台进行控制。 此外,“绿色”技术已成为一种趋势——能源效率更高,对环境造成的损害最小。 您可以通过转向智力资源来实现这两者(稍后会详细介绍)。

很高兴我们能够使用 HiDC 结构的所有六个模块。 确实,客户经常在以前创建的环境中工作。 然而,即使使用上图中的一个块也能取得成果。 如果你添加第二个、第三个等等,就会开始出现协同效应。 网络和分布式存储的结合将产生更高的性能和更低的延迟。 块方法使​​我们能够不像行业中经常发生的那样进行混乱的开发,而是使用集成的架构方法。 嗯,块本身的开放性提供了选择最佳解决方案的自由。

基于华为企业设备构建数据中心现代ICT基础设施的HiDC解决方案

融合网络时代

最近,在全球和俄罗斯市场,我们越来越多地推广融合网络的概念。 如今,我们的客户已经在使用基于 RoCEv2(融合以太网 RDMA v2)的融合解决方案来构建分布式软件定义存储系统。 这种方法的主要优点是其开放性,并且无需创建无限数量的不同网络。

为什么以前没有这样做? 回想一下,以太网标准于 1969 年制定。 半个多世纪以来,积累了很多问题,但华为学会了解决这些问题。 现在,通过一些额外的步骤,我们可以将以太网用于关键任务应用、高负载解决方案等。

基于华为企业设备构建数据中心现代ICT基础设施的HiDC解决方案

从 DCN 到 DCI

下一个重要趋势是DCI(数据中心互连)实施的协同效应。 与中国不同,在俄罗斯,类似的事情只能在电信运营商身上找到。 当客户考虑数据中心的网络解决方案时,他们通常没有足够重视光网络和经典IP解决方案在单点存在的深度集成。 他们使用在IP层工作的熟悉的解决方案,这对他们来说已经足够了。

那DCI是干什么用的呢? 想象一下 DWDM 节点管理员和网络管理员独立行事。 在某些时候,其中任何一个的失败都会严重降低你的弹性。 如果我们使用协同原理,则在执行 IP 路由时会考虑光网络上发生的情况。 这种智能服务的使用显着提高了整个系统的可用性水平。

我们的 DCI 的另一个重要优势是其巨大的性能裕度。 通过总结 C 和 L 系列的功能,您可以获得大约 220 个 lambda。 鉴于我们当前的解决方案允许通过每个 lambda 传输高达 400 Gbit/s 的数据,即使是大型企业客户,这样的储备也不太可能很快耗尽。 未来在同样的设备上将有可能达到800Gbit/s。

我们通过经典的开放接口提供的整体可管理性提供了额外的便利。 NETCONF不仅管理交换机,还管理光复用设备,这使您能够实现各个级别的融合,并将系统视为一种智能资源,而不是一组“盒子”。

基于华为企业设备构建数据中心现代ICT基础设施的HiDC解决方案

边缘计算越来越重要

很多人都听说过边缘计算。 那些参与云和传统数据中心的人应该记住,我们最近看到了向边缘计算的重大转变。

是什么原因造成的? 让我们看看常见的部署模型。 现在有很多关于“智能城市”、“智能住宅”等的讨论。这个概念可以让开发商创造附加值并提高房产的价格。 “智能家居”可以识别居住者的身份,让他进出,并为他提供某些服务。 据统计,此类服务使公寓价格上涨约10-15%,总体上可以刺激新商业模式的发展。 另外,关于自动驾驶仪的概念已经说过了。 很快,5G和Wi-Fi 6技术的发展将为智能家居、汽车和执行边缘计算的主数据中心之间的数据传输提供极低的延迟。 这意味着将有可能执行大量与重要数据处理相关的操作。 为了解决这些问题,特别是可以使用已经供应给俄罗斯的神经处理器。

刚才概述的趋势的前景是不可否认的。 例如,让我们想象一个智能城市交通管理系统,能够切换交通灯、调节特定街道的交通负载,甚至在紧急情况下采取适当的措施。

基于华为企业设备构建数据中心现代ICT基础设施的HiDC解决方案

现在让我们来看看我们提供 HiDC 概念实现的资源。

计算

当我们需要实现一个标准的计算系统时,当然会用到x86架构的处理器。 但一旦出现定制需求,就该考虑更多样化的解决方案。

例如,ARM 处理器由于具有大量内核,非常适合高度并行应用。 多线程可带来约 30% 的性能提升。

当低延迟至关重要时,现场可编程逻辑集成电路 (FPGA) 就发挥了重要作用。

解决机器学习问题时主要需要神经处理器。 如果对于特定的实现,我们需要 16 个机架,每个机架有 8 个服务器,并装有神经处理器,那么基于 x86 架构的相同级别的解决方案将需要(!)大约 128 个机架。 正如您所看到的,计算类型多种多样,因此需要仔细选择硬件平台。

基于华为企业设备构建数据中心现代ICT基础设施的HiDC解决方案

数据存储

华为连续第二年呼吁合作伙伴、客户和业界同仁按照Flash Only原则构建数据存储系统。 我们的大多数客户仅在较旧的解决方案或很少使用的档案数据中使用机械主轴驱动器。

闪存系统也在不断发展。 市场上出现了英特尔傲腾等存储级内存 (SCM) 系统。 中国和日本制造商正在展示有趣的发展。 目前,SCM 在处理级别方面优于所有其他解决方案。 到目前为止,只是高昂的成本还不允许它们在任何地方使用。

同时我们看到存储系统的质量不仅在传统的后端需要提高,前端也需要提高。 现在,事实上,在新的实现中,我们通常提供并使用通过以太网的直接内存访问机制,但我们看到了客户的要求,因此,到今年年底,我们将开始更频繁地使用 NVMe over Fabrics。 此外,为了提供端到端的通用架构,该架构当然必须具有高性能并且能够抵抗控制器故障。

OceanStor Dorado存储系统是我们的旗舰产品之一。 内部测试表明,它可提供 20 万 IOPS 的性能,在八个控制器中的七个发生故障时仍能保持功能。

为何有如此大的力量? 我们来看看目前的情况。 几个月来,由于封锁,中国居民待在家里的时间明显增加。 此时的互联网流量平均增长了30%,有的省份甚至翻了一番。 各种网络服务的消费有所增加。 在某些时候,这些银行开始经历严重的额外负载,而他们的存储系统还没有准备好。

显然,现在并不是每个人都需要 20 万 IOPS。 但明天会发生什么呢? 我们的智能系统最大限度地发挥神经处理器的全部潜力,以确保流量紧凑、重复数据删除、优化和快速数据恢复。

参考网络

2020年,正如我们在上一篇文章中提到的,对于我们来说将是核心网络年。 许多客户,尤其是应用程序服务提供商 (ASP) 和银行,已经在考虑他们的应用程序如何在数据中心之间的通信方面具体工作。 这就是新的骨干网络为我们提供帮助的地方。 举个例子,我们以中国最大的银行为例,这些银行已改用简化的骨干系统,这些系统使用的不是十几种不同的协议来进行数据中心之间的通信,而是相对而言使用了几种协议 - OSPF 和 SRv6。 此外,该组织还获得相同的服务集。

基于华为企业设备构建数据中心现代ICT基础设施的HiDC解决方案

智力资源

如何使用数据? 直到最近,还存在异构数据库的碎片系统:Microsoft SQL、MySQL、Oracle 等。为了与它们合作,使用了大数据领域的解决方案,能够组合这些数据、获取数据并使用它们。 所有这些都造成了资源的高负载。

同时,也没有在某些事件发生时对数据进行操作的机制。 解决方案是制定数据生命周期管理 (DLM) 原则。

每个人都听说过数据湖。 随着从数据管理向数据治理的转变,“数字湖”开始迅速变得更加智能。 其中包括感谢华为的解决方案。 在接下来的材料中,我们肯定会讨论我们使用的整个软件技术堆栈。 现在值得注意的是,正是智能数据生命周期管理的使用使我们能够简化网络和服务器的使用,并学习构建端到端架构以更好地理解处理数据的原理。

基于华为企业设备构建数据中心现代ICT基础设施的HiDC解决方案

数据中心工程基础设施

我们将发布专门针对工程基础设施的单独材料,但在今天的主题背景下,我们想提及与 HiDC 概念相关的那些变化。

长期以来,由于锂电池火灾危险性高,数据中心的应急和备用电源系统(ESP)中禁止使用锂电池。 任何机械损坏或违反电池完整性都可能导致火灾和不可预测的后果。 在这方面,PSA配备了过时的酸性电池,其电荷密度低且质量大。

华为的新型应急和备用电源系统采用安全的磷酸铁锂(LFP)电池,具有智能主动管理功能。 在相同容量的情况下,它们的体积比酸性电池小三倍。 它们的生命周期为 10-15 年,这尤其减少了它们对环境造成的负担。 SmartLi生态系统中的专利控制系统允许使用由新旧类型电池阵列组成的混合系统,切换系统允许对PSA结构进行“热”更改,同时保持冗余功能。

基于华为企业设备构建数据中心现代ICT基础设施的HiDC解决方案

智能操作

HiDC基础设施运行原则的重要组成部分是智能自我修复的思想。 在 在我们之前的出版物中,我们提到了运维1-3-5智能平台,它不仅能够检测和分析系统中不需要的事件,而且还为管理员提供了多种选项来完全自动化地解决问题。

自分析功能可以让您在一分钟左右发现问题。 花三分钟进行分析,五分钟内形成改变系统状态的建议。

假设某些操作员错误导致形成流程闭环,从而将虚拟化场的性能从 100% 降低到 77%。 数据中心管理员在其仪表板上收到相应的消息,其中包含问题的完整可视化,包括受不需要的进程影响的资源的网络图。 接下来,管理员可以继续手动纠正这种情况,或者使用向他提供的几种自动恢复方案之一。


系统知道大约75个这样的场景,不到90分钟就可以实施,而且覆盖了数据中心XNUMX%的问题。 此时,工程师可以从容地接听忧心忡忡的客户的电话,相信服务随时都会恢复。

基于华为企业设备构建数据中心现代ICT基础设施的HiDC解决方案

HiDC新重点产品

除了软件产品之外,这还应该包括在基础设施层面运行的关键解决方案。 首先,我们需要提及 Atlas 系列 AI 集群中使用的神经处理器,以及基于 NPU 和 GPU 的服务器。

此外,我们不能不再次提及 Dorado 及其领先的性能,这种性能将持续多年。 在后苏联时代尤其如此,除了极少数例外,通常只有在某些内容完全停止工作时才进行更新。 这就解释了单个存储系统的使用寿命可以达到十年。 Dorado 需要巨大的生产力才能确保十年后提供高质量的服务。

基于华为企业设备构建数据中心现代ICT基础设施的HiDC解决方案

每个元素都有创新

在选择具体的基础设施解决方案时,我们不能忘记其进一步发展的架构和场景。 来自不同制造商的不同产品并不能保证已经针对联合使用进行优化的解决方案将提供预期的协同效应。

基础设施必须基于正确的技术。 “正确”的包括开放式、提供高吞吐量、在高负载下稳定运行。 例如,对于数据中心来说,总能耗与 IT 负载的良好比率非常重要。 为了实现上述所有目标,您需要选择环境和组件。 在现代条件下,这也意味着人工智能的应用日益广泛。

根据我们的观察,华为的战略客户中,不使用机器学习系统的客户越来越少。 如果没有机器学习,就不可能尽可能地将积累的数据货币化。

货币化系统可以有所不同:对于银行来说 - 提供新的有针对性的产品,对于电信运营商来说 - 提供个性化服务并确保忠诚度,对于政府客户来说 - 高质量的数据生命周期管理以及与其他组织的高水平互动。 毕竟,数据管理模型早已超出了设置防火墙和确保数据库的网络可见性的范围。

从想法到运营数据中心

建设一个标准数据中心最多需要一年到一年半的时间。 由于使用了一组统一名称为 FusionDC 2.0 的解决方案,我们的生产周期使我们能够更快地完成这一任务。 设计、高级设计开发、IT 负载所有元素的组装均直接在工厂进行。 短时间内,设备通过海运集装箱从中国运抵俄罗斯。 因此,交钥匙数据中心的创建可以在四到五个月内完成。

预制云数据中心的想法也很有趣,因为数据中心可以分阶段开发,向其中添加必要的功能块。 这种方法嵌入在 HiDC 概念本身中。


为了不将评论材料变成数据表,有关 HiDC 的更多信息,我们建议访问 到我们的网站。 在那里您将找到我们讨论的方法、产品和解决方案的描述和实施示例。 您访问该网站的级别越高,其中的材料就越多。 如果您被分配为“合作伙伴”状态,您将能够下载 HiDC 路线图、技术演示、视频。

我们大胆假设大多数阅读本文的人都具备网络架构师的能力。 他们肯定有兴趣参观我们的 设计区。 在那里我们详细讨论了如何根据华为验证设计(HVD)的规则构建网络基础设施。 可供下载的指南将帮助您彻底了解公司解决方案的工作原理。 请记住,未经授权,您可以获得的材料会减少。

***

许多不仅在俄语部分举行的网络研讨会,而且在国际层面也将帮助您导航。 我们在它们上分享有关我们产品和业务实践的信息。 我们还讨论了华为如何在许多服务链中断的情况下,继续确保其产品持续交付到不同国家。 例如,最近就有一个案例,新生产的数据中心设备在短短三周内就到达了莫斯科客户手中。

四月份的网络研讨会列表已提供 链接.

来源: habr.com

添加评论