厄尔布鲁士VS英特尔。 比较 Aerodisk Vostok 和 Engine 存储系统的性能

厄尔布鲁士VS英特尔。 比较 Aerodisk Vostok 和 Engine 存储系统的性能

大家好。 我们继续向您介绍基于俄罗斯 Elbrus 8C 处理器的 Aerodisk VOSTOK 数据存储系统。

在本文中,我们(如承诺的那样)将详细分析与厄尔布鲁士峰相关的最流行和最有趣的主题之一,即生产力。 关于厄尔布鲁士峰的表现有相当多的猜测,而且绝对是极地的。 悲观主义者表示,厄尔布鲁士峰的生产力现在“为零”,需要几十年的时间才能赶上“顶级”生产商(即在当前现实中,永远不会)。 另一方面,乐观者表示,Elbrus 8C已经展现出不错的成绩,未来几年,随着新版本处理器(Elbrus 16C和32C)的发布,我们将能够“赶超”全球领先的处理器制造商。

我们 Aerodisk 都是务实的人,所以我们采取了最简单、最容易理解的(对我们来说)路线:测试,记录结果,然后得出结论。 结果,我们进行了大量的测试,发现了Elbrus 8C e2k架构的许多特性(包括令人愉快的特性),当然,也将其与AMD64架构的Intel Xeon处理器上的类似存储系统进行了比较。

顺便说一句,我们将在 15.10.2020 年 15 月 00 日 XNUMX:XNUMX 举行的下一次网络研讨会“OkoloIT”上更详细地讨论 Elbrus 上存储系统的测试、结果和未来发展。您可以使用下面的链接注册。

网络研讨会注册

测试台

我们创建了两个展位。 两个机架均由运行 Linux 的服务器组成,通过 16G FC 交换机连接到两个存储控制器,其中安装了 12 个 SAS SSD 960 GB 磁盘(如果我们使用 RAID,则为 11,5 TB 的“原始容量”或 5,7 TB 的“可用”容量) -10)。

大致上看台是这样的。

厄尔布鲁士VS英特尔。 比较 Aerodisk Vostok 和 Engine 存储系统的性能

1 号 e2k 展位(厄尔布鲁士)

硬件配置如下:

  • Linux 服务器(2xIntel Xeon E5-2603 v4(6 核,1,70Ghz)、64 GB DDR4、2xFC 适配器 16G 2 端口) – 1 台。
  • 开关 FC 16 G – 2 个
  • 存储系统 Aerodisk Vostok 2-E12(2xElbrus 8C(8 核,1,20Ghz)、32 GB DDR3、2xFE FC 适配器 16G 2 端口、12xSAS SSD 960 GB) - 1 件。

展位号 2 amd64(英特尔)

为了与 e2k 上的类似配置进行比较,我们使用了类似的存储配置以及特性与 amd64 类似的处理器:

  • Linux 服务器(2xIntel Xeon E5-2603 v4(6 核,1,70Ghz)、64 GB DDR4、2xFC 适配器 16G 2 端口) – 1 台。
  • 开关 FC 16 G – 2 个
  • 存储系统 Aerodisk Engine N2(2xIntel Xeon E5-2603 v4(6 核,1,70Ghz)、32 GB DDR4、2xFE FC 适配器 16G 2 端口、12xSAS SSD 960 GB) - 1 件。

重要提示:测试中使用的 Elbrus 8C 处理器仅支持 DDR3 RAM,这当然是“不好,但不会长久”。 Elbrus 8SV(我们还没有库存,但很快就会有)支持 DDR4。

测试方法

为了生成负载,我们使用了流行且经过时间考验的灵活 IO (FIO) 程序。

两种存储系统都是按照我们的配置建议进行配置的,基于块访问高性能的要求,所以我们使用DDP(Dynamic Disk Pool)磁盘池。 为了不扭曲测试结果,我们在两个存储系统上禁用压缩、重复数据删除和 RAM 缓存。

在 RAID-8 中创建了 10 个 D-LUN,每个 500 GB,总可用容量为 4 TB(即,大约为该配置的可能可用容量的 70%)。

将执行使用存储系统的基本和流行场景,特别是:

前两个测试模拟事务 DBMS 的操作。 在这组测试中,我们对 IOPS 和延迟感兴趣。

1)小块4k随机读取
A。 块大小 = 4k
b. 读/写 = 100%/0%
C。 作品数量 = 8
d. 队列深度 = 32
e. 加载字符=完全随机

2)小块4k随机记录
A。 块大小 = 4k
b. 读/写 = 0%/100%
C。 作品数量 = 8
d. 队列深度 = 32
e. 加载字符=完全随机

后两个测试模拟 DBMS 分析部分的操作。 在这组测试中,我们还对 IOPS 和延迟感兴趣。

3)以4k小块顺序读取
A。 块大小 = 4k
b. 读/写 = 100%/0%
C。 作品数量 = 8
d. 队列深度 = 32
e. 加载字符 = 顺序

4)以4k小块顺序记录
A。 块大小 = 4k
b. 读/写 = 0%/100%
C。 作品数量 = 8
d. 队列深度 = 32
e. 加载字符 = 顺序

第三组测试模拟流式阅读(例如:在线播放、恢复备份)和流式录制(例如:视频监控、录音备份)的工作。 在这组测试中,我们不再对 IOPS 感兴趣,而是对 MB/s 和延迟感兴趣。

5)128k大块顺序读取
A。 块大小 = 128k
b. 读/写 = 0%/100%
C。 作品数量 = 8
d. 队列深度 = 32
e. 加载字符 = 顺序

6) 以128k大块顺序记录
A。 块大小 = 128k
b. 读/写 = 0%/100%
C。 作品数量 = 8
d. 队列深度 = 32
e. 加载字符 = 顺序

每次测试将持续一小时,不包括 7 分钟的阵列预热时间。

测试结果

测试结果总结在两个表中。

厄尔布鲁士 8S(SHD Aerodisk Vostok 2-E12)

厄尔布鲁士VS英特尔。 比较 Aerodisk Vostok 和 Engine 存储系统的性能

Intel Xeon E5-2603 v4(存储系统 Aerodisk Engine N2)

厄尔布鲁士VS英特尔。 比较 Aerodisk Vostok 和 Engine 存储系统的性能

结果非常有趣。 在这两种情况下,我们都很好地利用了存储系统的处理能力(利用率为70-90%),在这种情况下,两种处理器的优缺点都非常明显。

在这两个表中,处理器“感到自信”并显示良好结果的测试以绿色突出显示,而处理器“不喜欢”的情况以橙色突出显示。

如果我们谈论小块中的随机负载,那么:

  • 从随机读数来看,Intel肯定领先Elbrus,相差2倍;
  • 从随机记录的角度来看,这绝对是平局,两个处理器都显示出大致相同且不错的结果。

在小块中的顺序加载中,情况有所不同:

  • 在读取和写入方面,英特尔都明显领先于 Elbrus(2 倍)。 同时,如果Elbrus的IOPS指标低于Intel,但看起来还不错(200-300万),那么就存在明显的延迟问题(它们是Intel的三倍)。 结论是,当前版本的 Elbrus 8C 确实“不喜欢”小块中的顺序加载。 显然还有一些工作要做。

但在大块的顺序加载中,情况恰恰相反:

  • 两个处理器显示的结果大致相同(以 MB/s 为单位),但有一个但是...... Elbrus 的延迟性能比 Intel 的类似处理器好 10(十,Karl!!!)倍(即更低)(0,4/0,5 毫秒与 5,1/6,5 毫秒)。 起初我们认为这是一个小故障,所以我们重新检查结果,进行了重新测试,但重新测试显示了相同的图片。 这是 Elbrus(以及一般的 e2k 架构)相对于 Intel(以及相应的 amd64 架构)的一个重要优势。 我们希望这一成功能够得到进一步发展。

厄尔布鲁士峰还有一个有趣的特点,细心的读者可以通过查看表格来注意到。 如果你看看英特尔的读写性能之间的差异,那么在所有测试中,读取平均领先于写入约 50%+。 这是每个人(包括我们)都习惯的规范。 如果您观察 Elbrus,就会发现写入指标与读取指标更加接近;通常,读取领先于写入 10 - 30%,仅此而已。

这是什么意思? 事实上,Elbrus“真的很喜欢”书写,这反过来表明,该处理器在书写明显优于阅读的任务中将非常有用(谁说Yarovaya定律?),这也是 e2k 架构无疑的优势,并且这一优势需要进一步发展。

结论和不久的将来

Elbrus 和英特尔中档处理器在数据存储任务方面的比较测试显示出大致相同且同样有价值的结果,同时每个处理器都显示了自己有趣的功能。

Intel在小块随机读取以及小块顺序读写方面都大大优于Elbrus。

当以小块随机写入时,两个处理器显示相同的结果。

就延迟而言,Elbrus 在流负载方面看起来明显优于英特尔,即在大块中顺序读取和写入。

此外,与英特尔不同的是,Elbrus 能够同样出色地应对读取和写入负载,而对于英特尔来说,读取总是比写入好得多。
根据获得的结果,我们可以得出 Elbrus 8C 处理器上的 Aerodisk Vostok 数据存储系统在以下任务中的适用性的结论:

  • 以写操作为主的信息系统;
  • 文件访问;
  • 在线广播;
  • 视频监控;
  • 备份;
  • 媒体内容。

MCST团队还有很多工作要做,但他们的工作成果已经可见,这当然不能不令人高兴。

这些测试是在 e2k 版本 4.19 的 Linux 内核上进行的;目前处于 Beta 测试阶段(在 MCST、Basalt SPO 以及 Aerodisk 中),有一个 Linux 内核 5.4-e2k,其中除其他外,它还具有经过认真重新设计的调度程序和针对高速固态硬盘的许多优化。 此外,MCST JSC 专门针对 5.x.x 分支的内核发布了新的 LCC 编译器,版本 1.25。 根据初步结果,在同一个 Elbrus 8C 处理器上,使用新编译器、内核环境、系统实用程序和库以及 Aerodisk VOSTOK 软件编译的新内核将带来更显着的性能提升。 而且这不需要更换设备——使用相同的处理器和相同的频率。

我们预计将在今年年底发布基于内核 5.4 的 Aerodisk VOSTOK 版本,一旦新版本的工作完成,我们将更新测试结果并在此发布。

如果我们现在回到文章开头并回答这个问题,谁是对的:悲观主义者说厄尔布鲁士“什么都不是”,永远无法赶上领先的处理器制造商,而乐观主义者则说“他们已经几乎赶上了”起来并很快就会超越“? 如果我们不是从刻板印象和宗教偏见出发,而是从真实的考验出发,那么乐观主义者绝对是对的。

与中级 amd64 处理器相比,Elbrus 已经显示出良好的结果。 当然,Elbrus 8-ke 与 Intel 或 AMD 的服务器处理器的顶级型号相去甚远,但它的目标并不是这个;处理器 16C 和 32C 将为此目的而发布。 然后我们再谈谈。

我们知道,在这篇文章之后,将会有更多关于厄尔布鲁士峰的问题,因此我们决定组织另一场在线网络研讨会“OkoloIT”来现场回答这些问题。

这次我们的嘉宾是MCST公司的副总经理Konstantin Trushkin。 您可以使用下面的链接注册参加网络研讨会。

网络研讨会注册

谢谢大家,一如既往,我们期待建设性的批评和有趣的问题。

来源: habr.com

添加评论