華為Dorado V6:川熱

華為Dorado V6:川熱
說實話,今年莫斯科的夏天不太好。開始得太早太快,大家都沒有時間反應,六月底就結束了。所以,當華為邀請我去中國,去他們的研發中心所在的成都,看了陰涼+34度的天氣預報後,我立刻就答應了。畢竟我已經不是同齡了,我的骨頭需要稍微暖和一下。但我要指出的是,不僅可以溫暖骨頭,還可以溫暖內部,因為成都所在的四川省以愛吃辣而聞名。不過,這不是一個關於旅行的博客,所以讓我們回到我們旅行的主要目標 - 存儲系統的新系列 - 華為 Dorado V6。這篇文章會讓你對過去有所了解,因為…它是在正式發布之前寫的,但在發布之後才發布。那麼,今天我們就來仔細看看華為為我們準備的一切有趣又好吃的東西。

華為Dorado V6:川熱
新系列將有 5 款車型。除 3000V6 之外的所有型號都有兩個版本 - SAS 和 NVMe。此選擇決定了您可以在此系統中使用的磁碟介面、後端連接埠以及您可以在系統中安裝的磁碟機的數量。 NVMe則採用掌上型SSD,比經典2.5吋SAS SSD更薄,最多可安裝36塊。新產品線是全閃存,沒有磁碟配置。

華為Dorado V6:川熱
掌上 NVMe 固態硬碟

在我看來,Dorado 8000和18000看起來是最有趣的型號。華為將它們定位為高端系統,並且由於華為的定價政策,它將這些中端型號與競爭對手細分市場進行了對比。我今天的評論將重點放在這些模型上。我馬上要指出的是,由於其設計特點,初級雙控制器系統的架構略有不同,與 Dorado 8000 和 18000 不同,所以我今天要討論的所有內容並不適用於初級型號。

新系統的主要特點之一是使用了內部開發的多個晶片,每個晶片都允許您分配來自控制器中央處理器的邏輯負載並向不同組件添加功能。
華為Dorado V6:川熱

新系統的核心是基於ARM技術開發、華為自主製造的鯕鵬920處理器。根據型號的不同,每個控制器中的核心數量、頻率和安裝的處理器數量也有所不同:
華為Dorado V6 8000 – 2CPU,64核
華為Dorado V6 18000 – 4CPU,48核
華為Dorado V6:川熱

華為在ARM架構上開發了這款處理器,據我所知,最初計劃僅將其安裝在較舊的Dorado 8000和18000型號上,某些V5型號已經如此,但制裁對這一想法進行了調整。當然,ARM在製裁期間也談到了拒絕與華為合作,但這裡的情況與英特爾不同。華為獨立生產這些晶片,任何制裁都無法阻止這項進程。與 ARM 斷絕關係只會導致無法獲得新開發成果。至於性能,只有進行獨立測試後才能判斷。雖然我親眼目睹瞭如何從 Dorado 18000 系統中毫無問題地移除 1M IOPS,但直到我親手在機架上重複一遍之前,我都不會相信。但控制器確實有很大的力量。較舊的型號配備 4 個控制器,每個控制器有 4 個處理器,總共有 768 個核心。
華為Dorado V6:川熱

但當我們查看新系統的架構時,我會在稍後討論內核,但現在讓我們回到系統中安裝的另一個晶片。該晶片看起來是一個非常有趣的解決方案 登高 310 (據我了解,是最近向公眾展示的 Ascend 910 的弟弟)。它的任務是分析進入系統的資料區塊,以提高讀取命中率。很難說它在工作中的表現如何,因為…如今它只能按照給定的模板進行工作,不具備智慧模式學習的能力。未來的韌體中有望出現智慧模式,很可能是明年初。

讓我們繼續討論架構。華為繼續開發自己的智慧矩陣技術,該技術採用全網狀方法來連接組件。但如果在 V5 中這僅適用於從控制器到磁碟的訪問,那麼現在所有控制器都可以訪問後端和前端上的所有連接埠。
華為Dorado V6:川熱

由於新的微服務架構,即使只有一個 lun,也可以在所有控制器之間實現負載平衡。此系列陣列的作業系統是從頭開始開發的,並非簡單地針對快閃磁碟機的使用進行了最佳化。由於我們所有的控制器都可以存取相同的連接埠,因此在控制器發生故障或重新啟動時,主機不會遺失通往儲存系統的單一路徑,並且路徑切換是在儲存系統層級進行的。然而,在主機上使用UltraPath並不是絕對必要的。安裝系統時的另一個「節省」是必要的連結數量較少。如果採用4 個控制器的「經典」方法,我們需要來自8 個工廠的2 個鏈路,那麼在華為的情況下,甚至2 個就足夠了(我現在不是在談論一個鏈路的吞吐量是否足夠)。
華為Dorado V6:川熱

與先前的版本一樣,使用具有鏡像的全域快取。這允許您同時丟失最多兩個控制器或連續丟失三個控制器,而不會影響可用性。但值得注意的是,在示範台出現一個故障時,我們並沒有看到其餘 3 個控制器之間的完全負載平衡。發生故障的控制器的負載完全由其餘控制器之一接管。為此,可能需要讓系統在此配置下工作更長時間。無論如何,我將使用我自己的測試更詳細地檢查這一點。
華為將新系統定位為端對端NVMe系統,但目前前端尚不支援NVMeOF,僅支援FC、iSCSI或NFS。在此結束或下一個開始時,與其他功能一樣,我們承諾支援 RoCE。
華為Dorado V6:川熱

機架也使用 RoCE 連接到控制器,但與此相關的一個缺點是機架缺乏「環回」連接,就像 SAS 的情況一樣。在我看來,如果您正在規劃一個相當大的系統,這仍然是一個相當大的缺點。事實是,所有架子都是串聯的,其中一個架子發生故障會導致其後的所有其他架子完全無法訪問。在這種情況下,為了確保容錯,我們必須將所有機架連接到控制器,這需要增加系統中所需的後端連接埠數量。

還有一件事值得一提,那就是無中斷更新(NDU)。正如我上面所說,華為為新的 Dorado 系列實施了一種容器方法來操作作業系統,這允許您更新和重新啟動服務,而無需完全重新啟動控制器。值得一提的是,某些更新將包含核心更新,在這種情況下,有時在更新期間仍然需要重新啟動控制器,但並非總是如此。這將減少此操作對生產系統的影響。

在我們的武器庫中,絕大多數陣列都來自 NetApp。因此,我認為如果我與我經常使用的系統進行一些比較,那將是非常合乎邏輯的。這並不是要確定誰更好、誰更差或誰的架構更有利。我將嘗試冷靜且不狂熱地比較不同供應商解決相同問題的兩種不同方法。是的,當然,在這種情況下,我們將在「理論上」考慮華為系統,我還將單獨指出計劃在未來韌體版本中實現的那些要點。目前我認為有哪些優勢:

  1. 支援的 NVMe 驅動器數量。 NetApp 目前有 288 個,而華為有 1600-6400 個,具體取決於型號。同時,華為的最大可用容量為32PBe,就像NetApp系統一樣(更準確地說,他們有31.64PBe)。儘管事實上支援相同磁碟區的驅動器(高達 15Tb)。華為對此的解釋是:他們沒有機會搭建更大的展位。理論上,他們沒有數量限制,但他們還無法測試這一事實。但值得注意的是,當今快閃磁碟機的功能非常高,對於 NVMe 系統,我們面臨的事實是 24 個驅動器足以使用高階 2 控制器系統。因此,系統中磁碟數量的進一步增加不僅不會帶來效能的提升,還會對IOPS/Tb比產生不良影響。當然,值得看看 4 控制器系統 8000 和 16000 可以處理多少個驅動器,因為…鯤鵬920的能力和潛力仍不完全清楚。
  2. Lun 作為 NetApp 系統擁有者的存在。那些。只有一個控制器可以對月球進行操作,而第二個控制器只能透過自身傳遞 IO。相反,華為系統沒有任何擁有者,資料區塊的操作(壓縮、重複資料刪除)可以由任何控制器執行,也可以寫入磁碟。
  3. 當其中一個控制器發生故障時,不會出現連接埠遺失的情況。對某些人來說,這一刻顯得極為關鍵。最重要的是,儲存系統內部的切換應該比主機端更快。而如果在同一個NetApp的情況下,在實作中我們發現拔出控制器和切換路徑時有大約5秒的卡頓,那麼切換到華為我們仍然需要練習。
  4. 更新時無需重新啟動控制器。尤其是 NetApps 相當頻繁地發布新版本和韌體分支,這讓我開始擔心。是的,華為的某些更新仍然需要重新啟動,但不是全部。
  5. 4 個華為控制器的價格相當於兩個 NetApp 控制器的價格。正如我上面所說,由於華為的定價政策,它可以用其高階機型與中階機型競爭。
  6. 機架控制器和連接埠卡中存在額外的晶片,這可能是為了提高系統效率。

一般的缺點和擔憂:

  1. 機架直接連接到控制器或需要大量後端連接埠將所有機架連接到控制器。
  2. ARM架構和大量晶片的存在-它的工作效率如何,效能是否足夠?

大多數擔憂和恐懼可以透過對新產品線的個人測試來消除。我希望它們在發布後不久就會出現在莫斯科,並且會有足夠的數量來快速獲得一個用於您自己的測試。到目前為止,我們可以說,總的來說,該公司的方法看起來很有趣,而且與競爭對手相比,新產品線看起來非常好。最終的實施引發了很多問題,因為很多事情我們要到年底才能看到,也許只有到2020年才能看到。

來源: www.habr.com

添加評論