大家好。 正如我們所承諾的,我們將讓 Habr 讀者深入了解俄羅斯硬體平台的生產細節,該平台適用於 Elbrus 處理器上的 Aerodisk Vostok 儲存系統。 在本文中,我們將逐步描述Yakhont-UVM E124平台的製作,該平台有效地容納5個單元中的124個磁盤,可以在+30攝氏度的溫度下運行,同時不僅可以工作,而且可以工作出色地。
我們也將於 05.06.2020 年 XNUMX 月 XNUMX 日舉辦網路研討會,我們將詳細討論 Vostok 儲存系統生產的技術細微差別並回答任何問題。 您可以使用以下連結註冊參加網路研討會:
所以,我們走吧!
在深入了解現在正在組織的流程之前,先了解兩年前的歷史背景。 當本文所描述的平台開始開發時,溫和地說,其生產條件還不存在。 這是有原因的,眾所周知:俄羅斯伺服器平台的大規模生產(即生產,而不是重新貼上貼紙)作為一個類別不存在。 有單獨的工廠可以生產單獨的組件,但方式非常有限,而且通常基於過時的技術。 因此,我們必須“從頭開始”,同時將俄羅斯伺服器解決方案的生產提高到一個質的新水平。
因此,任何生產過程都是從需求開始的,然後轉化為一般需求。 這些要求最初是由下諾夫哥羅德的 NORSI-TRANS 開發人員制定的。 當然,要求不是憑空提出的,而是來自於顧客的需求。 這還不是一項技術任務,因為它看起來可能是錯誤的。 在通用需求階段,由於生產的未知條件太多,不可能製定完整的技術規格。
目標模型的發展:從想法到實施
總體要求形成後,就開始選擇元件基礎。 從歷史資訊來看,元素庫不存在,也就是說,必須創建它。
為此,需要從公開市場上提供的樣本中組裝出一個試點樣本,該樣本至少與目標樣本有些相似。 接下來,對該樣品進行標準測試以確定其性能。 如果一切順利,那麼下一步就是開發目標模型(2D 和 3D)。
然後開始尋找準備開始生產該試點產品的俄羅斯企業,開發人員根據特定企業的能力對產品的每個元素進行必要的修改。
在設計過程中,會對每個產品元素進行必要的修改。 例如,在使用原型時,使用了具有大量電線的經典 12G SAS 擴展器(考慮到磁碟數量,非常大)。 它並不便宜,對於這個特定的平台來說不方便,而且敵人的擴展器是外國的。 但這只是一個臨時解決方案,以便對樣本進行整體測試並進入下一階段。 然而,最終版本不適合在特定伺服器平台上使用SAS擴展器。
我們不需要敵人的擴展器,我們將用二十一點和 sh 製作我們自己的背板...
考慮到未來的生產量計劃(數千台伺服器),我們決定為該產品(當然還有後續產品)開發我們自己的 SAS 背板,該背板比與該解決方案相關的擴展器功能更強大。 背板的設計和編程是由同一個開發團隊進行的,主機板的生產是在莫斯科地區的 Microlit 工廠進行的(我們承諾將有一篇單獨的文章介紹該工廠以及 Elbrus 處理器的主機板是如何生產的)印在那裡)。
順便說一下,這是它的第一個原型,現在看起來完全不同了。
他們正在對其進行編程
有趣的事實:當背板開發開始時,設計人員向 SAS3 晶片開發商尋求參考板設計,結果發現歐洲沒有一家公司知道如何開發自己的背板。 此前曾有一家富士通-西門子合資企業,但在西門子利多富資訊系統股份公司離開該合資企業以及西門子計算機部門徹底關閉後,歐洲在該領域的能力喪失了。
因此,晶片開發商最初並沒有立即認真對待NORSI-TRANS的開發,導致最終設計的開發延遲。 確實,後來,當 NORSI-TRANS 公司的意圖和能力的嚴肅性變得明顯,背板被開發和印刷時,他的態度發生了改善。
如何冷卻 124 台 5 個磁碟和一台伺服器,並保持活力?
還有一個關於食物和冷卻的單獨任務。 事實是,根據要求,E124平台必須在30攝氏度的溫度下運行,並且在一分鐘內,有124個單元的5個良好加熱的機械磁碟,而且還有一個帶有處理器的主機板(即這不是愚蠢的JBOD,而是一個成熟的帶有磁碟的儲存系統控制器)。
為了冷卻(除了內部的小風扇),我們最終決定在機殼後部使用三個相當大的風扇,每個風扇都可以熱插拔。 對於系統的正常運行,兩個就足夠了(溫度完全不變),因此您可以放心地計劃更換風扇的工作,而不必考慮溫度。 如果你關掉兩個風扇(例如根據卑鄙法則,更換一個風扇時,第二個就壞了),那麼用一個風扇系統也能正常工作,但溫度會升高10-20%百分比,只要很快至少再安裝一個風扇,這是可以接受的。
粉絲(就像幾乎所有其他東西一樣)也被證明是獨一無二的。 其獨特性的原因在於一項成本。 在某些情況下,風扇可能會開始將空氣吸入,而不是吸入空氣,而是從內部吹動整個機箱,然後“再見”,即平台將很快過熱。 因此,為了防止此類問題,我們對風扇設計進行了更改,並添加了我們自己的「專有技術」—止回閥。 此止回閥可以平靜地將空氣吸出平台,但同時阻止在任何情況下將空氣吸回的可能性。
在冷卻系統的試點階段,出現了許多故障,系統的各個元件過熱和燒毀,但最終,平台開發人員成功實現了比世界著名競爭對手更好的冷卻效果。
“飲食不能違背。”
電源也有類似的情況,即它們是專門為這個平台製作的,原因很平常。 每個單位都是很多錢,這就是為什麼要開發這樣一個超密集的平台,如果我沒記錯的話(如果我錯了,請在評論中糾正),這是迄今為止的世界紀錄,因為尚不存在具有 5 台大量磁碟的伺服器或 JBOD。
因此,為了給平台提供電力,同時組織在正常模式下更換電源的可能性,有源單元的總功率必須為4千瓦(當然,市面上沒有這樣的解決方案)市場),因此它們是透過啟動批量生產的生產線來客製化的(讓我提醒您,有計劃生產數千台此類伺服器)。
正如該平台的一位主要設計師所說,“這裡的電流就像焊接機中的電流 - 這不是很有趣:-)”
在設計過程中,電源不僅可以在220V下運行,還可以在48V下運行,即OPC架構,現在對於電信業者和大型資料中心來說非常重要。
因此,帶有電源的解決方案重複了帶有冷卻的解決方案的邏輯;該平台可以輕鬆地使用兩個電源運行,這使得可以照常進行更換工作。 如果發生事故,三個供電單元中只剩下一個,它將能夠在峰值負載時拉出平台的工作,但是,當然,不可能以這種形式離開平台許久。
金屬和塑膠:事實證明,並非一切都那麼簡單。
平台開發過程中有許多細微差別。 類似的情況不僅發生在電子元件(轉接板、背板、主機板等)上,也發生在普通金屬和塑膠上:例如機殼、導軌,甚至磁碟托架。
看起來,身體和平台上其他不太聰明的元素應該沒有問題。 但實際上一切都不同。 當平台開發人員第一次向俄羅斯各工廠詢問生產需求時,發現大多數工廠都使用相當不現代的方法進行工作,最終影響了產品的品質和數量。
案件的第一批結果證實了這一點。 不正確的幾何形狀、粗糙的焊接、不準確的孔和類似的成本使該產品不適合使用。
大多數能夠製造伺服器機箱的工廠當時(讓我提醒您,“當時”指的是兩年前)都是“老式方式”,也就是說,他們製作了一堆設計文檔,根據這些文檔,操作員手動調整機器的操作,也常使用金屬焊接代替鉚釘。 結果,自動化程度低、人為因素和生產過度官僚化帶來了後果。 事實證明它又長又糟糕而且昂貴。
我們必須向工廠致敬:從那時起,許多工廠的生產已經實現了極大的現代化。 我們提高了焊接質量,掌握了鉚接技術,也經常開始使用電腦數控(CNC)機器。 現在,產品資料不再需要大量文檔,而是直接從 3D 和 2D 模型載入到 CNC 中。
CNC將機器操作員對產品製造過程的介入降到最低,人為因素不再乾擾生活。 操作人員主要關注的是準備操作和最終操作:產品的安裝和拆卸、設置工具等。
當新零件出現時,生產不再陷入停滯;要生產它們,只需對 CNC 軟體進行更改即可。 因此,工廠新項目零件的生產時間從幾個月縮短到幾週,這是個好消息。 當然,準確率也大大提高了。
主機板和處理器:沒問題
處理器和主機板在出廠時是成套的。 本產品已經相當成熟,因此 NORSI 在成品平台層級執行標準輸入控制和輸出控制。
每套主機板和處理器均使用從 MCST 獲得的軟體進行測試。
如果出現某些問題(謝天謝地,主機板和處理器的問題很少),則有一個運作良好的鏈將模組返回給製造商並進行更換。
裝配和最終控制
為了讓我們的巴拉萊卡琴開始演奏,剩下的就是組裝和測試它。 現在生產已投入生產,該系統在莫斯科以標準方式組裝。
每個系統都配有啟動 SSD(用於作業系統)和完整主軸(用於未來資料)。
此後,平臺本身和安裝在其上的磁碟的輸入測試開始。 為此,系統中的所有磁碟都會載入自動測試至少一個小時。
對每個磁碟進行自動讀寫,記錄每個磁碟的讀取速度、寫入速度和溫度。 正常模式下,平均溫度應在攝氏30-35度左右。 在峰值時,每個單獨的磁碟可以「彈跳」高達 40 度。 如果溫度升高或速度低於讀寫閾值,磁碟會變成紅色並且拒絕失敗。 通過測試的組件被包裝以供進一步使用。
結論
有一個神話得到了各種人士的積極支持,即“在俄羅斯,除了抽油之外,他們不知道如何做任何事情。” 不幸的是,這個神話甚至侵蝕了受人尊敬和聰明人的頭腦。
最近,我的一位同事身上發生了一件非凡的故事。 他正在從 Vostok 儲存系統的一個顯示器上開車,這個儲存系統位於他的汽車後備箱中(當然不是 E124,它更簡單)。 途中,他抓獲了一位客戶代表(一個非常重要的人物,在政府機構之一擔任高級職務),他們在車上大致進行了以下對話:
我的同事: “我們剛剛在厄爾布魯士峰上展示了存儲系統,結果很好,大家都很高興,順便說一句,這個存儲系統對你們的行業也很有用。”
顧客: “我知道你們有儲存系統,但你們說的厄爾布魯士是什麼樣的?”
我的同事: 「嗯......俄羅斯處理器Elbrus,他們最近發布了8,在儲存系統的性能方面,我們相應地在其上製作了一個新的儲存系統系列,稱為Vostok”
顧客: 「厄爾布魯士山是一座山! 不要在上流社會中講述有關俄羅斯處理器的童話故事,這一切都是為了吸收預算,實際上什麼都沒有,也不會發生。”
我的同事: 「按照? 這個特定的儲存系統放在我的後車箱裡可以嗎? 我們現在就停下來,我示範給你看!”
顧客: “忍受廢話是件好事,讓我們繼續前進,沒有‘俄羅斯存儲系統’——這基本上是不可能的”
在那一刻,這位重要人物不想再聽到任何關於厄爾布魯士峰的事。 當然,後來當他澄清這個消息時,他也承認了自己的錯誤,但直到最後,他仍然不相信這個消息的真實性。
事實上,蘇聯解體後,我國其實就停止了微電子生產的發展。 有些東西是為了跨國公司的利益而被出口和盜竊的,有些東西是被當地私有化公司偷走的,有些東西當然是被投資的,但主要是為了同一跨國公司的利益。 樹被砍倒了,但根還留著。
在對「西方將幫助我們」這個主題抱有近30年的幻想之後,幾乎每個人都清楚地意識到我們只能幫助自己,因此我們不僅需要在微電子領域恢復生產,而且需要在所有行業中恢復生產。
當下,在全球疫情大流行、跨國生產鏈實際上已停止的情況下,恢復本土生產不再是預算的製定,而是俄羅斯生存的條件,這一點已經越來越明確。一個獨立的國家。
因此,我們將繼續在生活中尋找和使用俄羅斯設備,並告訴您我們的公司實際上在做什麼,他們面臨哪些問題以及他們為解決這些問題做出了哪些巨大的努力。
在一篇文章中談論製作的所有方面是相當困難的,因此作為獎勵,我們將以網路研討會的形式組織關於此主題的線上討論。 在本次網路研討會上,我們將詳細、生動地討論用於 Vostok 儲存系統的 Yakhont 平台生產的技術方面,並將在線回答所有問題,甚至是最棘手的問題。
我們的對話者將是平台開發商 NORSI-TRANS 公司的代表。 此網路研討會將於 05.06.2020 年 XNUMX 月 XNUMX 日舉行;希望參加的人可以透過以下連結註冊:
謝謝大家,一如既往,我們期待建設性的意見。
來源: www.habr.com