資料中心監控:我們如何用新的 BMS 取代舊的 BMS。 第1部分

資料中心監控:我們如何用新的 BMS 取代舊的 BMS。 第1部分

什麼是電池管理系統

資料中心工程系統運行監控系統是基礎設施的關鍵組成部分,直接影響資料中心人員應對緊急情況的速度等重要指標,進而影響不間斷運作的時長。 

全球許多資料中心設備供應商都提供 BMS(建築監控系統)監控系統。 在俄羅斯Linxdatacenter工作期間,我們有機會熟悉了不同的系統,也遇到了廠商對這些系統的運作方式截然相反的情況。 

我們將告訴您過去一年我們如何徹底更新 BMS 系統以及原因。  

問題的根源

這一切都始於 10 年前,隨著 Linxdatacenter 資料中心在聖彼得堡的啟動。 根據當時的行業標準,BMS系統是一個安裝有軟體的實體伺服器,透過客戶端程式(所謂的「厚」客戶端)存取。 

當時市場上提供此類解決方案的公司很少。 他們的產品是標準,也是滿足現有需求的唯一答案。 我們必須給予他們應得的:無論是當時還是今天,市場領導者通常都會處理他們的基本任務 - 為營運資料中心提供功能性解決方案。 

我們的合理選擇是來自全球最大製造商之一的 BMS 解決方案。 當時選擇的系統滿足了監控資料中心等複雜工程設施的所有要求。 

然而,隨著時間的推移,使用者(即我們資料中心營運商)對IT解決方案的要求和期望發生了變化。 正如對所提出的解決方案的市場分析所示,大型供應商還沒有為此做好準備。

企業IT市場受到B2C產業的嚴重影響。 當今的數位解決方案必須為最終用戶提供舒適的體驗 - 這是開發人員為自己設定的目標。 這在許多企業應用程式的使用者介面 (UI) 和使用者體驗 (UX) 的改進中表現得很明顯。 

人們習慣了日常生活中與數位工具相關的一切的舒適性,並對他用於工作任務的工具提出了同樣的要求。 人們期望企業應用程式具有與金融服務、計程車呼叫或線上購物相同的可見性、直覺性、簡單性和透明度。 在企業環境中實施解決方案的 IT 專家也努力獲得所有現代「好處」:簡單的部署和擴展、容錯和無限的客製化可能性。 

大型國際供應商常常忽略這些趨勢。 憑藉其在業界的長期權威,企業在與客戶合作時往往表現得十分堅決且缺乏靈活性。 他們對自己不可或缺的幻想不允許他們看到年輕的科技公司如何真正出現在他們的眼皮底下,為特定客戶提供量身定制的替代解決方案,並且無需為品牌支付過高的費用。

舊BMS系統的缺點 

對我們來說,現有過時的 BMS 解決方案的主要缺點是運行速度慢。 透過調查值班人員反應速度不夠快的幾起事件,我們了解到 BMS 中顯示的事件有時會出現嚴重延遲。 同時,系統並沒有過載或故障,只是其元件(例如JAVA)的版本已經過時,無法在不更新的新版本作業系統上正常運作。 只能與BMS系統一起更新,而且供應商沒有提供版本的自動連續性,也就是說,對於我們來說,這個過程幾乎與切換到新系統一樣耗費人力,並且保留了新的解決方案舊的一些缺點。  

讓我們在這裡添加一些更不愉快的“小事情”:

  1. 依照「一個IP位址-一個付費許可證」的原則支付連接新設備的費用; 
  2. 在不購買支援包的情況下無法更新軟體(這意味著更新免費元件並消除 BMS 程式本身的錯誤);
  3. 支援成本高; 
  4. 位於「鐵」伺服器上,該伺服器可能會發生故障且計算資源有限;
  5. 透過安裝具有重複許可證包的第二個硬體伺服器來實現「冗餘」。 同時,主備伺服器之間沒有資料庫同步-這意味著需要手動進行資料庫傳輸,並且過渡到備份的時間較長;
  6. 「厚」用戶用戶端,無法從外部訪問,沒有行動裝置擴展和遠端存取選項;
  7. 精簡的網路介面,沒有圖形卡和聲音通知,可以從外部訪問,但由於缺乏信息,員工實際上不使用;
  8. 介面中缺乏動畫 - 所有圖形僅由“背景”圖像和靜態圖示組成。 結果是整體可見度較低;

    一切看起來都是這樣的:

    資料中心監控:我們如何用新的 BMS 取代舊的 BMS。 第1部分

    資料中心監控:我們如何用新的 BMS 取代舊的 BMS。 第1部分

  9. 創建虛擬感測器的一個限制是只能使用加法函數,而真實感測器的模型需要能夠執行一組數學運算以進行反映實際操作的正確計算; 
  10. 無法為任何目的即時或從檔案中取得資料(例如,用於在客戶的個人帳戶中顯示);
  11. 完全缺乏靈活性和更改 BMS 中任何內容以適應現有資料中心流程的能力。 

新 BMS 系統的要求

考慮到上述情況,我們的主要要求如下:

  1. 兩台獨立的相互冗餘機器,自動同步,運行在不同資料中心的兩個不同雲端平台上(在我們的例子中,Linxdatacenter 聖彼得堡和莫斯科資料中心);
  2. 免費添加新設備;
  3. 免費軟體更新及其組件(功能改進除外);
  4. 開源程式碼,當開發者出現問題時,我們可以獨立支援系統;
  5. 能夠從 BMS 接收和使用數據,例如在網站上或您的個人帳戶中;
  6. 透過WEB瀏覽器訪問,無需胖客戶端;
  7. 使用網域員工帳號存取BMS;
  8. 動畫的可用性和許多其他小的和不那麼小的願望都具體化為詳細的技術規格。

最後一根稻草

資料中心監控:我們如何用新的 BMS 取代舊的 BMS。 第1部分

當我們意識到資料中心的 BMS 已經無法滿足需求時,我們認為最明顯的解決方案就是更新現有系統。 「他們不會中途換馬,」對吧? 

然而,大公司通常不會對其在數十個國家銷售的數十年「完善」解決方案提供客製化修改。 雖然年輕的公司正在向潛在消費者測試未來產品的想法或原型,並依靠用戶反饋來開發產品,但公司仍在繼續銷售曾經非常酷的產品的許可證,但可惜的是,今天它已經過時且不靈活。

我們自己也感受到了方法上的差異。 在與舊BMS製造商的溝通過程中,很快就發現供應商提出的現有系統更新實際上會導致我們購買新系統,該系統半自動資料庫傳輸,成本高,並且在使用過程中存在缺陷。轉移,連製造商自己也無法預測。 當然,在這種情況下,更新解決方案的技術支援成本增加了,而且擴容時購買許可證的需求仍然存在。

而最不愉快的是,新系統並不能完全滿足我們的預訂需求。 更新後的 BMS 系統可以按照我們的意願在雲端平台上實施,這將使我們能夠放棄硬件,但冗餘選項不包含在價格中。 為了備份數據,我們必須購買第二個 BMS 虛擬伺服器和一組額外的授權。 由於一張許可證的成本約為 76 美元,IP 位址數量為 1000 個單位,僅備份電腦許可證的額外費用就高達 76 美元。 

新版本 BMS 中的「好處」是需要為「所有設備」購買額外的許可證,甚至是主伺服器。 這裡需要澄清的是,有設備透過網關連接到BMS。 網關只有一個IP位址,但控制多台設備(平均10台)。 在舊的 BMS 中,每個網關 IP 位址需要一個許可證,統計數據如下所示:“1000 個 IP 位址/許可證,1200 個設備。” 更新後的 BMS 採用不同的原理,統計數據如下所示:“1000 個 IP 位址,1200 個設備/許可證。” 也就是說,新版本中的供應商改變了許可證分配原則,我們必須額外購買約200個許可證。 

「更新」預算最終包括四點: 

  • 雲端版本及其遷移服務的成本; 
  • 針對透過網關連接的設備的現有軟體包的附加許可證;
  • 備份雲端版本的費用;  
  • 備份計算機的一組許可證。 

該項目的總成本超過100萬美元! 更不用說未來需要為新設備購買許可證了。

因此,我們意識到,訂購一個從頭開始創建的系統對我們來說會更容易,甚至可能更便宜,同時考慮到我們的所有要求並提供未來現代化的可能性。 但是,仍然必須找到那些想要開發如此複雜系統的人,比較建議,進行選擇,並與最終入圍者一起走上從技術規範到實施的道路……很快就會在材料的第二部分中閱讀這一點。 

來源: www.habr.com

添加評論