🥇虛擬化資料中心設計

介紹

GOST RV 51987 中明確定義了從用戶角度來看的信息系統——“一個自動化系統，其結果是呈現輸出信息以供後續使用。”如果我們考慮內部結構，那麼本質上任何IS都是用程式碼實現的互連演算法的系統。從廣義來說，圖靈-丘奇論文是指演算法（或 IS）將一組輸入資料轉換為一組輸出資料。
甚至可以說，輸入資料的變換就是資訊系統存在的意義。因此，IS和整個IS複合體的值是透過輸入和輸出資料的值來決定的。
考慮到這一點，設計必須開始並以資料驅動，根據資料的結構和重要性自訂架構和方法。

儲存數據
設計準備的關鍵階段是取得計劃用於處理和儲存的所有資料集的特徵。這些特徵包括：
- 數據量；
— 有關資料生命週期的資訊（新資料的成長、壽命、過時資料的處理）；
——從資料角度進行分類對公司核心業務（機密性、完整性、可用性三者）以及財務指標（例如，最後一小時資料遺失的成本）的影響；
— 資料處理的地理（處理系統的實體位置）；
— 每個資料類別的監管要求（例如，Federal Law-152、PCI DSS）。

資訊系統

資料不僅被資訊系統存儲，而且被資訊系統處理（轉換）。獲得資料特徵後的下一步是最完整的資訊系統清單、其架構特徵、相互依賴性和常規單元中四種類型資源的基礎設施要求：
— 處理器運算能力；
— RAM 數量；
——資料儲存系統的容量和效能要求；
— 資料傳輸網路的要求（外部通道、IS組件之間的通道）。
在這種情況下，作為 IS 的一部分，每個服務/微服務都必須有要求。
另外，需要注意的是，為了正確設計，必須以 IS 停機成本（每小時盧布）的形式提供有關 IS 對公司核心業務影響的數據。

威脅模型

必須有一個正式的威脅模型來計劃保護資料/服務免受威脅。此外，威脅模型不僅包括機密性方面，還包括完整性和可用性方面。那些。例如：
— 實體伺服器故障；
— 架頂交換器故障；
— 資料中心之間的光通訊通道中斷；
— 整個運作儲存系統發生故障。
在某些情況下，威脅模型不僅是針對基礎設施元件編寫的，而且還針對特定資訊系統或其元件編寫，例如導致資料結構邏輯破壞的 DBMS 故障。
專案中所有旨在防範未描述的威脅的決策都是不必要的。

監管要求

如果正在處理的資料受到監管機構制定的特殊規則的約束，則需要有關資料集和處理/儲存規則的資訊。

RPO/RTO 目標

設計任何類型的保護都需要針對所描述的每種威脅制定目標資料遺失和目標服務恢復時間的指標。
理想情況下，RPO 和 RTO 應該具有相關的單位時間資料遺失和停機成本。

劃分資源池

收集所有初始輸入資訊後，第一步是根據威脅模型和監管要求將資料集和 IP 分組到池中。各種池的劃分類型是在系統軟體層級以程式設計或物理方式決定的。
Примеры：
— 處理個人資料的電路與其他系統完全物理隔離；
— 備份儲存在單獨的儲存系統上。

在這種情況下，池可以是不完全獨立的，例如定義兩個運算資源池（處理器能力+RAM），它們使用單一資料儲存池和單一資料傳輸資源池。

處理能力

摘要，虛擬化資料中心的處理能力要求是透過虛擬處理器（vCPU）的數量及其在實體處理器（pCPU）上的整合率來衡量的。在這種特殊情況下，1 個 pCPU = 1 個實體處理器核心（不包括超執行緒）。 vCPU 的數量是所有定義的資源池（每個資源池可以有自己的整合因子）的總和。
負載系統的固結係數是根據現有基礎設施或透過試點安裝和負載測試經驗獲得的。對於卸載的系統，使用“最佳實踐”。具體來說，VMware 給出的平均比例為 8:1。

手術記憶

總 RAM 需求可透過簡單求和獲得。不建議使用 RAM 超額認購。

儲存資源

透過簡單地按容量和效能對所有池求和即可獲得儲存要求。
性能要求以 IOPS 與平均讀/寫比率以及最大響應延遲（如有必要）相結合來表示。
必須單獨指定特定池或系統的服務品質 (QoS) 要求。

數據網路資源

透過對所有頻寬池進行簡單求和即可獲得資料網路需求。
應單獨指定特定池或系統的服務品質 (QoS) 和延遲 (RTT) 要求。
作為資料網路資源需求的一部分，也指出了網路流量隔離和/或加密的要求以及首選機制（802.1q、IPSec 等）。

架構選型

本指南不涵蓋 x86 架構和 100% 伺服器虛擬化以外的選擇。因此，計算子系統架構的選擇取決於伺服器虛擬化平台、伺服器外形尺寸和一般伺服器配置要求的選擇。

選擇的關鍵點是確定使用處理、儲存和傳輸資料功能分離的經典方法或聚合方法。

古典建築 涉及使用智慧外部子系統來儲存和傳輸數據，而伺服器僅向公共實體資源池提供處理能力和 RAM。在極端情況下，伺服器變得完全匿名，不僅擁有自己的磁碟，甚至沒有系統識別碼。在這種情況下，作業系統或管理程式會從內建快閃媒體或外部資料儲存系統（從 SAN 引導）載入。
在經典架構的框架下，刀鋒和機架的選擇主要基於以下原則：
— 成本效益高（平均而言，機架式伺服器較便宜）；
— 計算密度（刀片較高）；
— 能耗和散熱（葉片每單位有較高的比單位）；
— 可擴展性和可控性（對於大型安裝，刀片通常需要較少的精力）；
- 使用擴充卡（刀片的選擇非常有限）。
融合架構 （也稱為 超融合）涉及到資料處理和儲存功能的結合，這導致了本機伺服器磁碟的使用，從而放棄了經典的刀片外形規格。對於融合系統，可以使用機架伺服器或叢集系統，將多個刀鋒伺服器和本機磁碟組合在一個機箱中。

中央處理器/內存

要正確計算配置，您需要了解環境或每個獨立叢集的負載類型。
CPU 限制 – 效能受處理器能力限制的環境。增加 RAM 不會改變效能（每台伺服器的虛擬機器數量）。
記憶體限制 – 環境受 RAM 限制。伺服器上更多的 RAM 允許您在伺服器上運行更多的虛擬機器。
GB / MHz (GB / pCPU) – 此特定負載消耗 RAM 和處理器功率的平均比率。可用於計算給定效能所需的記憶體量，反之亦然。

伺服器配置計算

首先，您需要確定所有類型的負載，並決定將不同的計算池組合或分割到不同的叢集中。
接下來，對於每個定義的簇，在預先已知的負載下確定GB/MHz比率。如果事先未知負載，但對處理器電源利用率水準有一個粗略的了解，則可以使用標準 vCPU:pCPU 比率將池需求轉換為物理需求。

對於每個集群，將 vCPU 池需求總和除以係數：
vCPUsum / vCPU:pCPU = pCPUsum – 所需的實體單元數。核心
pCPUsum / 1.25 = pCPUht – 超執行緒調整的核心數量
我們假設需要計算一個具有 190 個核心/3.5 TB RAM 的叢集。同時，我們接受 50% 的處理器能力和 75% 的 RAM 的目標負載。

中央處理器
190
CPU利用率
50%

紀念品
3500
記憶體實用程式
75%

插座
核心
伺服器/CPU
服務記憶體
服務/記憶體

2
6
25,3
128
36,5

2
8
19,0
192
24,3

2
10
15,2
256
18,2

2
14
10,9
384
12,2

2
18
8,4
512
9,1

在這種情況下，我們總是使用向上舍入到最接近的整數 (=ROUNDUP(A1;0))。
從表中可以明顯看出，多個伺服器配置對於目標指標是平衡的：
— 26 台伺服器 2*6c / 192 GB
— 19 台伺服器 2*10c / 256 GB
— 10 台伺服器 2*18c / 512 GB

然後，必須根據其他因素來選擇這些配置，例如熱封裝和可用冷卻、已使用的伺服器或成本。

選擇伺服器配置的特點

寬虛擬機器。如果需要託管寬 VM（相當於 1 個 NUMA 節點或更多），建議在可能的情況下選擇配置允許此類 VM 保留在 NUMA 節點內的伺服器。當寬虛擬機器數量較多時，存在叢集資源碎片的危險，在這種情況下，選擇允許寬虛擬機器盡可能密集放置的伺服器。

單一故障域大小。

伺服器規模的選擇也是基於最小化單一故障域的原則。例如，當選擇：
— 3 x 4*10c / 512 GB
— 6 x 2*10c / 256 GB
在其他條件相同的情況下，您必須選擇第二個選項，因為當一台伺服器發生故障（或正在維護）時，遺失的叢集資源不是 33%，而是 17%。同樣，受事故影響的VM和IS數量減半。

基於效能的經典儲存系統測算

經典儲存系統總是使用最壞情況進行運算，排除操作快取和操作最佳化的影響。
作為基本性能指標，我們取磁碟的機械性質（IOPSdisk）：
– 7.2k – 75 IOPS
– 10k – 125 IOPS
– 15k – 175 IOPS

接下來，使用以下公式計算磁碟池中的磁碟數量： = 總 IOPS * ( RW + (1 –RW) * RAIDPen) / IOPSdisk。在哪裡：
總IOPS – 磁碟池所需的總效能（以 IOPS 為單位）
RW – 讀取操作的百分比
RAID筆 – 所選 RAID 等級的 RAID 懲罰

在此閱讀有關設備 RAID 和 RAID 懲罰的更多資訊 - 儲存效能。第一部分。 и 儲存效能。第二部分。 и 儲存效能。第三部分

根據所得的磁碟數量，計算滿足儲存容量要求的可能選項，包括具有多層儲存的選項。
使用SSD作為儲存層的系統的計算單獨考慮。
Flash Cache運算系統的特點

閃存緩存 – 使用快閃記憶體作為二級快取的所有專有技術的通用名稱。當使用快閃記憶體快取時，儲存系統通常會計算為從磁碟提供穩定的負載，而峰值則由快取提供服務。
在這種情況下，有必要了解負載概況和儲存卷區塊存取的本地化程度。快閃記憶體快取是一種針對具有高度本地化查詢的工作負載的技術，實際上不適用於統一載入的磁碟區（例如分析系統）。

低階/中階混合動力系統的計算

中低階層的混合系統使用多級存儲，數據按計劃在不同級別之間移動。同時，最佳模型的多層儲存區塊大小為256 MB。這些特性不允許我們像許多人錯誤地認為的那樣，將分層儲存技術視為一種提高生產力的技術。中低階系統中的多層儲存是一種針對負載不均勻性明顯的系統最佳化儲存成本的技術。

對於分層存儲，首先計算頂層的性能，而底層存儲被認為只對缺失的存儲容量做出貢獻。對於混合多層系統，必須在多層池中使用快閃記憶體快取技術，以補償來自較低層級的突然加熱資料的效能下降。

在分層磁碟池中使用 SSD

SSD 在多層磁碟池中的使用有多種變化，具體取決於給定製造商的快閃記憶體快取演算法的具體實作。
SSD等級的磁碟池儲存策略的一般做法是SSD優先。
只讀快閃記憶體。 對於唯讀快閃記憶體緩存，無論快取如何，SSD 上的儲存層都具有顯著的寫入本地化功能。
讀/寫閃存快取。 對於快閃記憶體緩存，寫入快取大小首先設定為最大快取大小，只有當快取大小不足以服務整個本地化工作負載時，才會出現 SSD 儲存層。
SSD 和快取效能計算每次都是根據製造商的建議進行的，但始終針對最壞的情況。

來源： www.habr.com