Thiết kế trung tâm dữ liệu ảo hóa

Thiết kế trung tâm dữ liệu ảo hóa

Giới thiệu

Hệ thống thông tin theo quan điểm của người dùng được xác định rõ ràng trong GOST RV 51987 - “một hệ thống tự động, kết quả của nó là trình bày thông tin đầu ra cho lần sử dụng tiếp theo”. Nếu chúng ta xem xét cấu trúc bên trong thì về bản chất, bất kỳ IS nào cũng là một hệ thống các thuật toán liên kết với nhau được triển khai trong mã. Theo nghĩa rộng của luận điểm Turing-Church, một thuật toán (hoặc IS) biến đổi một tập hợp dữ liệu đầu vào thành một tập hợp dữ liệu đầu ra.
Thậm chí có thể nói rằng việc chuyển đổi dữ liệu đầu vào chính là ý nghĩa của sự tồn tại của một hệ thống thông tin. Theo đó, giá trị của IS và toàn bộ tổ hợp IS được xác định thông qua giá trị của dữ liệu đầu vào và đầu ra.
Với suy nghĩ này, thiết kế phải bắt đầu và dựa trên dữ liệu, điều chỉnh kiến ​​trúc và phương pháp phù hợp với cấu trúc và tầm quan trọng của dữ liệu.

Dữ liệu được lưu trữ
Giai đoạn quan trọng trong quá trình chuẩn bị thiết kế là thu thập các đặc điểm của tất cả các bộ dữ liệu được lên kế hoạch xử lý và lưu trữ. Những đặc điểm này bao gồm:
- Khối lượng dữ liệu;
— Thông tin về vòng đời của dữ liệu (sự phát triển của dữ liệu mới, tuổi thọ, xử lý dữ liệu lỗi thời);
- Phân loại dữ liệu theo quan điểm tác động đến hoạt động kinh doanh cốt lõi của công ty (bộ ba bảo mật, tính toàn vẹn, tính khả dụng) cùng với các chỉ số tài chính (ví dụ: chi phí mất dữ liệu trong giờ qua);
— Địa lý xử lý dữ liệu (vị trí vật lý của hệ thống xử lý);
— Yêu cầu quy định đối với từng loại dữ liệu (ví dụ: Luật Liên bang-152, PCI DSS).

Hệ thông thông tin

Dữ liệu không chỉ được lưu trữ mà còn được xử lý (chuyển đổi) bởi hệ thống thông tin. Bước tiếp theo sau khi có được các đặc tính dữ liệu là kiểm kê đầy đủ nhất các hệ thống thông tin, các đặc điểm kiến ​​trúc, sự phụ thuộc lẫn nhau và các yêu cầu cơ sở hạ tầng của chúng trong các đơn vị thông thường cho bốn loại tài nguyên:
— Sức mạnh tính toán của bộ xử lý;
- Dung lượng RAM;
— Yêu cầu về dung lượng và hiệu suất của hệ thống lưu trữ dữ liệu;
— Yêu cầu đối với mạng truyền dữ liệu (kênh bên ngoài, kênh giữa các thành phần IS).
Trong trường hợp này, phải có các yêu cầu đối với từng dịch vụ/vi dịch vụ như một phần của IS.
Riêng biệt, cần lưu ý rằng, để thiết kế chính xác, bắt buộc phải có dữ liệu sẵn có về tác động của IS đối với hoạt động kinh doanh cốt lõi của công ty dưới dạng chi phí cho thời gian ngừng hoạt động của IS (rúp mỗi giờ).

Mô hình mối đe dọa

Phải có một mô hình chính thức về các mối đe dọa để lên kế hoạch bảo vệ dữ liệu/dịch vụ. Hơn nữa, mô hình mối đe dọa không chỉ bao gồm các khía cạnh về tính bảo mật mà còn cả tính toàn vẹn và tính sẵn sàng. Những thứ kia. Ví dụ:
- Lỗi máy chủ vật lý;
- Công tắc phía trên giá đỡ bị hỏng;
— Gián đoạn kênh liên lạc quang giữa các trung tâm dữ liệu;
- Toàn bộ hệ thống lưu trữ hoạt động bị lỗi.
Trong một số trường hợp, các mô hình mối đe dọa được viết không chỉ cho các thành phần cơ sở hạ tầng mà còn cho các hệ thống thông tin cụ thể hoặc các thành phần của chúng, chẳng hạn như lỗi DBMS dẫn đến sự phá hủy cấu trúc dữ liệu về mặt logic.
Tất cả các quyết định trong dự án nhằm bảo vệ khỏi mối đe dọa chưa được mô tả là không cần thiết.

Yêu cầu quy định

Nếu dữ liệu đang được xử lý phải tuân theo các quy tắc đặc biệt do cơ quan quản lý thiết lập thì cần phải có thông tin về bộ dữ liệu và quy tắc xử lý/lưu trữ.

Mục tiêu RPO/RTO

Việc thiết kế bất kỳ loại bảo vệ nào đều yêu cầu phải có chỉ báo mất dữ liệu mục tiêu và thời gian khôi phục dịch vụ mục tiêu cho từng mối đe dọa được mô tả.
Lý tưởng nhất là RPO và RTO phải có chi phí liên quan đến mất dữ liệu và thời gian ngừng hoạt động trên mỗi đơn vị thời gian.

Thiết kế trung tâm dữ liệu ảo hóa

Phân chia thành các nhóm tài nguyên

Sau khi thu thập tất cả thông tin đầu vào ban đầu, bước đầu tiên là nhóm các bộ dữ liệu và IP thành các nhóm dựa trên mô hình mối đe dọa và các yêu cầu pháp lý. Kiểu phân chia của các nhóm khác nhau được xác định - theo chương trình ở cấp độ phần mềm hệ thống hoặc vật lý.
ví dụ:
— Mạch xử lý dữ liệu cá nhân hoàn toàn tách biệt về mặt vật lý với các hệ thống khác;
— Các bản sao lưu được lưu trữ trên một hệ thống lưu trữ riêng.

Trong trường hợp này, các nhóm có thể độc lập không hoàn toàn, ví dụ: hai nhóm tài nguyên máy tính được xác định (sức mạnh bộ xử lý + RAM), sử dụng một nhóm lưu trữ dữ liệu duy nhất và một nhóm tài nguyên truyền dữ liệu duy nhất.

Sức mạnh xử lý

Thiết kế trung tâm dữ liệu ảo hóa

Tóm tắt, yêu cầu về sức mạnh xử lý của một trung tâm dữ liệu ảo hóa được đo lường bằng số lượng bộ xử lý ảo (vCPU) và tỷ lệ hợp nhất của chúng trên bộ xử lý vật lý (pCPU). Trong trường hợp cụ thể này, 1 pCPU = 1 lõi bộ xử lý vật lý (không bao gồm Siêu phân luồng). Số lượng vCPU được tính tổng trên tất cả các nhóm tài nguyên được xác định (mỗi nhóm có thể có hệ số hợp nhất riêng).
Hệ số hợp nhất cho các hệ thống có tải được lấy theo kinh nghiệm, dựa trên cơ sở hạ tầng hiện có hoặc thông qua lắp đặt thí điểm và thử nghiệm tải. Đối với các hệ thống không tải, "thực hành tốt nhất" được sử dụng. Cụ thể, VMware trích dẫn tỷ lệ trung bình là 8:1.

RAM

Tổng yêu cầu RAM được tính bằng phép tính tổng đơn giản. Việc sử dụng đăng ký vượt mức RAM không được khuyến khích.

Tài nguyên lưu trữ

Yêu cầu lưu trữ có được bằng cách tổng hợp tất cả các nhóm theo dung lượng và hiệu suất.
Yêu cầu về hiệu suất được thể hiện bằng IOPS kết hợp với tỷ lệ đọc/ghi trung bình và nếu cần, độ trễ phản hồi tối đa.
Các yêu cầu về Chất lượng Dịch vụ (QoS) cho các nhóm hoặc hệ thống cụ thể phải được chỉ định riêng.

Tài nguyên mạng dữ liệu

Các yêu cầu về mạng dữ liệu có được bằng cách tính tổng tất cả các nhóm băng thông.
Các yêu cầu về Chất lượng dịch vụ (QoS) và độ trễ (RTT) cho các nhóm hoặc hệ thống cụ thể phải được chỉ định riêng.
Là một phần trong các yêu cầu về tài nguyên mạng dữ liệu, các yêu cầu về cách ly và/hoặc mã hóa lưu lượng mạng và các cơ chế ưu tiên (802.1q, IPSec, v.v.) cũng được chỉ định.

Lựa chọn kiến ​​trúc

Hướng dẫn này không bao gồm các lựa chọn khác ngoài kiến ​​trúc x86 và ảo hóa máy chủ 100%. Do đó, việc lựa chọn kiến ​​trúc hệ thống con tính toán phụ thuộc vào việc lựa chọn nền tảng ảo hóa máy chủ, kiểu dáng máy chủ và các yêu cầu cấu hình máy chủ chung.

Điểm mấu chốt của sự lựa chọn là sự chắc chắn của việc sử dụng phương pháp cổ điển với việc tách biệt các chức năng xử lý, lưu trữ và truyền dữ liệu hoặc phương pháp hội tụ.

kiến trúc cổ điển liên quan đến việc sử dụng các hệ thống con thông minh bên ngoài để lưu trữ và truyền dữ liệu, trong khi các máy chủ chỉ đóng góp sức mạnh xử lý và RAM cho nhóm tài nguyên vật lý chung. Trong trường hợp cực đoan, các máy chủ trở nên ẩn danh hoàn toàn, không chỉ có đĩa riêng mà thậm chí không có mã nhận dạng hệ thống. Trong trường hợp này, HĐH hoặc bộ ảo hóa được tải từ phương tiện flash tích hợp hoặc từ hệ thống lưu trữ dữ liệu bên ngoài (khởi động từ SAN).
Trong khuôn khổ kiến ​​trúc cổ điển, việc lựa chọn giữa cánh và giá đỡ được thực hiện chủ yếu dựa trên các nguyên tắc sau:
— Hiệu quả về mặt chi phí (trung bình, máy chủ gắn trên giá rẻ hơn);
— Mật độ tính toán (cao hơn đối với lưỡi dao);
— Tiêu thụ năng lượng và tản nhiệt (cánh có đơn vị riêng cao hơn trên mỗi đơn vị);
— Khả năng mở rộng và điều khiển được (các cánh quạt thường đòi hỏi ít nỗ lực hơn khi lắp đặt quy mô lớn);
- Sử dụng card mở rộng (rất hạn chế lựa chọn cho phiến).
Kiến trúc hội tụ (cũng được biết đến như là siêu hội tụ) liên quan đến việc kết hợp các chức năng xử lý và lưu trữ dữ liệu, dẫn đến việc sử dụng các đĩa máy chủ cục bộ và do đó, việc từ bỏ hệ số dạng phiến cổ điển. Đối với các hệ thống hội tụ, máy chủ rack hoặc hệ thống cụm được sử dụng, kết hợp một số máy chủ phiến và đĩa cục bộ trong một trường hợp.

CPU/Bộ nhớ

Để tính toán cấu hình chính xác, bạn cần hiểu loại tải cho môi trường hoặc từng cụm độc lập.
CPU bị ràng buộc – một môi trường bị giới hạn về hiệu suất bởi sức mạnh của bộ xử lý. Việc thêm RAM sẽ không thay đổi bất cứ điều gì về hiệu suất (số lượng VM trên mỗi máy chủ).
Giới hạn bộ nhớ – môi trường bị giới hạn bởi RAM. Nhiều RAM hơn trên máy chủ cho phép bạn chạy nhiều máy ảo hơn trên máy chủ.
GB / MHz (GB / pCPU) – tỷ lệ trung bình về mức tiêu thụ RAM và sức mạnh bộ xử lý theo tải cụ thể này. Có thể được sử dụng để tính toán dung lượng bộ nhớ cần thiết cho một hiệu suất nhất định và ngược lại.

Tính toán cấu hình máy chủ

Thiết kế trung tâm dữ liệu ảo hóa

Trước tiên, bạn cần xác định tất cả các loại tải và quyết định kết hợp hoặc chia các nhóm máy tính khác nhau thành các cụm khác nhau.
Tiếp theo, đối với mỗi cụm được xác định, tỷ lệ GB/MHz được xác định ở mức tải đã biết trước. Nếu tải không được biết trước nhưng có hiểu biết sơ bộ về mức sử dụng năng lượng của bộ xử lý, bạn có thể sử dụng tỷ lệ vCPU:pCPU tiêu chuẩn để chuyển đổi yêu cầu nhóm thành yêu cầu vật lý.

Đối với mỗi cụm, chia tổng yêu cầu nhóm vCPU cho hệ số:
vCPUsum / vCPU:pCPU = pCPUsum – số lượng đơn vị vật lý cần thiết. lõi
pCPUsum / 1.25 = pCPUht – số lõi được điều chỉnh cho Siêu phân luồng
Giả sử cần tính toán một cụm có 190 lõi / 3.5 TB RAM. Đồng thời, chúng tôi chấp nhận mức tải mục tiêu là 50% sức mạnh bộ xử lý và 75% RAM.

pCPU
190
sử dụng CPU
50%

Mem
3500
Tiện ích ghi nhớ
75%

Ổ cắm
Trung tâm
Srv/CPU
Srv Mem
Srv/Mem

2
6
25,3
128
36,5

2
8
19,0
192
24,3

2
10
15,2
256
18,2

2
14
10,9
384
12,2

2
18
8,4
512
9,1

Trong trường hợp này, chúng tôi luôn sử dụng làm tròn lên số nguyên gần nhất (=ROUNDUP(A1;0)).
Từ bảng, có thể thấy rõ rằng một số cấu hình máy chủ được cân bằng cho các chỉ số mục tiêu:
— 26 máy chủ 2*6c / 192 GB
— 19 máy chủ 2*10c / 256 GB
— 10 máy chủ 2*18c / 512 GB

Sau đó, việc lựa chọn các cấu hình này phải được thực hiện dựa trên các yếu tố bổ sung, chẳng hạn như gói tản nhiệt và khả năng làm mát có sẵn, máy chủ đã được sử dụng hoặc chi phí.

Các tính năng của việc chọn cấu hình máy chủ

Máy ảo rộng. Nếu cần lưu trữ các máy ảo rộng (có thể so sánh với 1 nút NUMA trở lên), nếu có thể, bạn nên chọn một máy chủ có cấu hình cho phép các máy ảo đó vẫn ở trong nút NUMA. Với số lượng lớn máy ảo rộng, có nguy cơ bị phân mảnh tài nguyên cụm và trong trường hợp này, các máy chủ được chọn cho phép đặt máy ảo rộng với mật độ dày đặc nhất có thể.

Kích thước miền thất bại duy nhất.

Việc lựa chọn kích thước máy chủ cũng dựa trên nguyên tắc giảm thiểu miền lỗi duy nhất. Ví dụ: khi chọn giữa:
— 3 x 4*10c / 512 GB
— 6 x 2*10c / 256 GB
Tất cả những thứ khác đều như nhau, bạn phải chọn tùy chọn thứ hai, vì khi một máy chủ bị lỗi (hoặc đang được bảo trì), không phải 33% tài nguyên cụm bị mất mà là 17%. Tương tự như vậy, số lượng VM và IS bị ảnh hưởng bởi vụ tai nạn giảm đi một nửa.

Tính toán hệ thống lưu trữ cổ điển dựa trên hiệu suất

Thiết kế trung tâm dữ liệu ảo hóa

Các hệ thống lưu trữ cổ điển luôn được tính toán theo tình huống xấu nhất, loại trừ ảnh hưởng của bộ nhớ đệm vận hành và tối ưu hóa hoạt động.
Là chỉ báo hiệu suất cơ bản, chúng tôi lấy hiệu suất cơ học từ đĩa (IOPSdisk):
– 7.2k – 75 IOPS
– 10k – 125 IOPS
– 15k – 175 IOPS

Tiếp theo, số lượng đĩa trong nhóm đĩa được tính bằng công thức sau: = TotalIOPS * ( RW + (1 –RW) * RAIDPen) / IOPSdisk. Ở đâu:
- Tổng IOPS – tổng hiệu suất cần thiết trong IOPS từ nhóm đĩa
- RW – tỷ lệ phần trăm của hoạt động đọc
- bút đột kích – Hình phạt RAID cho cấp độ RAID đã chọn

Đọc thêm về RAID thiết bị và hình phạt RAID tại đây - Hiệu suất lưu trữ. Phần một. и Hiệu suất lưu trữ. Phần hai. и Hiệu suất lưu trữ. Một phần ba

Dựa trên số lượng đĩa thu được, các tùy chọn khả thi sẽ được tính toán đáp ứng yêu cầu về dung lượng lưu trữ, bao gồm các tùy chọn có bộ lưu trữ nhiều cấp.
Việc tính toán các hệ thống sử dụng SSD làm lớp lưu trữ được xem xét riêng.
Tính năng của hệ thống tính toán với Flash Cache

Bộ nhớ đệm Flash – tên chung cho tất cả các công nghệ độc quyền để sử dụng bộ nhớ flash làm bộ đệm cấp hai. Khi sử dụng bộ đệm flash, hệ thống lưu trữ thường được tính toán để cung cấp tải ổn định từ các đĩa từ, trong khi bộ nhớ đệm phục vụ mức cao nhất.
Trong trường hợp này, cần phải hiểu cấu hình tải và mức độ bản địa hóa quyền truy cập vào các khối dung lượng lưu trữ. Bộ đệm flash là công nghệ dành cho khối lượng công việc có truy vấn được bản địa hóa cao và trên thực tế không thể áp dụng cho các khối lượng được tải đồng đều (chẳng hạn như đối với hệ thống phân tích).

Tính toán hệ thống hybrid tầm thấp/tầm trung

Các hệ thống kết hợp giữa tầng lớp thấp và trung lưu sử dụng bộ lưu trữ đa cấp với dữ liệu di chuyển giữa các cấp theo lịch trình. Đồng thời, kích thước của khối lưu trữ đa cấp đối với các mẫu tốt nhất là 256 MB. Những tính năng này không cho phép chúng ta coi công nghệ lưu trữ theo cấp độ là công nghệ giúp tăng năng suất như nhiều người lầm tưởng. Lưu trữ đa cấp trong các hệ thống cấp thấp và trung bình là công nghệ giúp tối ưu hóa chi phí lưu trữ cho các hệ thống có tải không đồng đều rõ rệt.

Đối với bộ lưu trữ theo tầng, hiệu suất của tầng trên cùng được tính trước, trong khi tầng lưu trữ dưới cùng được coi là chỉ đóng góp vào dung lượng lưu trữ còn thiếu. Đối với hệ thống nhiều tầng kết hợp, bắt buộc phải sử dụng công nghệ bộ đệm flash cho nhóm nhiều tầng để bù đắp cho sự suy giảm hiệu suất đối với dữ liệu bị nóng đột ngột từ cấp thấp hơn.

Sử dụng ổ SSD trong nhóm đĩa theo tầng

Thiết kế trung tâm dữ liệu ảo hóa

Việc sử dụng SSD trong nhóm đĩa đa cấp có nhiều biến thể, tùy thuộc vào việc triển khai cụ thể các thuật toán bộ đệm flash của nhà sản xuất nhất định.
Thông lệ chung về chính sách lưu trữ cho nhóm đĩa có cấp độ SSD là SSD trước tiên.
Chỉ đọc bộ đệm Flash. Đối với bộ đệm flash chỉ đọc, lớp lưu trữ trên SSD đi kèm với việc bản địa hóa đáng kể việc ghi, bất kể bộ đệm.
Đọc/Ghi Flash Cache. Trong trường hợp bộ đệm flash, kích thước bộ đệm ghi trước tiên được đặt ở kích thước bộ đệm tối đa và tầng lưu trữ SSD chỉ xuất hiện khi kích thước bộ đệm không đủ để phục vụ toàn bộ khối lượng công việc cục bộ.
Việc tính toán hiệu suất của SSD và bộ đệm được thực hiện mỗi lần dựa trên khuyến nghị của nhà sản xuất, nhưng luôn dành cho trường hợp xấu nhất.

Nguồn: www.habr.com

Thêm một lời nhận xét