Tình huống: GPU ảo có hiệu năng không thua kém giải pháp phần cứng

Vào tháng XNUMX, Stanford đã tổ chức một hội nghị về điện toán hiệu năng cao (HPC). Đại diện của VMware cho biết khi làm việc với GPU, hệ thống dựa trên bộ ảo hóa ESXi đã được sửa đổi không thua kém về tốc độ so với các giải pháp kim loại trần.

Chúng tôi nói về những công nghệ giúp đạt được điều này.

Tình huống: GPU ảo có hiệu năng không thua kém giải pháp phần cứng
/ hình chụp Victorgrigas CC BY-SA

Vấn đề hiệu suất

Theo các nhà phân tích, khoảng 70% khối lượng công việc tại các trung tâm dữ liệu ảo hóa. Tuy nhiên, 30% còn lại vẫn chạy bằng kim loại trần mà không có bộ ảo hóa. 30% này chủ yếu bao gồm các ứng dụng có tải trọng cao, chẳng hạn như những ứng dụng liên quan đến đào tạo mạng lưới thần kinh và sử dụng GPU.

Các chuyên gia giải thích xu hướng này bởi thực tế là lớp ảo hóa, với tư cách là lớp trừu tượng trung gian, có thể ảnh hưởng đến hiệu suất của toàn bộ hệ thống. Trong nghiên cứu cách đây XNUMX năm bạn có thể tìm thấy dữ liệu về việc giảm tốc độ làm việc xuống 10%. Do đó, các công ty và nhà điều hành trung tâm dữ liệu không vội chuyển khối lượng công việc HPC sang môi trường ảo.

Nhưng công nghệ ảo hóa đang phát triển và cải tiến. Tại một hội nghị cách đây một tháng, VMware cho biết bộ ảo hóa ESXi không có tác động tiêu cực đến hiệu suất GPU. Tốc độ tính toán có thể giảm ba phần trăm, tương đương với kim loại trần.

Làm thế nào nó hoạt động

Để cải thiện hiệu suất của các hệ thống HPC có GPU, VMware đã thực hiện một số thay đổi đối với bộ ảo hóa. Đặc biệt, nó đã loại bỏ chức năng vMotion. Nó cần thiết để cân bằng tải và thường chuyển các máy ảo (VM) giữa các máy chủ hoặc GPU. Việc tắt vMotion dẫn đến việc mỗi VM hiện được chỉ định một GPU cụ thể. Điều này giúp giảm chi phí khi trao đổi dữ liệu.

Một thành phần quan trọng khác của hệ thống là công nghệ Vào/ra DirectPath. Nó cho phép trình điều khiển điện toán song song CUDA tương tác trực tiếp với các máy ảo, bỏ qua bộ ảo hóa. Khi bạn cần chạy nhiều máy ảo trên một GPU cùng lúc, giải pháp GRID vGPU sẽ được sử dụng. Nó chia bộ nhớ của thẻ thành nhiều đoạn (nhưng các chu trình tính toán không được chia).

Sơ đồ hoạt động của hai máy ảo trong trường hợp này sẽ như sau:

Tình huống: GPU ảo có hiệu năng không thua kém giải pháp phần cứng

Kết quả và dự báo

công ty tiến hành thử nghiệm hypervisor bằng cách đào tạo một mô hình ngôn ngữ dựa trên TensorFlow. Hiệu suất “thiệt hại” chỉ bằng 3–4% so với kim loại trần. Đổi lại, hệ thống có thể phân phối tài nguyên theo yêu cầu tùy thuộc vào tải hiện tại.

Gã khổng lồ CNTT cũng tiến hành thử nghiệm với các thùng chứa. Các kỹ sư của công ty đã đào tạo mạng lưới thần kinh để nhận dạng hình ảnh. Đồng thời, tài nguyên của một GPU được phân phối cho bốn máy ảo container. Kết quả là hiệu suất của từng máy giảm 17% (so với một VM có toàn quyền truy cập vào tài nguyên GPU). Tuy nhiên, số lượng hình ảnh được xử lý mỗi giây tăng ba lần. Người ta mong đợi rằng những hệ thống như vậy sẽ tìm thấy ứng dụng trong phân tích dữ liệu và mô hình hóa máy tính.

Trong số những vấn đề tiềm ẩn mà VMware có thể gặp phải, các chuyên gia chỉ định đối tượng mục tiêu khá hẹp. Một số ít công ty vẫn đang làm việc với các hệ thống hiệu suất cao. Mặc dù trong Statista ăn mừngrằng đến năm 2021, 94% khối lượng công việc của trung tâm dữ liệu trên thế giới sẽ được ảo hóa. Qua dự báo Các nhà phân tích, giá trị của thị trường HPC sẽ tăng từ 32 lên 45 tỷ đô la trong giai đoạn từ 2017 đến 2022.

Tình huống: GPU ảo có hiệu năng không thua kém giải pháp phần cứng
/ hình chụp Điểm truy cập toàn cầu PD

Giải pháp tương tự

Có một số sản phẩm tương tự trên thị trường được phát triển bởi các công ty CNTT lớn: AMD và Intel.

Công ty đầu tiên về ảo hóa GPU cung cấp cách tiếp cận dựa trên SR-IOV (ảo hóa đầu vào/đầu ra một gốc). Công nghệ này cho phép VM truy cập vào một phần khả năng phần cứng của hệ thống. Giải pháp cho phép bạn chia sẻ GPU giữa 16 người dùng với hiệu suất ngang nhau của các hệ thống ảo hóa.

Đối với gã khổng lồ CNTT thứ hai, họ dựa trên công nghệ trên bộ ảo hóa Citrix XenServer 7. Nó kết hợp công việc của trình điều khiển GPU tiêu chuẩn và máy ảo, cho phép máy ảo hiển thị các ứng dụng 3D và máy tính để bàn trên thiết bị của hàng trăm người dùng.

Tương lai của công nghệ

Nhà phát triển GPU ảo đặt cược về việc triển khai hệ thống AI và sự phổ biến ngày càng tăng của các giải pháp hiệu suất cao trên thị trường công nghệ kinh doanh. Họ hy vọng rằng nhu cầu xử lý lượng lớn dữ liệu sẽ làm tăng nhu cầu về vGPU.

Bây giờ các nhà sản xuất đang tìm cách kết hợp chức năng của CPU và GPU trong một lõi để tăng tốc độ giải quyết các vấn đề liên quan đến đồ họa, thực hiện các phép tính toán học, các phép toán logic và xử lý dữ liệu. Sự xuất hiện của các lõi như vậy trên thị trường trong tương lai sẽ thay đổi cách tiếp cận ảo hóa tài nguyên và phân phối chúng giữa các khối lượng công việc trong môi trường ảo và đám mây.

Những gì cần đọc về chủ đề này trong blog công ty của chúng tôi:

Một số bài đăng từ kênh Telegram của chúng tôi:

Nguồn: www.habr.com

Thêm một lời nhận xét