Situasi: kinerja GPU virtual tidak kalah dengan solusi perangkat keras

Pada bulan Februari, Stanford mengadakan konferensi tentang komputasi kinerja tinggi (HPC). Perwakilan VMware mengatakan bahwa ketika bekerja dengan GPU, sistem yang didasarkan pada hypervisor ESXi yang dimodifikasi tidak kalah cepatnya dengan solusi bare metal.

Kami berbicara tentang teknologi yang memungkinkan tercapainya hal ini.

Situasi: kinerja GPU virtual tidak kalah dengan solusi perangkat keras
/ foto Victorgrigas CC BY-SA

Masalah kinerja

Menurut analis, sekitar 70% beban kerja ada di pusat data tervirtualisasi. Namun, 30% sisanya masih berjalan pada bare metal tanpa hypervisor. 30% ini sebagian besar terdiri dari aplikasi beban tinggi, seperti yang terkait dengan pelatihan jaringan saraf, dan penggunaan GPU.

Para ahli menjelaskan tren ini dengan fakta bahwa hypervisor, sebagai lapisan abstraksi perantara, dapat mempengaruhi kinerja seluruh sistem. Dalam penelitian lima tahun lalu Anda dapat menemukan datanya tentang mengurangi kecepatan kerja sebesar 10%. Oleh karena itu, perusahaan dan operator pusat data tidak terburu-buru memindahkan beban kerja HPC ke lingkungan virtual.

Namun teknologi virtualisasi terus berkembang dan meningkat. Pada konferensi sebulan lalu, VMware mengatakan bahwa hypervisor ESXi tidak berdampak negatif pada kinerja GPU. Kecepatan komputasi dapat dikurangi hingga tiga persen, sebanding dengan bare metal.

Bagaimana itu bekerja

Untuk meningkatkan kinerja sistem HPC dengan GPU, VMware telah melakukan sejumlah perubahan pada hypervisor. Secara khusus, fungsi vMotion telah dihilangkan. Ini diperlukan untuk penyeimbangan beban dan biasanya mentransfer mesin virtual (VM) antar server atau GPU. Menonaktifkan vMotion mengakibatkan setiap VM kini diberi GPU tertentu. Ini membantu mengurangi biaya saat bertukar data.

Komponen penting lainnya dari sistem adalah teknologi I/O Jalur Langsung. Hal ini memungkinkan driver komputasi paralel CUDA untuk berinteraksi dengan mesin virtual secara langsung, melewati hypervisor. Saat Anda perlu menjalankan beberapa VM pada satu GPU sekaligus, solusi GRID vGPU digunakan. Ini membagi memori kartu menjadi beberapa segmen (tetapi siklus komputasi tidak dibagi).

Diagram operasi dua mesin virtual dalam hal ini akan terlihat seperti ini:

Situasi: kinerja GPU virtual tidak kalah dengan solusi perangkat keras

Hasil dan perkiraan

perusahaan tes yang dilakukan hypervisor dengan melatih model bahasa berdasarkan TensorFlow. β€œKerusakan” kinerjanya hanya 3–4% dibandingkan dengan bare metal. Sebagai imbalannya, sistem dapat mendistribusikan sumber daya sesuai permintaan tergantung pada beban saat ini.

Raksasa IT juga tes yang dilakukan dengan kontainer. Insinyur perusahaan melatih jaringan saraf untuk mengenali gambar. Pada saat yang sama, sumber daya satu GPU didistribusikan ke empat VM kontainer. Akibatnya, performa masing-masing mesin menurun sebesar 17% (dibandingkan dengan satu VM dengan akses penuh ke sumber daya GPU). Namun, jumlah gambar yang diproses per detik ditingkatkan tiga kali. Diharapkan sistem seperti itu akan menemukan aplikasi dalam analisis data dan pemodelan komputer.

Di antara potensi masalah yang mungkin dihadapi VMware, para ahli mengalokasikan target audiens yang agak sempit. Sejumlah kecil perusahaan masih bekerja dengan sistem berkinerja tinggi. Meskipun di Statista rayakanbahwa pada tahun 2021, 94% beban kerja pusat data dunia akan tervirtualisasi. Oleh prakiraan analis, nilai pasar HPC akan tumbuh dari 32 menjadi 45 miliar dolar pada periode 2017 hingga 2022.

Situasi: kinerja GPU virtual tidak kalah dengan solusi perangkat keras
/ foto Titik Akses Global PD

Solusi serupa

Ada beberapa analog di pasaran yang dikembangkan oleh perusahaan IT besar: AMD dan Intel.

Perusahaan pertama untuk virtualisasi GPU menawarkan pendekatan berdasarkan SR-IOV (virtualisasi input/output root tunggal). Teknologi ini memberi VM akses ke sebagian kemampuan perangkat keras sistem. Solusinya memungkinkan Anda berbagi GPU antara 16 pengguna dengan kinerja sistem virtual yang setara.

Adapun raksasa IT kedua, mereka berbasis teknologi pada hypervisor Citrix XenServer 7. Ini menggabungkan kerja driver GPU standar dan mesin virtual, yang memungkinkan mesin virtual untuk menampilkan aplikasi 3D dan desktop pada perangkat ratusan pengguna.

Masa depan teknologi

Pengembang GPU Virtual bertaruh tentang penerapan sistem AI dan semakin populernya solusi berkinerja tinggi di pasar teknologi bisnis. Mereka berharap kebutuhan untuk memproses data dalam jumlah besar akan meningkatkan permintaan akan vGPU.

Sekarang produsen mencari jalan menggabungkan fungsionalitas CPU dan GPU dalam satu inti untuk mempercepat penyelesaian masalah terkait grafis, melakukan perhitungan matematis, operasi logika, dan pemrosesan data. Kemunculan inti tersebut di pasar di masa depan akan mengubah pendekatan terhadap virtualisasi sumber daya dan distribusinya antara beban kerja di lingkungan virtual dan cloud.

Apa yang harus dibaca tentang topik di blog perusahaan kami:

Beberapa postingan dari saluran Telegram kami:

Sumber: www.habr.com

Tambah komentar