Situasi: GPU maya tidak kalah dalam prestasi berbanding penyelesaian perkakasan

Pada bulan Februari, Stanford menganjurkan persidangan mengenai pengkomputeran berprestasi tinggi (HPC). Wakil VMware berkata bahawa apabila bekerja dengan GPU, sistem berdasarkan hipervisor ESXi yang diubah suai tidak lebih rendah dari segi kelajuan berbanding penyelesaian logam kosong.

Kami bercakap tentang teknologi yang memungkinkan untuk mencapai ini.

Situasi: GPU maya tidak kalah dalam prestasi berbanding penyelesaian perkakasan
/ foto Victorgrigas CC BY-SA

Isu prestasi

Menurut penganalisis, kira-kira 70% daripada beban kerja di pusat data secara maya. Walau bagaimanapun, baki 30% masih berjalan pada logam kosong tanpa hypervisor. 30% ini kebanyakannya terdiri daripada aplikasi beban tinggi, seperti yang berkaitan dengan rangkaian neural latihan dan menggunakan GPU.

Pakar menerangkan trend ini dengan fakta bahawa hypervisor, sebagai lapisan abstraksi perantaraan, boleh menjejaskan prestasi keseluruhan sistem. Dalam kajian lima tahun lalu anda boleh mencari data tentang mengurangkan kelajuan kerja sebanyak 10%. Oleh itu, syarikat dan pengendali pusat data tidak tergesa-gesa untuk memindahkan beban kerja HPC ke persekitaran maya.

Tetapi teknologi virtualisasi sedang membangun dan bertambah baik. Pada persidangan sebulan yang lalu, VMware berkata bahawa hipervisor ESXi tidak mempunyai kesan negatif terhadap prestasi GPU. Kelajuan pengkomputeran boleh dikurangkan sebanyak tiga peratus, yang setanding dengan logam kosong.

Как это Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚

Untuk meningkatkan prestasi sistem HPC dengan GPU, VMware telah membuat beberapa perubahan pada hipervisor. Khususnya, ia telah menyingkirkan fungsi vMotion. Ia diperlukan untuk pengimbangan beban dan biasanya memindahkan mesin maya (VM) antara pelayan atau GPU. Melumpuhkan vMotion menyebabkan setiap VM kini diberikan GPU tertentu. Ini membantu mengurangkan kos semasa bertukar data.

Satu lagi komponen utama sistem ialah teknologi DirectPath I/O. Ia membolehkan pemacu pengkomputeran selari CUDA berinteraksi dengan mesin maya secara langsung, memintas hipervisor. Apabila anda perlu menjalankan beberapa VM pada satu GPU sekaligus, penyelesaian GRID vGPU digunakan. Ia membahagikan memori kad kepada beberapa segmen (tetapi kitaran pengiraan tidak dibahagikan).

Rajah operasi dua mesin maya dalam kes ini akan kelihatan seperti ini:

Situasi: GPU maya tidak kalah dalam prestasi berbanding penyelesaian perkakasan

Keputusan dan ramalan

syarikat ujian yang dijalankan hypervisor dengan melatih model bahasa berdasarkan TensorFlow. Prestasi "kerosakan" hanya 3-4% berbanding logam kosong. Sebagai balasan, sistem ini dapat mengagihkan sumber atas permintaan bergantung pada beban semasa.

Gergasi IT juga ujian yang dijalankan dengan bekas. Jurutera syarikat melatih rangkaian saraf untuk mengenali imej. Pada masa yang sama, sumber satu GPU telah diedarkan antara empat VM kontena. Akibatnya, prestasi mesin individu menurun sebanyak 17% (berbanding dengan VM tunggal dengan akses penuh kepada sumber GPU). Walau bagaimanapun, bilangan imej yang diproses sesaat meningkat tiga kali. Adalah dijangka bahawa sistem sedemikian akan mencari aplikasi dalam analisis data dan pemodelan komputer.

Antara potensi masalah yang mungkin dihadapi oleh VMware, pakar memperuntukkan sasaran penonton yang agak sempit. Sebilangan kecil syarikat masih bekerja dengan sistem berprestasi tinggi. Walaupun dalam Statista meraikanbahawa menjelang 2021, 94% daripada beban kerja pusat data dunia akan dimaya. Oleh ramalan penganalisis, nilai pasaran HPC akan berkembang daripada 32 kepada 45 bilion dolar dalam tempoh dari 2017 hingga 2022.

Situasi: GPU maya tidak kalah dalam prestasi berbanding penyelesaian perkakasan
/ foto Titik Akses Global PD

Penyelesaian yang serupa

Terdapat beberapa analog di pasaran yang dibangunkan oleh syarikat IT besar: AMD dan Intel.

Syarikat pertama untuk virtualisasi GPU menawarkan pendekatan berdasarkan SR-IOV (pemayaan input/output akar tunggal). Teknologi ini memberikan akses VM kepada sebahagian daripada keupayaan perkakasan sistem. Penyelesaian ini membolehkan anda berkongsi GPU antara 16 pengguna dengan prestasi sistem maya yang sama.

Bagi gergasi IT kedua, mereka berasaskan teknologi pada hipervisor Citrix XenServer 7. Ia menggabungkan kerja pemacu GPU standard dan mesin maya, yang membolehkan yang kedua untuk memaparkan aplikasi 3D dan desktop pada peranti ratusan pengguna.

Masa depan teknologi

Pembangun GPU Maya buat pertaruhan mengenai pelaksanaan sistem AI dan semakin populariti penyelesaian berprestasi tinggi dalam pasaran teknologi perniagaan. Mereka berharap bahawa keperluan untuk memproses sejumlah besar data akan meningkatkan permintaan untuk vGPU.

Kini pengeluar mencari jalan menggabungkan fungsi CPU dan GPU dalam satu teras untuk mempercepatkan menyelesaikan masalah yang berkaitan dengan grafik, melaksanakan pengiraan matematik, operasi logik dan pemprosesan data. Kemunculan teras sedemikian di pasaran pada masa hadapan akan mengubah pendekatan kepada virtualisasi sumber dan pengagihannya antara beban kerja dalam persekitaran maya dan awan.

Perkara yang perlu dibaca mengenai topik dalam blog korporat kami:

Beberapa siaran dari saluran Telegram kami:

Sumber: www.habr.com

Tambah komen