Sefyllfa: nid yw GPUs rhithwir yn israddol mewn perfformiad i atebion caledwedd

Ym mis Chwefror, cynhaliodd Stanford gynhadledd ar gyfrifiadura perfformiad uchel (HPC). Dywedodd cynrychiolwyr VMware, wrth weithio gyda GPU, nad yw system sy'n seiliedig ar hypervisor ESXi wedi'i addasu yn israddol o ran cyflymder i atebion metel noeth.

Rydym yn siarad am y technolegau a'i gwnaeth yn bosibl i gyflawni hyn.

Sefyllfa: nid yw GPUs rhithwir yn israddol mewn perfformiad i atebion caledwedd
/ llun Victorgrigas CC BY-SA

Mater perfformiad

Yn ôl dadansoddwyr, tua 70% o lwythi gwaith mewn canolfannau data rhithiol. Fodd bynnag, mae'r 30% sy'n weddill yn dal i redeg ar fetel noeth heb hypervisors. Mae'r 30% hwn yn bennaf yn cynnwys cymwysiadau llwyth uchel, fel y rhai sy'n ymwneud â hyfforddi rhwydweithiau niwral, a defnyddio GPUs.

Mae arbenigwyr yn esbonio'r duedd hon gan y ffaith y gall yr hypervisor, fel haen tynnu canolraddol, effeithio ar berfformiad y system gyfan. Mewn astudiaethau bum mlynedd yn ôl gallwch ddod o hyd i'r data am leihau cyflymder y gwaith o 10%. Felly, nid yw cwmnïau a gweithredwyr canolfannau data ar unrhyw frys i drosglwyddo llwythi gwaith HPC i amgylchedd rhithwir.

Ond mae technolegau rhithwiroli yn datblygu ac yn gwella. Mewn cynhadledd fis yn ôl, dywedodd VMware nad yw'r hypervisor ESXi yn cael effaith negyddol ar berfformiad GPU. Gellir lleihau cyflymder cyfrifiadurol dri y cant, sy'n debyg i fetel noeth.

Sut mae hwn

Er mwyn gwella perfformiad systemau HPC gyda GPUs, mae VMware wedi gwneud nifer o newidiadau i'r hypervisor. Yn benodol, roedd yn cael gwared ar y swyddogaeth vMotion. Mae ei angen ar gyfer cydbwyso llwyth ac fel arfer mae'n trosglwyddo peiriannau rhithwir (VMs) rhwng gweinyddwyr neu GPUs. Arweiniodd analluogi vMotion at bob VM bellach yn cael GPU penodol. Helpodd hyn i leihau costau wrth gyfnewid data.

Elfen allweddol arall o'r system yw technoleg Llwybr Uniongyrchol I/O. Mae'n caniatáu i yrrwr cyfrifiadura cyfochrog CUDA ryngweithio â pheiriannau rhithwir yn uniongyrchol, gan osgoi'r hypervisor. Pan fydd angen i chi redeg sawl VM ar un GPU ar unwaith, defnyddir y datrysiad GRID vGPU. Mae'n rhannu cof y cerdyn yn sawl segment (ond nid yw'r cylchoedd cyfrifiannol wedi'u rhannu).

Bydd y diagram gweithredu o ddau beiriant rhithwir yn yr achos hwn yn edrych fel hyn:

Sefyllfa: nid yw GPUs rhithwir yn israddol mewn perfformiad i atebion caledwedd

Canlyniadau a rhagolygon

cwmni cynnal profion hypervisor trwy hyfforddi model iaith yn seiliedig ar TensorFlow. Dim ond 3-4% oedd y “difrod” perfformiad o gymharu â metel noeth. Yn gyfnewid, roedd y system yn gallu dosbarthu adnoddau yn ôl y galw yn dibynnu ar y llwyth presennol.

Y cawr TG hefyd cynnal profion gyda chynwysyddion. Hyfforddodd peirianwyr y cwmni rwydweithiau niwral i adnabod delweddau. Ar yr un pryd, dosbarthwyd adnoddau un GPU ymhlith pedwar VM cynhwysydd. O ganlyniad, gostyngodd perfformiad peiriannau unigol 17% (o'i gymharu ag un VM gyda mynediad llawn i adnoddau GPU). Fodd bynnag, mae nifer y delweddau a broseswyd yr eiliad cynyddu tri gwaith. Disgwylir i systemau o'r fath bydd dod o hyd cymwysiadau mewn dadansoddi data a modelu cyfrifiadurol.

Ymhlith y problemau posibl y gall VMware eu hwynebu, arbenigwyr dyrannu cynulleidfa darged eithaf cul. Mae nifer fach o gwmnïau yn dal i weithio gyda systemau perfformiad uchel. Er yn Statista dathluerbyn 2021, bydd 94% o lwythi gwaith canolfannau data'r byd yn cael eu rhithwiroli. Gan rhagolygon dadansoddwyr, bydd gwerth y farchnad HPC yn tyfu o 32 i 45 biliwn o ddoleri yn y cyfnod rhwng 2017 a 2022.

Sefyllfa: nid yw GPUs rhithwir yn israddol mewn perfformiad i atebion caledwedd
/ llun Pwynt Mynediad Byd-eang PD

Atebion tebyg

Mae yna nifer o analogau ar y farchnad sy'n cael eu datblygu gan gwmnïau TG mawr: AMD ac Intel.

Y cwmni cyntaf ar gyfer rhithwiroli GPU cynigion dull yn seiliedig ar SR-IOV (rhithwiroli mewnbwn/allbwn un gwraidd). Mae'r dechnoleg hon yn rhoi mynediad i'r VM i ran o alluoedd caledwedd y system. Mae'r datrysiad yn caniatáu ichi rannu'r GPU rhwng 16 o ddefnyddwyr gyda pherfformiad cyfartal o systemau rhithwir.

O ran yr ail gawr TG, maen nhw seiliedig ar dechnoleg ar hypervisor Citrix XenServer 7. Mae'n cyfuno gwaith gyrrwr GPU safonol a pheiriant rhithwir, sy'n caniatáu i'r olaf arddangos cymwysiadau a byrddau gwaith 3D ar ddyfeisiau cannoedd o ddefnyddwyr.

Dyfodol technoleg

Datblygwyr GPU Rhithwir gwneud bet ar weithredu systemau AI a phoblogrwydd cynyddol datrysiadau perfformiad uchel yn y farchnad technoleg busnes. Maent yn gobeithio y bydd yr angen i brosesu symiau mawr o ddata yn cynyddu'r galw am vGPUs.

Nawr gweithgynhyrchwyr chwilio am ffordd cyfuno ymarferoldeb y CPU a GPU mewn un craidd i gyflymu datrys problemau sy'n ymwneud â graffeg, perfformio cyfrifiadau mathemategol, gweithrediadau rhesymegol, a phrosesu data. Bydd ymddangosiad creiddiau o'r fath ar y farchnad yn y dyfodol yn newid yr ymagwedd at rithwiroli adnoddau a'u dosbarthiad rhwng llwythi gwaith mewn amgylcheddau rhithwir a chymylau.

Beth i'w ddarllen ar y pwnc yn ein blog corfforaethol:

Cwpl o bostiadau o'n sianel Telegram:

Ffynhonnell: hab.com

Ychwanegu sylw