Нөхцөл байдал: виртуал GPU нь техник хангамжийн шийдлүүдийн гүйцэтгэлээс доогуур биш юм

Хоёрдугаар сард Стэнфорд өндөр гүйцэтгэлтэй тооцоолох (HPC) бага хурлыг зохион байгуулав. VMware-ийн төлөөлөгчид GPU-тэй ажиллахдаа өөрчилсөн ESXi гипервизор дээр суурилсан систем нь нүцгэн металлын шийдлүүдээс хурдаараа дутахгүй гэж хэлсэн.

Үүнд хүрэх боломжийг олгосон технологийн талаар бид ярьдаг.

Нөхцөл байдал: виртуал GPU нь техник хангамжийн шийдлүүдийн гүйцэтгэлээс доогуур биш юм
/ гэрэл зураг Викторригас CC BY-SA

Гүйцэтгэлийн асуудал

Шинжээчдийн үзэж байгаагаар ажлын ачааллын 70 орчим хувь нь мэдээллийн төвүүдэд байдаг виртуалчлагдсан. Гэсэн хэдий ч үлдсэн 30% нь гипервизоргүйгээр нүцгэн металл дээр ажилладаг. Энэ 30% нь ихэвчлэн мэдрэлийн сүлжээг сургах, GPU ашиглах зэрэг өндөр ачаалалтай программуудаас бүрддэг.

Мэргэжилтнүүд энэ чиг хандлагыг гипервизор нь завсрын хийсвэр давхаргын хувьд бүхэл системийн гүйцэтгэлд нөлөөлж чадна гэж тайлбарладаг. Таван жилийн өмнө сургуульд сурч байсан та өгөгдлийг олох боломжтой ажлын хурдыг 10% бууруулах тухай. Тиймээс компаниуд болон дата төвийн операторууд HPC-ийн ажлын ачааллыг виртуал орчинд шилжүүлэхийг яарахгүй байна.

Гэхдээ виртуалчлалын технологиуд хөгжиж, сайжирч байна. Сарын өмнө болсон бага хурал дээр VMware ESXi гипервизор нь GPU гүйцэтгэлд сөрөг нөлөө үзүүлэхгүй гэж мэдэгджээ. Тооцооллын хурдыг гурван хувиар бууруулж болох бөгөөд энэ нь нүцгэн металлтай харьцуулах боломжтой юм.

Яаж энэ ажлыг хийдэг

GPU бүхий HPC системийн ажиллагааг сайжруулахын тулд VMware нь гипервизорт хэд хэдэн өөрчлөлт хийсэн. Ялангуяа vMotion функцээс салсан. Энэ нь ачааллыг тэнцвэржүүлэхэд шаардлагатай бөгөөд ихэвчлэн сервер эсвэл GPU хооронд виртуал машин (VM) дамжуулдаг. vMotion-г идэвхгүй болгосноор VM бүрт тодорхой GPU оноогдсон. Энэ нь өгөгдөл солилцох үед зардлыг бууруулахад тусалсан.

Системийн өөр нэг чухал бүрэлдэхүүн хэсэг технологи юм DirectPath I/O. Энэ нь CUDA параллель тооцоолох драйверт гипервизорыг алгасаж виртуал машинуудтай шууд харилцах боломжийг олгодог. Нэг GPU дээр хэд хэдэн VM ажиллуулах шаардлагатай үед GRID vGPU шийдлийг ашигладаг. Энэ нь картын санах ойг хэд хэдэн сегментэд хуваадаг (гэхдээ тооцооллын циклүүд хуваагддаггүй).

Энэ тохиолдолд хоёр виртуал машины үйлдлийн диаграмм дараах байдалтай байна.

Нөхцөл байдал: виртуал GPU нь техник хангамжийн шийдлүүдийн гүйцэтгэлээс доогуур биш юм

Үр дүн ба таамаглал

Фирм туршилтуудыг явуулсан дээр суурилсан хэлний загварыг сургах замаар hypervisor TensorFlow. Гүйцэтгэлийн "хохирол" нь нүцгэн металлтай харьцуулахад ердөө 3-4% байсан. Үүний хариуд систем нь одоогийн ачааллаас хамааран нөөцийг эрэлт хэрэгцээнд хуваарилах боломжтой болсон.

Мөн мэдээллийн технологийн аварга туршилтуудыг явуулсан савтай. Тус компанийн инженерүүд дүрсийг таних мэдрэлийн сүлжээг сургасан. Үүний зэрэгцээ нэг GPU-ийн нөөцийг дөрвөн контейнер VM-д хуваарилсан. Үүний үр дүнд бие даасан машинуудын гүйцэтгэл 17% -иар буурсан (GPU нөөцөд бүрэн хандах боломжтой ганц VM-тэй харьцуулахад). Гэсэн хэдий ч секундэд боловсруулсан зургийн тоо нэмэгдсэн гурван удаа. Ийм системүүд байх төлөвтэй байна олох болно өгөгдлийн шинжилгээ, компьютерийн загварчлал дахь хэрэглээ.

VMware-д тулгарч болзошгүй асуудлуудын дунд мэргэжилтнүүд хуваарилах нэлээд явцуу зорилтот үзэгчид. Цөөн тооны компаниуд өндөр хүчин чадалтай системээр ажиллаж байна. Хэдийгээр Статистад байдаг тэмдэглэх2021 он гэхэд дэлхийн дата төвийн ачааллын 94% нь виртуалчлагдах болно. By урьдчилсан мэдээ Шинжээчдийн үзэж байгаагаар HPC зах зээлийн үнэлгээ 32-45 онд 2017-аас 2022 тэрбум доллар хүртэл өснө.

Нөхцөл байдал: виртуал GPU нь техник хангамжийн шийдлүүдийн гүйцэтгэлээс доогуур биш юм
/ гэрэл зураг Глобал хандалтын цэг PD

Үүнтэй төстэй шийдлүүд

Зах зээл дээр мэдээллийн технологийн томоохон компаниудын боловсруулсан хэд хэдэн аналогууд байдаг: AMD болон Intel.

GPU виртуалчлалын анхны компани санал болгодог SR-IOV (нэг үндэст оролт/гаралтын виртуалчлал) дээр суурилсан арга. Энэ технологи нь VM-д системийн техник хангамжийн чадамжийн зарим хэсгийг ашиглах боломжийг олгодог. Энэхүү шийдэл нь GPU-г 16 хэрэглэгчийн хооронд виртуалжуулсан системтэй ижил гүйцэтгэлтэй хуваалцах боломжийг олгодог.

Мэдээллийн технологийн хоёр дахь аварга компанийн хувьд тэд технологид суурилсан Citrix XenServer 7 гипервизор дээр. Энэ нь стандарт GPU драйвер болон виртуал машиныг хослуулсан бөгөөд энэ нь олон зуун хэрэглэгчдийн төхөөрөмж дээр 3D програмууд болон ширээний компьютеруудыг харуулах боломжийг олгодог.

Технологийн ирээдүй

Виртуал GPU хөгжүүлэгчид бооцоо тавих AI системийг нэвтрүүлэх, бизнесийн технологийн зах зээлд өндөр гүйцэтгэлтэй шийдлүүдийн алдар нэр улам бүр нэмэгдэж байгаа талаар. Тэд их хэмжээний өгөгдөл боловсруулах хэрэгцээ нь vGPU-ийн эрэлтийг нэмэгдүүлнэ гэж найдаж байна.

Одоо үйлдвэрлэгчид арга хайж байна Графиктай холбоотой асуудлыг шийдвэрлэх, математик тооцоолол, логик үйлдлүүд болон өгөгдөл боловсруулах ажлыг хурдасгахын тулд CPU болон GPU-ийн функцийг нэг цөмд нэгтгэнэ. Ирээдүйд зах зээл дээр ийм цөм гарч ирэх нь нөөцийн виртуалчлалын хандлагыг өөрчлөх, виртуал болон үүлэн орчин дахь ажлын ачаалал хоорондын хуваарилалтыг өөрчлөх болно.

Манай компанийн блог дээрх сэдвээр юу унших вэ:

Манай Telegram сувгийн хэд хэдэн бичлэг:

Эх сурвалж: www.habr.com

сэтгэгдэл нэмэх