صورتحال: مجازي GPUs هارڊويئر حلن جي ڪارڪردگي ۾ گهٽ نه آهن

فيبروري ۾، اسٽينفورڊ اعلي ڪارڪردگي ڪمپيوٽنگ (HPC) تي هڪ ڪانفرنس جي ميزباني ڪئي. VMware جي نمائندن چيو ته جڏهن هڪ GPU سان ڪم ڪري رهيو آهي، تبديل ٿيل ESXi هائپر ويزر تي ٻڌل هڪ سسٽم ننگي ڌاتو حل ڪرڻ جي رفتار ۾ گهٽ نه آهي.

اسان ٽيڪنالاجي بابت ڳالهايون ٿا جيڪي هن کي حاصل ڪرڻ ممڪن بڻائين.

صورتحال: مجازي GPUs هارڊويئر حلن جي ڪارڪردگي ۾ گهٽ نه آهن
/ ڦوٽو وڪٽر گريگاس CC BY-SA

ڪارڪردگي جو مسئلو

تجزيه نگارن جي مطابق، ڊيٽا سينٽرن ۾ ڪم لوڊ جو 70٪ بابت ورچوئل ٿيل. جڏهن ته، باقي 30٪ اڃا تائين هائپر ويزرز کان سواء ننگي ڌاتو تي هلندو آهي. هي 30٪ گهڻو ڪري وڌيڪ لوڊ ٿيل ايپليڪيشنن تي مشتمل آهي، جهڙوڪ جيڪي تربيتي نيورل نيٽ ورڪ سان لاڳاپيل آهن، ۽ GPUs استعمال ڪندي.

ماهرن هن رجحان کي حقيقت جي وضاحت ڪري ٿو ته هائپرائزر، هڪ وچولي تجزيي پرت جي طور تي، سڄي سسٽم جي ڪارڪردگي کي متاثر ڪري سگهي ٿو. پڙهائي ۾ پنج سال اڳ توهان ڊيٽا ڳولي سگهو ٿا ڪم جي رفتار کي 10 سيڪڙو گھٽائڻ بابت. تنهن ڪري، ڪمپنيون ۽ ڊيٽا سينٽر آپريٽرز HPC ڪم لوڊ کي مجازي ماحول ڏانهن منتقل ڪرڻ لاء جلدي ۾ نه آهن.

پر ورچوئلائيزيشن ٽيڪنالاجيون ترقي ڪري رهيون آهن ۽ بهتر ٿي رهيون آهن. هڪ مهينو اڳ هڪ ڪانفرنس ۾، VMware چيو ته ESXi hypervisor GPU ڪارڪردگي تي منفي اثر نه آهي. ڪمپيوٽنگ جي رفتار کي ٽي سيڪڙو گھٽائي سگھجي ٿو، جيڪو ننگي ڌاتو جي مقابلي ۾ آھي.

ڪيئن هن ڪم ڪندو

GPUs سان HPC سسٽم جي ڪارڪردگي کي بهتر ڪرڻ لاء، VMware هائپرائزر ۾ ڪيتريون ئي تبديليون ڪيون آهن. خاص طور تي، اهو vMotion فنڪشن کان نجات حاصل ڪيو ويو. اهو لوڊ بيلنسنگ لاءِ گهربل آهي ۽ عام طور تي ورچوئل مشينن (VMs) کي سرور يا GPUs جي وچ ۾ منتقل ڪري ٿو. vMotion کي غير فعال ڪرڻ جي نتيجي ۾ هر VM کي هاڻي هڪ مخصوص GPU تفويض ڪيو پيو وڃي. ھن مدد ڪئي خرچ گھٽائڻ جڏھن ڊيٽا مٽائڻ.

سسٽم جو ٻيو اهم حصو ٽيڪنالاجي آهي DirectPath I/O. اهو اجازت ڏئي ٿو CUDA متوازي ڪمپيوٽنگ ڊرائيور کي مجازي مشينن سان سڌو رابطو ڪرڻ جي، هائپر ويزر کي پاس ڪندي. جڏهن توهان کي هڪ ڀيرو هڪ GPU تي ڪيترن ئي VMs هلائڻ جي ضرورت آهي، GRID vGPU حل استعمال ڪيو ويندو آهي. اهو ڪارڊ جي ميموري کي ڪيترن ئي حصن ۾ ورهائي ٿو (پر ڪمپيوٽيشنل چڪر ورهايل نه آهن).

هن معاملي ۾ ٻن مجازي مشينن جي آپريشن ڊراگرام هن طرح نظر ايندي:

صورتحال: مجازي GPUs هارڊويئر حلن جي ڪارڪردگي ۾ گهٽ نه آهن

نتيجا ۽ اڳڪٿيون

ڪمپني ٽيسٽ ڪيا هڪ ٻولي ماڊل جي بنياد تي تربيت ڪندي hypervisor TensorFlow. ڪارڪردگي "نقصان" صرف 3-4٪ ننگي ڌاتو جي مقابلي ۾ هئي. واپسي ۾، سسٽم موجوده لوڊ جي لحاظ کان مطالبو تي وسيلن کي ورهائڻ جي قابل هو.

آئي ٽي ديو پڻ ٽيسٽ ڪيا ڪنٽينرز سان. ڪمپني جي انجنيئرن تصويرن کي سڃاڻڻ لاءِ نيورل نيٽ ورڪ کي تربيت ڏني. ساڳئي وقت، هڪ GPU جي وسيلن کي چار ڪنٽينر VMs ۾ ورهايو ويو. نتيجي طور، انفرادي مشينن جي ڪارڪردگي 17٪ گھٽجي وئي (GPU وسيلن تائين مڪمل رسائي سان ھڪڙي وي ايم جي مقابلي ۾). بهرحال، تصويرن جو تعداد في سيڪنڊ تي عمل ڪيو ويو وڌي ويو ٽي دفعا. اميد آهي ته اهڙي نظام ملندو ڊيٽا تجزيو ۽ ڪمپيوٽر ماڊلنگ ۾ ايپليڪيشنون.

امڪاني مسئلن مان جيڪي VMware کي منهن ڏئي سگھن ٿا، ماهر مختص ڪرڻ بلڪه تنگ ٽارگيٽ سامعين. ڪمپنيون جو هڪ ننڍڙو تعداد اڃا تائين اعلي ڪارڪردگي سسٽم سان ڪم ڪري رهيا آهن. جيتوڻيڪ Statista ۾ جشنته 2021 تائين، دنيا جي ڊيٽا سينٽر جي ڪم جي لوڊ جو 94٪ ورچوئلائز ڪيو ويندو. پاران اڳڪٿيون تجزيه نگار، HPC مارڪيٽ جي قيمت 32 کان 45 جي عرصي ۾ 2017 کان 2022 بلين ڊالر تائين وڌي ويندي.

صورتحال: مجازي GPUs هارڊويئر حلن جي ڪارڪردگي ۾ گهٽ نه آهن
/ ڦوٽو گلوبل رسائي پوائنٽ PD

ملندڙ حل

مارڪيٽ تي ڪيترائي اينالاگ آھن جيڪي وڏي آئي ٽي ڪمپنين پاران ٺاھيا ويا آھن: AMD ۽ Intel.

GPU ورچوئلائيزيشن لاءِ پهرين ڪمپني پيش آيون SR-IOV (سنگل روٽ ان پٽ/آئوٽ پُٽ ورچوئلائيزيشن) تي ٻڌل انداز. هي ٽيڪنالاجي VM کي سسٽم جي هارڊويئر صلاحيتن جي حصي تائين رسائي ڏئي ٿي. حل توهان کي 16 صارفين جي وچ ۾ GPU حصيداري ڪرڻ جي اجازت ڏئي ٿو مجازي نظام جي برابر ڪارڪردگي سان.

جيئن ته ٻئي آئي ٽي ديو لاء، اهي ٽيڪنالاجي جي بنياد تي Citrix XenServer 7 hypervisor تي. اهو هڪ معياري GPU ڊرائيور ۽ هڪ ورچوئل مشين جي ڪم کي گڏ ڪري ٿو، جيڪو بعد ۾ 3D ايپليڪيشنن ۽ ڊيسڪ ٽاپن کي سوين صارفين جي ڊوائيسز تي ڊسپلي ڪرڻ جي اجازت ڏئي ٿو.

ٽيڪنالاجي جو مستقبل

ورچوئل GPU ڊولپرز شرط لڳايو AI سسٽم تي عملدرآمد ۽ ڪاروباري ٽيڪنالاجي مارڪيٽ ۾ اعلي ڪارڪردگي حل جي وڌندڙ مقبوليت تي. انهن کي اميد آهي ته ڊيٽا جي وڏي مقدار کي پروسيس ڪرڻ جي ضرورت وي جي پي يو جي مطالبن ۾ اضافو ٿيندو.

هاڻي ٺاهيندڙن هڪ رستو ڳولي رهيو آهي گرافڪس سان لاڳاپيل مسئلا حل ڪرڻ، رياضياتي حساب ڪتاب، منطقي آپريشن، ۽ ڊيٽا پروسيسنگ کي تيز ڪرڻ لاءِ سي پي يو ۽ جي پي يو جي ڪارڪردگي کي هڪ ڪور ۾ گڏ ڪريو. مستقبل ۾ مارڪيٽ تي اهڙن ڪورن جي ظاهر ٿيڻ سان وسيلن جي ورچوئلائيزيشن ۽ ورچوئل ۽ ڪلائوڊ ماحول ۾ ڪم لوڊ جي وچ ۾ انهن جي ورڇ جي طريقي کي تبديل ڪندو.

اسان جي ڪارپوريٽ بلاگ ۾ موضوع تي ڇا پڙهو:

اسان جي ٽيليگرام چينل مان ڪجهه پوسٽون:

جو ذريعو: www.habr.com

تبصرو شامل ڪريو