Intel Xeon اته Tesla V100s څو ځله ښه کړي کله چې د عصبي شبکې روزنه

مرکزي پروسیسر په یوځل کې د اتو ګرافیک پروسیسرونو ترکیب په پرتله په فعالیت کې څو ځله ګړندی و کله چې ژورې زده کړې عصبي شبکې. داسې ښکاري لکه د ساینسي افسانې څخه یو څه، نه دا؟ مګر د رایس پوهنتون څیړونکو د Intel Xeon په کارولو سره ثابته کړې چې دا ممکنه ده.

Intel Xeon اته Tesla V100s څو ځله ښه کړي کله چې د عصبي شبکې روزنه

GPUs تل د CPUs په پرتله د ژورې زده کړې عصبي شبکو لپاره خورا ښه مناسب دي. دا د GPUs د جوړښت له امله دی، کوم چې ډیری کوچني کورونه لري چې په موازي توګه د ډیری کوچني کارونو ترسره کولو توان لري، کوم چې د عصبي شبکو روزنې لپاره اړین دی. مګر دا معلومه شوه چې مرکزي پروسیسرونه، د سمې طریقې سره، په ژوره زده کړه کې خورا اغیزمن کیدی شي.

راپور ورکړل شوی چې کله د SLIDE ژور زده کړې الګوریتم کاروئ، د 44 کور سره د Intel Xeon پروسیسر د اتو NVIDIA Tesla V3,5 کمپیوټري سرعت کونکو ترکیب په پرتله 100 ځله ډیر ګټور و. دا شاید لومړی ځل وي چې CPU نه یوازې په داسې سناریو کې د GPU سره لاس او ګریوان دی ، بلکه دوی یې هم تیر کړي ، او خورا د پام وړ.

د پوهنتون لخوا خپره شوې مطبوعاتي اعلامیه وايي چې د سلایډ الګوریتم GPUs ته اړتیا نلري ځکه چې دا په بشپړ ډول مختلف چلند کاروي. عموما، کله چې د عصبي شبکو روزنه، د روزنې تېروتنه بیک پروپیګیشن تخنیک کارول کیږي، کوم چې د میټریکس ضرب کاروي، کوم چې د GPU لپاره یو مثالی بار دی. سلایډ، له بلې خوا، زده کړه د لټون په ستونزه بدلوي چې د هش میزونو په کارولو سره حل کیږي.


Intel Xeon اته Tesla V100s څو ځله ښه کړي کله چې د عصبي شبکې روزنه

د څیړونکو په وینا، دا د پام وړ د عصبي شبکو د روزنې کمپیوټري لګښت کموي. د بیس لاین ترلاسه کولو لپاره ، څیړونکو د رایس پوهنتون لابراتوار موجوده سیسټم د اتو Tesla V100 سرعت کونکو سره کارولی ترڅو د ګوګل د TensorFlow کتابتون په کارولو سره د عصبي شبکې روزنه وکړي. پروسه 3,5 ساعته وخت نیسي. وروسته، ورته عصبي شبکه د SLIDE الګوریتم په کارولو سره په سیسټم کې د یو واحد 44-کور Xeon پروسیسر سره روزل شوې، او یوازې 1 ساعت وخت نیسي.

دلته د یادونې وړ ده چې انټیل اوس مهال د خپل محصول حد کې د 44 کور پروسیسر ماډلونه نلري. دا ممکنه ده چې څیړونکو یو ډول دودیز یا غیر خپور شوی چپ کارولی وي، مګر دا امکان نلري. ډیر احتمال شتون لري چې دلته د دوه 22 کور Intel Xeons سره یو سیسټم کارول شوی و ، یا په مطبوعاتي اعالمیه کې په ساده ډول یوه تېروتنه وه ، او موږ د 44 تارونو په اړه خبرې کوو چې د یو 22 کور پروسیسر لخوا چمتو شوي. مګر په هر حالت کې، دا پخپله د لاسته راوړنو څخه ډډه نه کوي.

البته، د سلایډ الګوریتم لاهم باید د ډیری ازموینو څخه تیر شي او خپل اغیزمنتوب ثابت کړي، او همدارنګه د کوم ځانګړتیاوو او نیمګړتیاوو نشتوالی. په هرصورت، هغه څه چې موږ یې اوس ګورو خورا اغیزمن دي او واقعیا د صنعت په پراختیا کې لوی اغیزه کولی شي.



سرچینه: 3dnews.ru

Add a comment