ويسپر تقرير جي سڃاڻپ ۽ ترجمي واري نظام لاءِ ڪوڊ کوليو ويو آهي

OpenAI پروجيڪٽ، جيڪو مصنوعي ذهانت جي شعبي ۾ عوامي منصوبن کي ترقي ڪري ٿو، شايع ڪيو آهي ترقيات سان لاڳاپيل ويسپر تقرير جي سڃاڻپ سسٽم. اها دعويٰ ڪئي وئي آهي ته انگريزيءَ ۾ تقرير لاءِ سسٽم انساني سڃاڻپ جي ويجهو خودڪار سڃاڻپ جي اعتبار ۽ درستگي جي سطح فراهم ڪري ٿو. PyTorch فريم ورڪ جي بنياد تي حوالن تي عمل درآمد لاءِ ڪوڊ ۽ اڳ ۾ ئي تربيت يافته ماڊلز جو هڪ سيٽ، استعمال لاءِ تيار، کوليو ويو آهي. ڪوڊ MIT لائسنس تحت کليل آهي.

ماڊل کي تربيت ڏيڻ لاء، 680 هزار ڪلاڪ تقرير جي ڊيٽا استعمال ڪئي وئي، ڪيترن ئي مجموعن مان گڏ ڪيل مختلف ٻولين ۽ موضوع جي علائقن کي ڍڪيندي. اٽڪل 1/3 تقرير جي ڊيٽا جو تربيت ۾ شامل آهي انگريزيء کان سواء ٻين ٻولين ۾. تجويز ڪيل سسٽم صحيح طور تي حالتن کي سنڀاليندو آهي جهڙوڪ تلفظ ٿيل تلفظ، پس منظر شور، ۽ ٽيڪنيڪل جرگون جو استعمال. تقرير کي متن ۾ نقل ڪرڻ کان علاوه، سسٽم ڪنهن به ٻولي مان تقرير کي انگريزي ۾ ترجمو ڪري سگهي ٿو ۽ آڊيو اسٽريم ۾ تقرير جي ظاهر کي ڳولي سگھي ٿو.

ماڊل ٻن نمائندن ۾ ٺهيل آهن: انگريزي ٻولي لاء هڪ ماڊل ۽ هڪ گهڻ لساني ماڊل، جيڪو پڻ روسي، يوڪريني ۽ بيلاروسي ٻولين جي حمايت ڪري ٿو. موڙ ۾، هر نمائندگي کي 5 اختيارن ۾ ورهايو ويو آهي، ماڊل ۾ شامل ڪيل ماپ ۽ پيٽرولن جي تعداد ۾ مختلف. جيتري وڏي سائيز، اوترو ئي وڌيڪ درستگي ۽ سڃاڻپ جي معيار، پر GPU وڊيو ميموري جي سائيز جي لاءِ به اوتري ئي گهرج ۽ ڪارڪردگي گهٽ هوندي. مثال طور، گھٽ ۾ گھٽ اختيار ۾ 39 ملين پيٽرولر شامل آھن ۽ 1 GB وڊيو ميموري جي ضرورت آھي، ۽ وڌ ۾ وڌ 1550 ملين پيٽرولر شامل آھن ۽ 10 GB وڊيو ميموري جي ضرورت آھي. گھٽ ۾ گھٽ اختيار وڌ ۾ وڌ کان 32 ڀيرا تيز آھي.

ويسپر تقرير جي سڃاڻپ ۽ ترجمي واري نظام لاءِ ڪوڊ کوليو ويو آهي

سسٽم ٽرانسفارمر نيورل نيٽورڪ آرڪيٽيڪچر استعمال ڪري ٿو، جنهن ۾ هڪ انڪوڊر ۽ ڊيڪوڊر شامل آهن جيڪي هڪ ٻئي سان رابطو ڪن ٿا. آڊيو کي 30 سيڪنڊن جي حصن ۾ ورهايو ويو آهي، جيڪي هڪ لاگ ميل اسپيڪٽرگرام ۾ تبديل ڪيا ويا آهن ۽ انڪوڊر ڏانهن موڪليا ويا آهن. انڪوڊر جو آئوٽ پٽ ڊيڪوڊر ڏانهن موڪليو ويو آهي، جيڪو خاص ٽوڪن سان مليل متن جي نمائندگي جي اڳڪٿي ڪري ٿو، جيڪا هڪ عام نموني ۾، مسئلن کي حل ڪرڻ جي اجازت ڏئي ٿي، جهڙوڪ ٻولي جي سڃاڻپ، جملن جي تلفظ جي تاريخ جي حساب سان، تقرير جي ٽرانسپشن ۾. مختلف ٻولين، ۽ انگريزي ۾ ترجمو.

جو ذريعو: opennet.ru

تبصرو شامل ڪريو