Amazon 51 ٻولين ۾ تقرير کي سمجھڻ لاءِ ڊيٽا سيٽ شايع ڪيو

Amazon هڪ CC BY 4.0 لائسنس تحت شايع ڪيو آهي "MASSIVE" (Multilingual Amazon SLURP for Slot Filling, Intent Classification, and Virtual-assistant Evaluation) ڊيٽا سيٽ، مشين لرننگ سسٽم جا ماڊل، ۽ توهان جي پنهنجي ماڊلز کي تربيت ڏيڻ لاءِ اوزار جيڪي استعمال ڪري سگهجن ٿا. قدرتي ٻولي (NLU، Natural Language Understanding) تي معلومات سمجھو. سيٽ ۾ 51 ٻولين لاءِ تيار ڪيل هڪ لک کان وڌيڪ تشريح ڪيل ۽ درجه بندي متن وارا لفظ شامل آهن.

SLURP مجموعو، اصل ۾ انگريزيءَ لاءِ موجود آهي، MASSIVE سيٽ جي تعمير لاءِ حوالي طور استعمال ڪيو ويو، جنهن کي 50 ٻين ٻولين ۾ مقامي ترجمو ڪيو ويو. Alexa جي قدرتي ٻولي سمجھڻ (NLU) ٽيڪنالاجي پهريون ڀيرو تقرير کي متن ۾ تبديل ڪري ٿي، پوء متن تي ڪيترن ئي NLU ماڊل لاڳو ڪري ٿو جيڪي صارف جي سوال جي جوهر کي طئي ڪرڻ لاء لفظن جي موجودگي جو تجزيو ڪن ٿا.

سيٽ ٺاهڻ ۽ شايع ڪرڻ جو هڪ مقصد آواز اسسٽنٽ کي هڪ ئي وقت ۾ ڪيترن ئي ٻولين ۾ معلومات کي پروسيس ڪرڻ لاءِ ترتيب ڏيڻ آهي، انهي سان گڏ ٽئين پارٽي ڊولپرز کي حوصلا افزائي ڪرڻ آهي ايپليڪيشنون ۽ خدمتون ٺاهڻ لاءِ جيڪي وائس اسسٽنٽ جي صلاحيتن کي وڌائين. ڊولپرز جي ڌيان کي راغب ڪرڻ لاء، Amazon هڪ شايع ٿيل ڊيٽا سيٽ استعمال ڪندي بهترين عام ماڊل ٺاهڻ لاء هڪ مقابلو شروع ڪيو.

في الحال، وائس اسسٽنٽ صرف چند ٻولين جي حمايت ڪن ٿا ۽ مشين سکيا جا ماڊل استعمال ڪن ٿا مخصوص ٻولي سان ڳنڍيل. MASSIVE پروجيڪٽ جو مقصد مختلف ٻولين ۾ معلومات کي پارس ڪرڻ ۽ پروسيسنگ ڪرڻ جي صلاحيت رکندڙ عالمگير ماڊلز ۽ مشين لرننگ سسٽم ٺاهي هن نقص کي ختم ڪرڻ آهي.

جو ذريعو: opennet.ru

تبصرو شامل ڪريو