Facebook شايع ڪري ٿو مشين ترجمي جو ماڊل جيڪو 200 ٻولين کي سپورٽ ڪري ٿو

Facebook (روسي فيڊريشن ۾ پابندي مڙهيل) NLLB (No Language Left Behind) پروجيڪٽ جي ترقيات کي شايع ڪيو آهي، جنهن جو مقصد انگريزيءَ ۾ وچولي ترجمي کي پاسو ڪندي متن کي هڪ ٻولي کان ٻي ٻوليءَ ۾ سڌو سنئون ترجمو ڪرڻ لاءِ هڪ عالمگير مشين لرننگ ماڊل ٺاهڻ آهي. تجويز ڪيل ماڊل 200 کان وڌيڪ ٻولين تي مشتمل آھي، جن ۾ آفريڪي ۽ آسٽريليا جي ماڻھن جون نادر ٻوليون شامل آھن. پروجيڪٽ جو حتمي مقصد ڪنهن به ماڻهوءَ لاءِ رابطي لاءِ هڪ وسيلو مهيا ڪرڻ آهي، قطع نظر ان جي ٻولي ڪهڙي به هجي.

ماڊل هڪ Creative Commons BY-NC 4.0 لائسنس تحت لائسنس يافته آهي، جيڪو اجازت ڏئي ٿو نقل ڪرڻ، ٻيهر ورهائڻ، ڪسٽمائيزيشن، ۽ اخذ ڪندڙ ڪم، بشرطيڪ توهان انتساب ڏيو، لائسنس برقرار رکو، ۽ ان کي صرف غير تجارتي مقصدن لاءِ استعمال ڪريو. ماڊلز سان ڪم ڪرڻ جا اوزار MIT لائسنس تحت مهيا ڪيا ويا آهن. اين ايل ايل بي ماڊل استعمال ڪندي ترقي کي تيز ڪرڻ لاءِ، تحقيق ڪندڙن کي گرانٽ فراهم ڪرڻ لاءِ 200 هزار ڊالر مختص ڪرڻ جو فيصلو ڪيو ويو.

تجويز ڪيل ماڊل استعمال ڪندي منصوبن جي تخليق کي آسان ڪرڻ لاءِ، ماڊلز جي معيار کي جانچڻ ۽ جانچڻ لاءِ استعمال ٿيل ايپليڪيشنن جو ڪوڊ (FLORES-200, NLLB-MD, Toxicity-200), ٽريننگ ماڊلز ۽ انڪوڊرز لاءِ ڪوڊ LASER3 لائبريري تي ٻڌل ( ٻولي-Agnostic Sentence) اضافي طور تي کليل ذريعو آهن. نمائندگي). آخري ماڊل ٻن نسخن ۾ پيش ڪيو ويو آهي - مڪمل ۽ ننڍو. مختصر نسخو گهٽ وسيلن جي ضرورت آهي ۽ تحقيق جي منصوبن ۾ جانچ ۽ استعمال لاء مناسب آهي.

مشين لرننگ سسٽم تي ٻڌل ٻين ترجمي واري نظام جي برعڪس، Facebook جو حل قابل ذڪر آهي ته اهو سڀني 200 ٻولين لاءِ هڪ عام ماڊل پيش ڪري ٿو، سڀني ٻولين کي ڍڪي ٿو ۽ هر ٻوليءَ لاءِ الڳ ماڊل استعمال ڪرڻ جي ضرورت ناهي. ترجمو سڌو سنئون ماخذ ٻوليءَ کان ٽارگيٽ ٻولي ۾ ڪيو ويندو آهي، انگريزيءَ ۾ وچولي ترجمي جي بغير. آفاقي ترجمي وارو نظام ٺاهڻ لاءِ، هڪ LID ماڊل (ٻولي جي سڃاڻپ) اضافي طور تي تجويز ڪيل آهي، جيڪا استعمال ٿيل ٻولي جو تعين ڪرڻ ممڪن بڻائي ٿي. اهي. سسٽم پاڻمرادو سڃاڻي سگھي ٿو ته ڪهڙي ٻولي ۾ معلومات مهيا ڪئي وئي آهي ۽ ان کي استعمال ڪندڙ جي ٻولي ۾ ترجمو ڪري سگهي ٿو.

ترجمو ڪنهن به طرف، 200 سپورٽ ٿيل ٻولين مان ڪنهن جي وچ ۾ سپورٽ آهي. ڪنهن به ٻولين جي وچ ۾ ترجمي جي معيار جي تصديق ڪرڻ لاءِ، FLORES-200 ريفرنس ٽيسٽ سيٽ تيار ڪيو ويو، جنهن مان معلوم ٿيو ته ترجمي جي معيار جي لحاظ کان NLLB-200 ماڊل اڳئين تجويز ڪيل مشين لرننگ تي ٻڌل ريسرچ سسٽم کان اوسط 44 سيڪڙو بهتر آهي. BLEU ميٽرڪس مشين جي ترجمي کي معياري انساني ترجمي سان ڀيٽڻ. نادر افريقي ٻولين ۽ هندستاني ٻولين لاء، معيار جي برتري 70٪ تائين پهچي ٿي. خاص طور تي تيار ڪيل ڊيمو سائيٽ تي ترجمي جي معيار کي بصري طور تي جانچڻ ممڪن آهي.

جو ذريعو: opennet.ru

تبصرو شامل ڪريو