NVIDIA Mozilla Common Voice پروجيڪٽ ۾ 1.5 ملين ڊالر جي سيڙپڪاري ڪري ٿو

NVIDIA Mozilla Common Voice پروجيڪٽ ۾ 1.5 ملين ڊالر جي سيڙپڪاري ڪري رهي آهي. اسپيچ ريڪگنيشن سسٽم ۾ دلچسپي ان اڳڪٿي مان نڪرندي آهي ته ايندڙ ڏهن سالن ۾، آواز جي ٽيڪنالاجي هڪ مکيه طريقن مان ٿي ويندي، ماڻهو ڪمپيوٽرن ۽ فونن کان وٺي ڊجيٽل اسسٽنٽ ۽ ڪوسڪ تائين ڊوائيسز سان لهه وچڙ ۾ ايندا.

وائيس سسٽم جي ڪارڪردگي جو دارومدار تمام گهڻو انحصار آهي آواز جي ڊيٽا جي مقدار ۽ قسم تي جيڪو ٽريننگ مشين لرننگ ماڊلز لاءِ موجود آهي. اڄ جي آواز جي ٽيڪنالاجي بنيادي طور تي انگريزي ٻولي جي سڃاڻپ تي ڌيان ڏئي ٿي ۽ ٻولين جي وسيع صفن، تلفظ، ۽ تقرير جي نمونن کي ڍڪي نه ٿو. سيڙپڪاري عوامي آواز جي ڊيٽا جي ترقي کي تيز ڪرڻ، وڌيڪ برادرين ۽ رضاڪارن کي مشغول ڪرڻ، ۽ مڪمل وقت جي پروجيڪٽ عملي جي تعداد کي وڌائڻ ۾ مدد ڪندي.

اچو ته توهان کي ياد ڏياريون ته ڪمن وائس پروجيڪٽ جو مقصد گڏيل ڪم کي منظم ڪرڻ آهي ته جيئن آوازن جي نمونن جو هڪ ڊيٽابيس گڏ ٿئي جيڪو آوازن جي تنوع ۽ تقرير جي انداز کي مدنظر رکي. صارفين کي اسڪرين تي ڏيکاريل آواز جي جملن جي دعوت ڏني وئي آهي يا ٻين صارفين پاران شامل ڪيل ڊيٽا جي معيار جو جائزو وٺو. انساني تقرير جي عام جملن جي مختلف تلفظن جي رڪارڊ سان گڏ گڏ ڪيل ڊيٽابيس کي مشين لرننگ سسٽم ۽ تحقيقي منصوبن ۾ بغير ڪنهن پابندي جي استعمال ڪري سگهجي ٿو.

ڪمن وائس سيٽ ۾ في الحال 164 ماڻهن کان تلفظ جا مثال شامل آهن. 9 مختلف ٻولين ۾ اٽڪل 60 هزار ڪلاڪن جو وائس ڊيٽا گڏ ڪيو ويو آهي. روسي ٻولي لاء سيٽ 1412 شرڪت ڪندڙن ۽ تقرير مواد جي 111 ڪلاڪ، ۽ يوڪريني ٻولي لاء - 459 شرڪت ۽ 30 ڪلاڪ. مقابلي لاء، 66 هزار کان وڌيڪ ماڻهن انگريزيء ۾ مواد جي تياري ۾ حصو ورتو، 1686 ڪلاڪن جي تصديق ٿيل تقرير ترتيب ڏني. تجويز ڪيل سيٽ مشين لرننگ سسٽم ۾ استعمال ڪري سگھجن ٿا تقرير جي سڃاڻپ ۽ سنٿيسس ماڊل ٺاهڻ لاءِ. ڊيٽا عوامي ڊومين (CC0) طور شايع ٿيل آهي.

ووسک مسلسل اسپيچ ريڪگنيشن لئبرريءَ جي مصنف جي مطابق، ڪمن وائس سيٽ جا نقصان آواز جي مواد جو هڪ طرفو هجڻ (20-30 سالن جي عمر وارن مردن جو غالب هجڻ، ۽ عورتن جي آوازن سان مواد جي کوٽ. ، ٻارن ۽ بزرگ)، ڊڪشنري ۾ تبديلي جي کوٽ (ساڳين جملن جي ورجائي) ۽ رڪارڊنگ جي تقسيم MP3 فارميٽ ۾ تحريف.

جو ذريعو: opennet.ru

تبصرو شامل ڪريو