RHVoice 1.8.0 اسپيچ سنٿيسائزر جاري ڪيو

اوپن اسپيچ سنٿيسس سسٽم RHVoice 1.8.0 جاري ڪيو ويو، شروعاتي طور تي روسي ٻولي لاءِ اعليٰ معيار جي مدد مهيا ڪرڻ لاءِ تيار ڪيو ويو، پر پوءِ انگريزي، پرتگالي، يوڪريني، ڪرغز، تاتار ۽ جارجيا سميت ٻين ٻولين لاءِ ترتيب ڏنو ويو. ڪوڊ C++ ۾ لکيل آهي ۽ LGPL 2.1 لائسنس تحت ورهايو ويو آهي. GNU/Linux، ونڊوز ۽ اينڊرائيڊ تي ڪم کي سپورٽ ڪري ٿو. پروگرام متن کي تقرير ۾ تبديل ڪرڻ لاءِ معياري TTS (ٽيڪسٽ کان اسپيچ) انٽرفيس سان مطابقت رکي ٿو: SAPI5 (ونڊوز)، اسپيچ ڊسپيچر (GNU/Linux) ۽ Android Text-to-Speech API، پر NVDA ۾ پڻ استعمال ڪري سگھجي ٿو. اسڪرين ريڊر. RHVoice جي خالق ۽ مکيه ڊولپر اولگا Yakovleva آهي، جيڪا مڪمل طور تي انڌي هجڻ جي باوجود پروجيڪٽ ٺاهي ٿي.

Android پليٽ فارم لاءِ ورجن 1.8 هڪ نئون وائس ۽ ٻولي ڊيٽا مئنيجمينٽ سسٽم متعارف ڪرايو آهي جيڪو توهان کي موبائل ايپليڪيشن کي اپڊيٽ ڪرڻ کان سواءِ وائس ڊيٽا اپڊيٽ ڊائون لوڊ ڪرڻ جي اجازت ڏئي ٿو. شامل ڪيل آوازن ۽ ٻولين لاءِ ڊيٽا تازه ڪاري خودڪار طور تي چڪاس ڪئي وئي آھي. ان کان علاوه، نئون رليز پولش ٻولي لاءِ سپورٽ متعارف ڪرايو ۽ مقدوني ٻولي لاءِ نئون آواز شامل ڪري ٿو. NVDA اسڪرين ريڊر جي جديد الفا ۽ بيٽا رليز سان مطابقت کي يقيني بڻايو وڃي ٿو. لينڪس پليٽ فارم تي تعمير ڪرڻ سان حل ٿيل مسئلا جيڪي واقع ٿيا جڏهن اسپيچ ڊسپيچر موجود نه هو.

اچو ته ياد رکون ته RHVoice HTS پروجيڪٽ (HMM/DNN-based Speech Synthesis System) جي ترقي ۽ شمارياتي ماڊل سان گڏ پيراميٽرڪ سنٿيسس جو طريقو استعمال ڪري ٿو (Statistical Parametric Synthesis based on HMM - hidden Markov Model). شمارياتي ماڊل جو فائدو گهٽ اوور هيڊ لاڳت ۽ غير گهربل سي پي يو پاور آهي. سڀئي عمل مقامي طور تي صارف جي سسٽم تي ڪيا ويا آهن. تقرير جي معيار جي ٽن سطحن جي حمايت ڪئي وئي آهي (گهٽ معيار، اعلي ڪارڪردگي ۽ ننڍو ردعمل جو وقت).

شمارياتي ماڊل جو منفي پاسو تلفظ جو نسبتاً گهٽ معيار آهي، جيڪو سنٿيسائيزر جي ان سطح تائين نه ٿو پهچي، جيڪي قدرتي تقرير جي ٽڪڙن جي ميلاپ جي بنياد تي تقرير ٺاهي، پر ان جي باوجود نتيجو بلڪل جائز آهي ۽ لائوڊ اسپيڪر تان رڪارڊنگ نشر ڪرڻ جهڙو آهي. . مقابلي لاءِ، سليرو پروجيڪٽ، جيڪو مشين لرننگ ٽيڪنالاجيز ۽ روسي ٻوليءَ لاءِ ماڊلز جو هڪ سيٽ جي بنياد تي هڪ کليل اسپيچ سنٿيسس انجڻ مهيا ڪري ٿو، RHVoice کان اعليٰ معيار ۾ آهي.

روسي ٻوليءَ لاءِ 14 آواز جا آپشن موجود آهن، ۽ 6 انگريزيءَ لاءِ، آوازن کي قدرتي تقرير جي رڪارڊنگ جي بنياد تي ٺاهيو ويو آهي. سيٽنگون ۾ توھان تبديل ڪري سگھو ٿا رفتار، پچ ۽ حجم. سونڪ لائبريري کي استعمال ڪري سگھجي ٿو tempo تبديل ڪرڻ لاء. ان پٽ ٽيڪسٽ جي تجزيي جي بنياد تي ٻولين کي خودڪار طريقي سان ڳولڻ ۽ مٽائڻ ممڪن آهي (مثال طور، ڪنهن ٻئي ٻوليءَ ۾ لفظن ۽ حوالن لاءِ، ان ٻوليءَ جو هڪ سنٿيسس ماڊل استعمال ڪري سگهجي ٿو). وائيس پروفائلز سپورٽ آھن، مختلف ٻولين لاءِ آوازن جي مجموعن کي بيان ڪندي.

جو ذريعو: opennet.ru

تبصرو شامل ڪريو