RHVoice 1.6.0 اسپيچ سنٿيسائزر جاري ڪيو

اوپن اسپيچ سنٿيسس سسٽم RHVoice 1.6.0 جاري ڪيو ويو، شروعاتي طور تي روسي ٻولي لاءِ اعليٰ معيار جي مدد مهيا ڪرڻ لاءِ تيار ڪيو ويو، پر پوءِ انگريزي، پرتگالي، يوڪريني، ڪرغز، تاتار ۽ جارجيا سميت ٻين ٻولين لاءِ ترتيب ڏنو ويو. ڪوڊ C++ ۾ لکيل آهي ۽ LGPL 2.1 لائسنس تحت ورهايو ويو آهي. GNU/Linux، ونڊوز ۽ اينڊرائيڊ تي ڪم کي سپورٽ ڪري ٿو. پروگرام متن کي تقرير ۾ تبديل ڪرڻ لاءِ معياري TTS (ٽيڪسٽ کان اسپيچ) انٽرفيس سان مطابقت رکي ٿو: SAPI5 (ونڊوز)، اسپيچ ڊسپيچر (GNU/Linux) ۽ Android Text-to-Speech API، پر NVDA ۾ پڻ استعمال ڪري سگھجي ٿو. اسڪرين ريڊر. RHVoice جي خالق ۽ مکيه ڊولپر اولگا Yakovleva آهي، جيڪا مڪمل طور تي انڌي هجڻ جي باوجود پروجيڪٽ ٺاهي ٿي.

نئون نسخو شامل ڪري ٿو 5 نوان آواز جا اختيار روسي تقرير لاءِ. البانيا ٻولي جي حمايت لاڳو ڪئي وئي آهي. يوڪريني ٻوليءَ جي ڊڪشنري کي اپڊيٽ ڪيو ويو آهي. ايموجي ڪردارن جي آواز جي اداڪاري لاءِ سپورٽ کي وڌايو ويو آهي. اينڊرائيڊ پليٽ فارم لاءِ ايپليڪيشن ۾ موجود خامين کي ختم ڪرڻ لاءِ ڪم ڪيو ويو آهي، ڪسٽم ڊڪشنري جي درآمد کي آسان ڪيو ويو آهي، اينڊرائيڊ 11 پليٽ فارم لاءِ سپورٽ شامل ڪئي وئي آهي، انجڻ جي ڪور ۾ نيون سيٽنگون ۽ فنڪشنلٽي شامل ڪئي وئي آهي، جنهن ۾ g2p به شامل آهي. ڪيس، لفظ_برڪ ۽ برابري واري فلٽر لاءِ سپورٽ.

اچو ته ياد رکون ته RHVoice HTS پروجيڪٽ (HMM/DNN-based Speech Synthesis System) جي ترقي ۽ شمارياتي ماڊل سان گڏ پيراميٽرڪ سنٿيسس جو طريقو استعمال ڪري ٿو (Statistical Parametric Synthesis based on HMM - hidden Markov Model). شمارياتي ماڊل جو فائدو گهٽ اوور هيڊ لاڳت ۽ غير گهربل سي پي يو پاور آهي. سڀئي عمل مقامي طور تي صارف جي سسٽم تي ڪيا ويا آهن. تقرير جي معيار جي ٽن سطحن جي حمايت ڪئي وئي آهي (گهٽ معيار، اعلي ڪارڪردگي ۽ ننڍو ردعمل جو وقت).

شمارياتي ماڊل جو منفي پاسو تلفظ جو نسبتاً گهٽ معيار آهي، جيڪو سنٿيسائيزر جي ان سطح تائين نه ٿو پهچي، جيڪي قدرتي تقرير جي ٽڪڙن جي ميلاپ جي بنياد تي تقرير ٺاهي، پر ان جي باوجود نتيجو بلڪل جائز آهي ۽ لائوڊ اسپيڪر تان رڪارڊنگ نشر ڪرڻ جهڙو آهي. . مقابلي لاءِ، سليرو پروجيڪٽ، جيڪو مشين لرننگ ٽيڪنالاجيز ۽ روسي ٻوليءَ لاءِ ماڊلز جو هڪ سيٽ جي بنياد تي هڪ کليل اسپيچ سنٿيسس انجڻ مهيا ڪري ٿو، RHVoice کان اعليٰ معيار ۾ آهي.

روسي ٻوليءَ لاءِ 13 آواز جا آپشن موجود آهن، ۽ 5 انگريزيءَ لاءِ، آوازن کي قدرتي تقرير جي رڪارڊنگ جي بنياد تي ٺاهيو ويو آهي. سيٽنگون ۾ توھان تبديل ڪري سگھو ٿا رفتار، پچ ۽ حجم. سونڪ لائبريري کي استعمال ڪري سگھجي ٿو tempo تبديل ڪرڻ لاء. ان پٽ ٽيڪسٽ جي تجزيي جي بنياد تي ٻولين کي خودڪار طريقي سان ڳولڻ ۽ مٽائڻ ممڪن آهي (مثال طور، ڪنهن ٻئي ٻوليءَ ۾ لفظن ۽ حوالن لاءِ، ان ٻوليءَ جو هڪ سنٿيسس ماڊل استعمال ڪري سگهجي ٿو). وائيس پروفائلز سپورٽ آھن، مختلف ٻولين لاءِ آوازن جي مجموعن کي بيان ڪندي.

جو ذريعو: opennet.ru

تبصرو شامل ڪريو