RHVoice 1.6.0 စကားသံ ပေါင်းစပ်ဖန်တီးမှု ထွက်လာပါပြီ။

အဖွင့်စကားပြောပေါင်းစပ်မှုစနစ် RHVoice 1.6.0 ကို ရုရှားဘာသာစကားအတွက် အရည်အသွေးမြင့်ပံ့ပိုးမှုပေးရန် ကနဦးတီထွင်ခဲ့သော်လည်း နောက်ပိုင်းတွင် အင်္ဂလိပ်၊ ပေါ်တူဂီ၊ ယူကရိန်း၊ ခရူဂျစ်၊ တာတာနှင့် ဂျော်ဂျီယာအပါအဝင် အခြားဘာသာစကားများအတွက် လိုက်လျောညီထွေဖြစ်အောင် ပြုလုပ်ထားသည်။ ကုဒ်ကို C++ ဖြင့် ရေးသားထားပြီး LGPL 2.1 လိုင်စင်အောက်တွင် ဖြန့်ဝေထားသည်။ GNU/Linux၊ Windows နှင့် Android တို့တွင် အလုပ်လုပ်ဆောင်နိုင်သည် ။ ပရိုဂရမ်သည် စာသားမှ စကားပြောသို့ ပြောင်းလဲခြင်းအတွက် စံ TTS (စာသားမှ စကားပြော) အင်တာဖေ့စ်များနှင့် တွဲဖက်အသုံးပြုနိုင်သည်- SAPI5 (Windows), Speech Dispatcher (GNU/Linux) နှင့် Android Text-To-Speech API တို့ကိုသာမက NVDA တွင်လည်း အသုံးပြုနိုင်ပါသည်။ မျက်နှာပြင်ဖတ်စက်။ RHVoice ၏ဖန်တီးသူနှင့် အဓိက developer မှာ လုံးဝမျက်စိကန်းနေသော်လည်း ပရောဂျက်ကို တီထွင်သူ Olga Yakovleva ဖြစ်သည်။

ဗားရှင်းအသစ်တွင် ရုရှားစကားပြောအတွက် အသံရွေးချယ်စရာအသစ် ၅ ခုကို ထည့်သွင်းထားသည်။ အယ်လ်ဘေးနီးယန်းဘာသာစကား ပံ့ပိုးမှုကို အကောင်အထည်ဖော်ခဲ့သည်။ ယူကရိန်းဘာသာစကားအတွက် အဘိဓာန်ကို မွမ်းမံပြီးပါပြီ။ အီမိုဂျီဇာတ်ကောင်များ၏ အသံဖြင့်သရုပ်ဆောင်ခြင်းအတွက် ပံ့ပိုးမှုကို တိုးချဲ့ထားသည်။ Android ပလပ်ဖောင်းအတွက် အပလီကေးရှင်းတွင် အမှားအယွင်းများကို ဖယ်ရှားရန် လုပ်ဆောင်ပြီးပြီ၊ စိတ်ကြိုက်အဘိဓာန်များ တင်သွင်းခြင်းကို ရိုးရှင်းပြီး Android 5 ပလပ်ဖောင်းအတွက် ပံ့ပိုးမှုများကို ထည့်သွင်းထားသည်။ ဆက်တင်များနှင့် လုပ်ဆောင်နိုင်စွမ်းအသစ်များကို g11p အပါအဝင် engine core သို့ ထည့်သွင်းထားသည်။ case၊ word_break နှင့် equalization filters များအတွက် ပံ့ပိုးမှု။

RHVoice သည် HTS ပရောဂျက် (HMM/DNN-based Speech Synthesis System) နှင့် ကိန်းဂဏန်းဆိုင်ရာ စံနမူနာများ (HMM - Hidden Markov Model ကိုအခြေခံ၍ Statistical Parametric Synthesis) ကို အသုံးပြုကြောင်း သတိရကြပါစို့။ ကိန်းဂဏန်းစံနမူနာ၏ အားသာချက်မှာ ကုန်ကျစရိတ်သက်သာပြီး CPU ပါဝါကို မလိုအပ်ပေ။ လုပ်ဆောင်ချက်အားလုံးကို အသုံးပြုသူ၏စနစ်တွင် စက်တွင်းလုပ်ဆောင်သည်။ စကားပြောအရည်အသွေး အဆင့်သုံးဆင့်ကို ပံ့ပိုးထားသည် (အရည်အသွေးနိမ့်လေ၊ စွမ်းဆောင်ရည်မြင့်မားလေနှင့် တုံ့ပြန်မှုအချိန်တိုလေ)။

ကိန်းဂဏန်းစံနမူနာ၏ အားနည်းချက်မှာ အသံထွက်အရည်အသွေးအတော်လေးနိမ့်ပါးသည်၊ သဘာဝစကား၏အပိုင်းအစများပေါင်းစပ်မှုအပေါ်အခြေခံ၍ စကားပြောထုတ်လုပ်သည့်ပေါင်းစပ်ဖွဲ့စည်းမှုအဆင့်သို့မရောက်ရှိနိုင်သော်လည်း ရလဒ်မှာ အတော်လေးကို သိသာထင်ရှားပြီး အသံချဲ့စက်မှ အသံသွင်းခြင်းတစ်ခုနှင့် ဆင်တူသည်။ . နှိုင်းယှဉ်မှုအတွက်၊ စက်သင်ယူမှုနည်းပညာများနှင့် ရုရှားဘာသာစကားအတွက် မော်ဒယ်များကို အခြေခံ၍ အဖွင့်စကားပြောပေါင်းစပ်မှုအင်ဂျင်ကို ပံ့ပိုးပေးသည့် Silero ပရောဂျက်သည် RHVoice ထက် အရည်အသွေးသာလွန်ပါသည်။

ရုရှားဘာသာစကားအတွက် အသံရွေးချယ်ခွင့် 13 ခုနှင့် အင်္ဂလိပ်ဘာသာစကားအတွက် 5 ခုရှိသည်။ အသံများကို သဘာဝအတိုင်း အသံသွင်းထားသော အသံများကို အခြေခံ၍ ဖွဲ့စည်းထားသည်။ ဆက်တင်များတွင် သင်သည် အမြန်နှုန်း၊ အသံနှင့် အသံကို ပြောင်းလဲနိုင်သည်။ Tempo ကိုပြောင်းလဲရန် Sonic စာကြည့်တိုက်ကိုသုံးနိုင်သည်။ ထည့်သွင်းသည့် စာသားကို ခွဲခြမ်းစိတ်ဖြာမှုအပေါ် အခြေခံ၍ ဘာသာစကားများကို အလိုအလျောက် ရှာဖွေပြီး ပြောင်းနိုင်သည် (ဥပမာ၊ အခြားဘာသာစကားတွင် စကားလုံးများနှင့် ကိုးကားချက်များ၊ ထိုဘာသာစကား၏ မူရင်းပေါင်းစပ်မှုပုံစံကို အသုံးပြုနိုင်သည်)။ အသံပရိုဖိုင်များကို ပံ့ပိုးထားပြီး ဘာသာစကားအမျိုးမျိုးအတွက် အသံပေါင်းစပ်မှုကို သတ်မှတ်ပေးပါသည်။

source: opennet.ru

မှတ်ချက် Add