RHVoice 1.8.0 စကားသံ ပေါင်းစပ်ဖန်တီးမှု ထွက်လာပါပြီ။

အဖွင့်စကားပြောပေါင်းစပ်မှုစနစ် RHVoice 1.8.0 ကို ရုရှားဘာသာစကားအတွက် အရည်အသွေးမြင့်ပံ့ပိုးမှုပေးရန် ကနဦးတီထွင်ခဲ့သော်လည်း နောက်ပိုင်းတွင် အင်္ဂလိပ်၊ ပေါ်တူဂီ၊ ယူကရိန်း၊ ခရူဂျစ်၊ တာတာနှင့် ဂျော်ဂျီယာအပါအဝင် အခြားဘာသာစကားများအတွက် လိုက်လျောညီထွေဖြစ်အောင် ပြုလုပ်ထားသည်။ ကုဒ်ကို C++ ဖြင့် ရေးသားထားပြီး LGPL 2.1 လိုင်စင်အောက်တွင် ဖြန့်ဝေထားသည်။ GNU/Linux၊ Windows နှင့် Android တို့တွင် အလုပ်လုပ်ဆောင်နိုင်သည် ။ ပရိုဂရမ်သည် စာသားမှ စကားပြောသို့ ပြောင်းလဲခြင်းအတွက် စံ TTS (စာသားမှ စကားပြော) အင်တာဖေ့စ်များနှင့် တွဲဖက်အသုံးပြုနိုင်သည်- SAPI5 (Windows), Speech Dispatcher (GNU/Linux) နှင့် Android Text-To-Speech API တို့ကိုသာမက NVDA တွင်လည်း အသုံးပြုနိုင်ပါသည်။ မျက်နှာပြင်ဖတ်စက်။ RHVoice ၏ဖန်တီးသူနှင့် အဓိက developer မှာ လုံးဝမျက်စိကန်းနေသော်လည်း ပရောဂျက်ကို တီထွင်သူ Olga Yakovleva ဖြစ်သည်။

Android ပလပ်ဖောင်းအတွက် ဗားရှင်း 1.8 သည် မိုဘိုင်းအက်ပလီကေးရှင်းကို အပ်ဒိတ်မလုပ်ဘဲ အသံဒေတာ အပ်ဒိတ်များကို ဒေါင်းလုဒ်လုပ်ခွင့်ပြုသည့် အသံနှင့် ဘာသာစကား ဒေတာစီမံခန့်ခွဲမှုစနစ်အသစ်ကို မိတ်ဆက်ပေးသည်။ ထည့်သွင်းထားသော အသံများနှင့် ဘာသာစကားများအတွက် ဒေတာအပ်ဒိတ်များကို အလိုအလျောက် စစ်ဆေးပါသည်။ ထို့အပြင်၊ ထုတ်ဝေမှုအသစ်တွင် ပိုလန်ဘာသာစကားအတွက် အထောက်အပံ့ကို မိတ်ဆက်ပေးပြီး Macedonian ဘာသာစကားအတွက် အသံအသစ်ကို ထည့်သွင်းထားသည်။ NVDA ဖန်သားပြင်ဖတ်စက်၏ နောက်ဆုံးထွက် အယ်လ်ဖာနှင့် ဘီတာ ထုတ်ဝေမှုများနှင့် လိုက်ဖက်မှုရှိသည်ကို အာမခံပါသည်။ Speech Dispatcher မရှိသောအခါတွင် ဖြစ်ပေါ်ခဲ့သော Linux ပလပ်ဖောင်းပေါ်တွင် တည်ဆောက်ခြင်းနှင့် ပြဿနာများကို ဖြေရှင်းပေးသည်။

RHVoice သည် HTS ပရောဂျက် (HMM/DNN-based Speech Synthesis System) နှင့် ကိန်းဂဏန်းဆိုင်ရာ စံနမူနာများ (HMM - Hidden Markov Model ကိုအခြေခံ၍ Statistical Parametric Synthesis) ကို အသုံးပြုကြောင်း သတိရကြပါစို့။ ကိန်းဂဏန်းစံနမူနာ၏ အားသာချက်မှာ ကုန်ကျစရိတ်သက်သာပြီး CPU ပါဝါကို မလိုအပ်ပေ။ လုပ်ဆောင်ချက်အားလုံးကို အသုံးပြုသူ၏စနစ်တွင် စက်တွင်းလုပ်ဆောင်သည်။ စကားပြောအရည်အသွေး အဆင့်သုံးဆင့်ကို ပံ့ပိုးထားသည် (အရည်အသွေးနိမ့်လေ၊ စွမ်းဆောင်ရည်မြင့်မားလေနှင့် တုံ့ပြန်မှုအချိန်တိုလေ)။

ကိန်းဂဏန်းစံနမူနာ၏ အားနည်းချက်မှာ အသံထွက်အရည်အသွေးအတော်လေးနိမ့်ပါးသည်၊ သဘာဝစကား၏အပိုင်းအစများပေါင်းစပ်မှုအပေါ်အခြေခံ၍ စကားပြောထုတ်လုပ်သည့်ပေါင်းစပ်ဖွဲ့စည်းမှုအဆင့်သို့မရောက်ရှိနိုင်သော်လည်း ရလဒ်မှာ အတော်လေးကို သိသာထင်ရှားပြီး အသံချဲ့စက်မှ အသံသွင်းခြင်းတစ်ခုနှင့် ဆင်တူသည်။ . နှိုင်းယှဉ်မှုအတွက်၊ စက်သင်ယူမှုနည်းပညာများနှင့် ရုရှားဘာသာစကားအတွက် မော်ဒယ်များကို အခြေခံ၍ အဖွင့်စကားပြောပေါင်းစပ်မှုအင်ဂျင်ကို ပံ့ပိုးပေးသည့် Silero ပရောဂျက်သည် RHVoice ထက် အရည်အသွေးသာလွန်ပါသည်။

ရုရှားဘာသာစကားအတွက် အသံရွေးချယ်ခွင့် 14 ခုနှင့် အင်္ဂလိပ်ဘာသာစကားအတွက် 6 ခုရှိသည်။ အသံများကို သဘာဝအတိုင်း အသံသွင်းထားသော အသံများကို အခြေခံ၍ ဖွဲ့စည်းထားသည်။ ဆက်တင်များတွင် သင်သည် အမြန်နှုန်း၊ အသံနှင့် အသံကို ပြောင်းလဲနိုင်သည်။ Tempo ကိုပြောင်းလဲရန် Sonic စာကြည့်တိုက်ကိုသုံးနိုင်သည်။ ထည့်သွင်းသည့် စာသားကို ခွဲခြမ်းစိတ်ဖြာမှုအပေါ် အခြေခံ၍ ဘာသာစကားများကို အလိုအလျောက် ရှာဖွေပြီး ပြောင်းနိုင်သည် (ဥပမာ၊ အခြားဘာသာစကားတွင် စကားလုံးများနှင့် ကိုးကားချက်များ၊ ထိုဘာသာစကား၏ မူရင်းပေါင်းစပ်မှုပုံစံကို အသုံးပြုနိုင်သည်)။ အသံပရိုဖိုင်များကို ပံ့ပိုးထားပြီး ဘာသာစကားအမျိုးမျိုးအတွက် အသံပေါင်းစပ်မှုကို သတ်မှတ်ပေးပါသည်။

source: opennet.ru

မှတ်ချက် Add