Pelepasan synthesizer ucapan RHVoice 1.2.4, dikembangkeun pikeun basa Rusia

Pelepasan sistem sintésis ucapan terbuka RHVoice 1.2.4 parantos diterbitkeun, mimitina dikembangkeun pikeun nyayogikeun dukungan kualitas luhur pikeun basa Rusia, tapi teras diadaptasi pikeun basa sanés, kalebet Inggris, Portugis, Ukrania, Kyrgyz, Tatar sareng Georgia. Kode ieu ditulis dina C ++ sarta disebarkeun dina LGPL 2.1 lisénsi. Ngarojong gawé dina GNU/Linux, Windows jeung Android. Program ieu cocog sareng antarmuka TTS (text-to-speech) standar pikeun ngarobih téks kana ucapan: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) sareng Android Text-To-Speech API, tapi ogé tiasa dianggo dina NVDA. maca layar.

Program éta ngagunakeun métode sintésis paramétrik kalayan modél statistik (Statistical Parametric Synthesis based on HMM - Hidden Markov Model). Kauntungannana model statistik nyaeta waragad overhead low jeung kakuatan CPU undemanding. Sadaya operasi dilaksanakeun sacara lokal dina sistem pangguna. Tilu tingkat kualitas ucapan dirojong (nu handap kualitas, nu leuwih luhur kinerja jeung pondok waktu réaksi).

Ngarojong setelan sareng ngarobah sora. Aya 9 pilihan sora anu sayogi pikeun basa Rusia, sareng 5 pikeun basa Inggris. Kusabab ngagunakeun modél statistik, kualitas ngucapkeun henteu ngahontal tingkat sintésis anu ngahasilkeun ucapan dumasar kana kombinasi fragmen ucapan alami, tapi hasilna cukup kaharti sareng nyarupaan siaran rekaman tina spiker. .

Dina setélan anjeun tiasa ngarobih laju, nada sareng volume. Perpustakaan Sonic tiasa dianggo pikeun ngarobih témpo. Kasebut nyaéta dimungkinkeun pikeun ngadeteksi sareng ngalih basa sacara otomatis dumasar kana analisis téks input (contona, pikeun kecap sareng tanda petik dina basa sanés, modél sintésis asli tina basa éta tiasa dianggo). Propil sora dirojong, nangtukeun kombinasi sora pikeun basa béda.

sumber: opennet.ru

Tambahkeun komentar