RHVoice 1.8.0 wicara synthesizer dirilis

Sistem sintesis wicara mbukak RHVoice 1.8.0 dirilis, wiwitane dikembangake kanggo nyedhiyakake dhukungan kualitas dhuwur kanggo basa Rusia, nanging banjur diadaptasi kanggo basa liyane, kalebu Inggris, Portugis, Ukrainia, Kyrgyzstan, Tatar lan Georgia. Kode kasebut ditulis ing C ++ lan disebarake miturut lisensi LGPL 2.1. Ndhukung karya ing GNU/Linux, Windows lan Android. Program iki kompatibel karo antarmuka TTS standar (text-to-speech) kanggo ngowahi teks dadi wicara: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) lan Android Text-To-Speech API, nanging uga bisa digunakake ing NVDA. maca layar. Pencipta lan pangembang utama RHVoice yaiku Olga Yakovleva, sing ngembangake proyek kasebut sanajan wuta.

Versi 1.8 kanggo platform Android ngenalake sistem manajemen data swara lan basa anyar sing ngidini sampeyan ndownload nganyari data swara tanpa nganyari aplikasi seluler. Nganyari data kanggo swara lan basa sing ditambahake dicenthang kanthi otomatis. Kajaba iku, rilis anyar ngenalake dhukungan kanggo basa Polandia lan nambah swara anyar kanggo basa Makedonia. Kompatibilitas karo rilis alfa lan beta paling anyar saka maca layar NVDA dijamin. Ndandani masalah nalika mbangun ing platform Linux sing kedadeyan nalika Speech Dispatcher ora ana.

Elinga yen RHVoice nggunakake pangembangan proyek HTS (Sistem Sintesis Speech berbasis HMM/DNN) lan metode sintesis parametrik kanthi model statistik (Sintesis Parametrik Statistik adhedhasar HMM - Model Markov Tersembunyi). Kauntungan saka model statistik yaiku biaya overhead sing murah lan daya CPU sing ora dikarepake. Kabeh operasi ditindakake sacara lokal ing sistem pangguna. Telung tingkat kualitas wicara didhukung (kualitas luwih murah, kinerja luwih dhuwur lan wektu reaksi luwih cendhak).

Kelemahane model statistik yaiku kualitas lafal sing relatif kurang, sing ora tekan tingkat synthesizer sing ngasilake wicara adhedhasar kombinasi fragmen wicara alami, nanging asile cukup bisa dibaca lan meh padha karo siaran rekaman saka speaker. . Kanggo mbandhingake, proyek Silero, sing nyedhiyakake mesin sintesis wicara sing mbukak adhedhasar teknologi pembelajaran mesin lan sakumpulan model kanggo basa Rusia, luwih unggul tinimbang RHVoice.

Ana 14 opsi swara sing kasedhiya kanggo basa Rusia, lan 6 kanggo basa Inggris. Swara kasebut dibentuk adhedhasar rekaman ucapan alami. Ing setelan sampeyan bisa ngganti kacepetan, Jarak lan volume. Pustaka Sonic bisa digunakake kanggo ngganti tempo. Sampeyan bisa ndeteksi lan ngalih basa kanthi otomatis adhedhasar analisis teks input (contone, kanggo tembung lan kuotasi ing basa liya, model sintesis asli saka basa kasebut bisa digunakake). Profil swara didhukung, nemtokake kombinasi swara kanggo macem-macem basa.

Source: opennet.ru

Add a comment