Rilis penyintesis ucapan RHVoice 1.2.4, dikembangkan untuk bahasa Rusia

Rilis sistem sintesis pidato terbuka RHVoice 1.2.4 telah diterbitkan, awalnya dikembangkan untuk memberikan dukungan berkualitas tinggi untuk bahasa Rusia, tetapi kemudian diadaptasi untuk bahasa lain, termasuk Inggris, Portugis, Ukraina, Kirgistan, Tatar, dan Georgia. Kode ini ditulis dalam C++ dan didistribusikan di bawah lisensi LGPL 2.1. Mendukung pekerjaan di GNU/Linux, Windows dan Android. Program ini kompatibel dengan antarmuka TTS (text-to-speech) standar untuk mengonversi teks menjadi ucapan: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) dan Android Text-To-Speech API, namun juga dapat digunakan di NVDA pembaca layar.

Program ini menggunakan metode sintesis parametrik dengan model statistik (Statistical Parametric Synthesis berdasarkan HMM - Hidden Markov Model). Keuntungan model statistik ini adalah biaya overhead yang rendah dan daya CPU yang tidak menuntut. Semua operasi dilakukan secara lokal di sistem pengguna. Tiga tingkat kualitas ucapan didukung (semakin rendah kualitasnya, semakin tinggi performanya, dan semakin pendek waktu reaksinya).

Mendukung pengaturan dan mengubah suara. Ada 9 pilihan suara yang tersedia untuk bahasa Rusia, dan 5 untuk bahasa Inggris.Suara-suara tersebut dibentuk berdasarkan rekaman ucapan alami. Karena penggunaan model statistik, kualitas pengucapannya tidak mencapai level synthesizer yang menghasilkan ucapan berdasarkan kombinasi fragmen ucapan alami, namun hasilnya cukup dapat dipahami dan menyerupai siaran rekaman dari pengeras suara. .

Dalam pengaturannya Anda dapat mengubah kecepatan, nada, dan volume. Perpustakaan Sonic dapat digunakan untuk mengubah tempo. Dimungkinkan untuk secara otomatis mendeteksi dan mengganti bahasa berdasarkan analisis teks masukan (misalnya, untuk kata-kata dan kutipan dalam bahasa lain, model sintesis asli bahasa tersebut dapat digunakan). Profil suara didukung, menentukan kombinasi suara untuk berbagai bahasa.

Sumber: opennet.ru

Tambah komentar