Pagpagawas sa speech synthesizer RHVoice 1.2.4, naugmad alang sa Russian nga pinulongan

Ang pagpagawas sa open speech synthesis system nga RHVoice 1.2.4 gimantala, sa sinugdan gimugna aron paghatag og taas nga kalidad nga suporta alang sa Russian nga pinulongan, apan dayon gipahaum alang sa ubang mga pinulongan, lakip ang English, Portuguese, Ukrainian, Kyrgyz, Tatar ug Georgian. Ang code gisulat sa C++ ug giapod-apod ubos sa LGPL 2.1 nga lisensya. Nagsuporta sa trabaho sa GNU/Linux, Windows ug Android. Ang programa kay compatible sa standard TTS (text-to-speech) interface para sa pag-convert sa text ngadto sa speech: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) ug Android Text-To-Speech API, pero pwede sab gamiton sa NVDA screen reader.

Gigamit sa programa ang parametric synthesis nga pamaagi nga adunay mga istatistikal nga modelo (Statistical Parametric Synthesis base sa HMM - Hidden Markov Model). Ang bentaha sa istatistikal nga modelo mao ang mubu nga gasto sa overhead ug dili kinahanglan nga gahum sa CPU. Ang tanan nga mga operasyon gihimo sa lokal nga sistema sa user. Tulo ka lebel sa kalidad sa sinultihan ang gisuportahan (mas ubos ang kalidad, mas taas ang pasundayag ug mas mubo ang oras sa reaksyon).

Nagsuporta sa pagpahimutang ug pagbag-o sa mga tingog. Adunay 9 nga mga kapilian sa tingog nga magamit alang sa Russian nga pinulongan, ug 5 alang sa English. Ang mga tingog naporma base sa mga rekording sa natural nga sinultihan. Tungod sa paggamit sa usa ka istatistikal nga modelo, ang kalidad sa paglitok dili makaabot sa lebel sa mga synthesizer nga nagmugna sa sinultihan base sa usa ka kombinasyon sa mga tipik sa natural nga sinultihan, apan bisan pa niana ang resulta mas masabtan ug susama sa usa ka sibya sa usa ka recording gikan sa loudspeaker. .

Sa mga setting mahimo nimong usbon ang katulin, pitch ug volume. Ang Sonic library mahimong gamiton sa pag-usab sa tempo. Posible nga awtomatiko nga makit-an ug ibalhin ang mga lengguwahe base sa pag-analisar sa input nga teksto (pananglitan, alang sa mga pulong ug mga kinutlo sa laing lengguwahe, usa ka modelo sa synthesis nga lumad sa kana nga lengguwahe ang magamit). Gisuportahan ang mga profile sa tingog, nga naghubit sa mga kombinasyon sa mga tingog alang sa lain-laing mga pinulongan.

Source: opennet.ru

Idugang sa usa ka comment