Liberasyon sentèz lapawòl RHVoice 1.8.0

Sistèm entèz lapawòl louvri RHVoice 1.8.0 te lage, okòmansman devlope pou bay sipò bon jan kalite pou lang Ris la, men answit adapte pou lòt lang, tankou angle, Pòtigè, Ukrainian, Kyrgyz, Tata ak Jòjyen. Kòd la ekri nan C++ epi distribye anba lisans LGPL 2.1. Sipòte travay sou GNU/Linux, Windows ak Android. Pwogram nan konpatib ak koòdone estanda TTS (tèks-a-lapawòl) pou konvèti tèks an lapawòl: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) ak API Android Text-To-Speech, men yo ka itilize tou nan NVDA la. lektè ekran. Kreyatè a ak pwomotè prensipal RHVoice se Olga Yakovleva, ki moun ki devlope pwojè a malgre yo te konplètman avèg.

Vèsyon 1.8 pou platfòm Android a prezante yon nouvo sistèm jesyon done vwa ak lang ki pèmèt ou telechaje mizajou done vwa san yo pa mete ajou aplikasyon mobil lan. Mizajou done pou ajoute vwa ak lang yo tcheke otomatikman. Anplis de sa, nouvo lage a prezante sipò pou lang Polonè a epi ajoute yon nouvo vwa pou lang Masedwan an. Se konpatibilite ak dènye alfa ak beta lektè ekran NVDA yo asire. Fiks pwoblèm ak bati sou platfòm Linux ki te fèt lè Speech Dispatcher pa te prezan.

Se pou nou sonje ke RHVoice sèvi ak devlopman yo nan pwojè HTS (HMM/DNN ki baze sou Speech Synthesis System) ak metòd sentèz parametrik la ak modèl estatistik (Statistical Parametric Synthesis ki baze sou HMM - Hidden Markov Model). Avantaj nan modèl la estatistik se pri ki ba sou tèt yo ak pouvwa CPU ki pa mande. Tout operasyon yo fèt lokalman sou sistèm itilizatè a. Twa nivo bon jan kalite lapawòl yo sipòte (pi bon jan kalite a pi ba, se pi wo a pèfòmans ak pi kout tan an reyaksyon).

Dezavantaj nan modèl la estatistik se bon jan kalite a relativman ba nan pwononsyasyon, ki pa rive nan nivo a nan sentèz ki jenere lapawòl ki baze sou yon konbinezon de fragman nan lapawòl natirèl, men kanmenm rezilta a se byen lizib epi li sanble ak difize yon anrejistreman ki soti nan yon loudspeaker. . Pou konparezon, pwojè Silero a, ki bay yon motè sentèz lapawòl ki baze sou teknoloji aprantisaj machin ak yon seri modèl pou lang Ris la, siperyè nan kalite RHVoice.

Gen 14 opsyon vwa ki disponib pou lang Ris la, ak 6 pou angle.Vwa yo fòme baze sou anrejistreman lapawòl natirèl. Nan anviwònman yo ou ka chanje vitès la, anplasman ak volim. Bibliyotèk Sonic la ka itilize pou chanje tèmpo a. Li posib otomatikman detekte ak chanje lang ki baze sou analiz tèks la antre (pa egzanp, pou mo ak quotes nan yon lòt lang, yon modèl sentèz natif natal nan lang sa a ka itilize). Pwofil vwa yo sipòte, defini konbinezon vwa pou diferan lang.

Sous: opennet.ru

Add nouvo kòmantè