Rilaxx ta' sintetizzatur tad-diskors RHVoice 1.6.0

Is-sistema ta 'sintesi tad-diskors miftuħ RHVoice 1.6.0 ġiet rilaxxata, inizjalment żviluppata biex tipprovdi appoġġ ta' kwalità għolja għal-lingwa Russa, iżda mbagħad adattata għal lingwi oħra, inklużi l-Ingliż, Portugiż, Ukrain, Kirgiż, Tatar u Ġorġjan. Il-kodiċi huwa miktub f'C++ u mqassam taħt il-liċenzja LGPL 2.1. Jappoġġja xogħol fuq GNU/Linux, Windows u Android. Il-programm huwa kompatibbli ma 'interfaces standard TTS (test-to-speech) għall-konverżjoni ta' test għal diskors: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) u Android Text-To-Speech API, iżda jista 'jintuża wkoll fl-NVDA screen reader. Il-kreatur u l-iżviluppatur ewlieni ta 'RHVoice hija Olga Yakovleva, li tiżviluppa l-proġett minkejja li hija kompletament għomja.

В новой версии добавлено 5 новых вариантов голосов для русской речи. Реализована поддержка албанского языка. Обновлён словарь для украинского языка. Расширена поддержка озвучивания символов emoji. Проведена работа по устранению ошибок в приложении для платформы Android, упрощён импорт пользовательских словарей, а также добавлена поддержка платформы Android 11. В ядро движка добавлены новые настройки и функциональные возможности, включая g2p.case, word_break и поддержку фильтров эквализации.

Ejja nfakkru li RHVoice juża l-iżviluppi tal-proġett HTS (Sistema ta 'Sinteżi tad-Diskors ibbażata fuq HMM/DNN) u l-metodu ta' sinteżi parametrika b'mudelli statistiċi (Sinteżi Parametrika Statistika bbażata fuq HMM - Mudell Markov Moħbi). Il-vantaġġ tal-mudell statistiku huwa spejjeż ġenerali baxxi u qawwa tas-CPU mhux impenjattiva. L-operazzjonijiet kollha jsiru lokalment fuq is-sistema tal-utent. Tliet livelli ta 'kwalità tad-diskors huma appoġġjati (aktar ma tkun baxxa l-kwalità, iktar ikun għoli l-prestazzjoni u iqsar il-ħin ta' reazzjoni).

L-iżvantaġġ tal-mudell statistiku huwa l-kwalità relattivament baxxa tal-pronunzja, li ma tilħaqx il-livell ta 'sintetizzaturi li jiġġeneraw diskors ibbażat fuq taħlita ta' frammenti ta 'diskors naturali, iżda madankollu r-riżultat huwa pjuttost leġibbli u jixbah ix-xandir ta' reġistrazzjoni minn lawdspiker . Għal tqabbil, il-proġett Silero, li jipprovdi magna ta 'sintesi tad-diskors miftuħ ibbażata fuq teknoloġiji ta' tagħlim bil-magni u sett ta 'mudelli għal-lingwa Russa, huwa ta' kwalità superjuri għal RHVoice.

Hemm 13-il għażla tal-vuċi disponibbli għall-lingwa Russa, u għall-Ingliż 5. Il-vuċijiet huma ffurmati abbażi ta 'reġistrazzjonijiet ta' diskors naturali. Fis-settings tista 'tbiddel il-veloċità, il-pitch u l-volum. Il-librerija Sonic tista 'tintuża biex tbiddel il-tempo. Huwa possibbli li awtomatikament jinstabu u jaqilbu l-lingwi abbażi tal-analiżi tat-test tal-input (pereżempju, għal kliem u kwotazzjonijiet f'lingwa oħra, jista 'jintuża mudell ta' sinteżi nattiv għal dik il-lingwa). Il-profili tal-vuċi huma appoġġjati, li jiddefinixxu kombinazzjonijiet ta 'vuċi għal lingwi differenti.

Sors: opennet.ru

Żid kumment