RHVoice 1.6.0 խոսքի սինթեզատորի թողարկում

Թողարկվել է RHVoice 1.6.0 բաց խոսքի սինթեզի համակարգը, որն ի սկզբանե մշակվել է ռուսաց լեզվին բարձրորակ աջակցություն ապահովելու համար, սակայն այնուհետև հարմարեցվել է այլ լեզուների համար, այդ թվում՝ անգլերեն, պորտուգալերեն, ուկրաիներեն, ղրղզերեն, թաթարերեն և վրացերեն: Կոդը գրված է C++-ով և տարածվում է LGPL 2.1 լիցենզիայի ներքո: Աջակցում է աշխատանքը GNU/Linux-ում, Windows-ում և Android-ում: Ծրագիրը համատեղելի է ստանդարտ TTS (տեքստից խոսք) ինտերֆեյսների հետ՝ տեքստը խոսքի վերածելու համար՝ SAPI5 (Windows), Խոսքի դիսպետչեր (GNU/Linux) և Android Text-to-Speech API, բայց կարող է օգտագործվել նաև NVDA-ում: էկրանի ընթերցող: RHVoice-ի ստեղծողն ու գլխավոր մշակողը Օլգա Յակովլևան է, ով մշակում է նախագիծը՝ չնայած ամբողջովին կույր լինելուն։

В новой версии добавлено 5 новых вариантов голосов для русской речи. Реализована поддержка албанского языка. Обновлён словарь для украинского языка. Расширена поддержка озвучивания символов emoji. Проведена работа по устранению ошибок в приложении для платформы Android, упрощён импорт пользовательских словарей, а также добавлена поддержка платформы Android 11. В ядро движка добавлены новые настройки и функциональные возможности, включая g2p.case, word_break и поддержку фильтров эквализации.

Հիշեցնենք, որ RHVoice-ն օգտագործում է HTS նախագծի մշակումները (HMM/DNN-ի վրա հիմնված Խոսքի սինթեզի համակարգ) և պարամետրային սինթեզի մեթոդը վիճակագրական մոդելներով (Statistical Parametric Synthesis based on HMM – Hidden Markov Model): Վիճակագրական մոդելի առավելությունը ցածր վերադիր ծախսերն են և պրոցեսորի անպահանջ հզորությունը: Բոլոր գործողությունները կատարվում են լոկալ՝ օգտագործողի համակարգում: Աջակցվում է խոսքի որակի երեք մակարդակ (որքան ցածր է որակը, այնքան բարձր է կատարումը և այնքան կարճ է արձագանքման ժամանակը):

Վիճակագրական մոդելի բացասական կողմը արտասանության համեմատաբար ցածր որակն է, որը չի հասնում սինթեզատորների այն մակարդակին, որոնք խոսք են ստեղծում բնական խոսքի հատվածների համակցության հիման վրա, բայց, այնուամենայնիվ, արդյունքը բավականին ընթեռնելի է և նման է բարձրախոսից ձայնագրության հեռարձակմանը: . Համեմատության համար նշենք, որ Silero նախագիծը, որն ապահովում է խոսքի բաց սինթեզի շարժիչ, որը հիմնված է մեքենայական ուսուցման տեխնոլոգիաների և ռուսաց լեզվի մոդելների մի շարքի վրա, որակով գերազանցում է RHVoice-ին:

Ռուսերենի համար հասանելի է 13 ձայնային տարբերակ, իսկ անգլերենի համար՝ 5։ Ձայները ձևավորվում են բնական խոսքի ձայնագրությունների հիման վրա։ Կարգավորումներում կարող եք փոխել արագությունը, ձայնի բարձրությունը և ձայնը: Sonic գրադարանը կարող է օգտագործվել տեմպը փոխելու համար: Մուտքային տեքստի վերլուծության հիման վրա հնարավոր է ավտոմատ կերպով հայտնաբերել և փոխել լեզուներ (օրինակ՝ մեկ այլ լեզվով բառերի և մեջբերումների համար կարող է օգտագործվել այդ լեզվի բնածին սինթեզի մոդելը): Ձայնային պրոֆիլները աջակցվում են՝ սահմանելով ձայների համակցություններ տարբեր լեզուների համար:

Source: opennet.ru

Добавить комментарий