RHVoice 1.8.0 խոսքի սինթեզատորի թողարկում

Թողարկվել է RHVoice 1.8.0 բաց խոսքի սինթեզի համակարգը, որն ի սկզբանե մշակվել է ռուսաց լեզվին բարձրորակ աջակցություն ապահովելու համար, սակայն այնուհետև հարմարեցվել է այլ լեզուների համար, այդ թվում՝ անգլերեն, պորտուգալերեն, ուկրաիներեն, ղրղզերեն, թաթարերեն և վրացերեն: Կոդը գրված է C++-ով և տարածվում է LGPL 2.1 լիցենզիայի ներքո: Աջակցում է աշխատանքը GNU/Linux-ում, Windows-ում և Android-ում: Ծրագիրը համատեղելի է ստանդարտ TTS (տեքստից խոսք) ինտերֆեյսների հետ՝ տեքստը խոսքի վերածելու համար՝ SAPI5 (Windows), Խոսքի դիսպետչեր (GNU/Linux) և Android Text-to-Speech API, բայց կարող է օգտագործվել նաև NVDA-ում: էկրանի ընթերցող: RHVoice-ի ստեղծողն ու գլխավոր մշակողը Օլգա Յակովլևան է, ով մշակում է նախագիծը՝ չնայած ամբողջովին կույր լինելուն։

Android պլատֆորմի համար 1.8 տարբերակը ներկայացնում է ձայնային և լեզվական տվյալների կառավարման նոր համակարգ, որը թույլ է տալիս ներբեռնել ձայնային տվյալների թարմացումները՝ առանց բջջային հավելվածի թարմացման: Ավելացված ձայների և լեզուների տվյալների թարմացումները ստուգվում են ավտոմատ կերպով: Բացի այդ, նոր թողարկումը ներկայացնում է լեհերենի աջակցություն և ավելացնում է նոր ձայն մակեդոներենի համար: Ապահովված է NVDA էկրանի ընթերցողի վերջին ալֆա և բետա թողարկումների հետ համատեղելիությունը: Ուղղվել են Linux պլատֆորմի վրա կառուցելու հետ կապված խնդիրները, որոնք առաջացել են, երբ Speech Dispatcher-ը ներկա չի եղել:

Հիշեցնենք, որ RHVoice-ն օգտագործում է HTS նախագծի մշակումները (HMM/DNN-ի վրա հիմնված Խոսքի սինթեզի համակարգ) և պարամետրային սինթեզի մեթոդը վիճակագրական մոդելներով (Statistical Parametric Synthesis based on HMM – Hidden Markov Model): Վիճակագրական մոդելի առավելությունը ցածր վերադիր ծախսերն են և պրոցեսորի անպահանջ հզորությունը: Բոլոր գործողությունները կատարվում են լոկալ՝ օգտագործողի համակարգում: Աջակցվում է խոսքի որակի երեք մակարդակ (որքան ցածր է որակը, այնքան բարձր է կատարումը և այնքան կարճ է արձագանքման ժամանակը):

Վիճակագրական մոդելի բացասական կողմը արտասանության համեմատաբար ցածր որակն է, որը չի հասնում սինթեզատորների այն մակարդակին, որոնք խոսք են ստեղծում բնական խոսքի հատվածների համակցության հիման վրա, բայց, այնուամենայնիվ, արդյունքը բավականին ընթեռնելի է և նման է բարձրախոսից ձայնագրության հեռարձակմանը: . Համեմատության համար նշենք, որ Silero նախագիծը, որն ապահովում է խոսքի բաց սինթեզի շարժիչ, որը հիմնված է մեքենայական ուսուցման տեխնոլոգիաների և ռուսաց լեզվի մոդելների մի շարքի վրա, որակով գերազանցում է RHVoice-ին:

Ռուսերենի համար հասանելի է 14 ձայնային տարբերակ, իսկ անգլերենի համար՝ 6։ Ձայները ձևավորվում են բնական խոսքի ձայնագրությունների հիման վրա։ Կարգավորումներում կարող եք փոխել արագությունը, ձայնի բարձրությունը և ձայնը: Sonic գրադարանը կարող է օգտագործվել տեմպը փոխելու համար: Մուտքային տեքստի վերլուծության հիման վրա հնարավոր է ավտոմատ կերպով հայտնաբերել և փոխել լեզուներ (օրինակ՝ մեկ այլ լեզվով բառերի և մեջբերումների համար կարող է օգտագործվել այդ լեզվի բնածին սինթեզի մոդելը): Ձայնային պրոֆիլները աջակցվում են՝ սահմանելով ձայների համակցություններ տարբեր լեզուների համար:

Source: opennet.ru

Добавить комментарий