RHVoice 1.6.0 խոսքի սինթեզատորի թողարկում

Թողարկվել է RHVoice 1.6.0-ը՝ խոսքի սինթեզի բաց կոդով համակարգ: Սկզբնապես մշակված լինելով ռուսերենի բարձրորակ աջակցություն ապահովելու համար, այն հետագայում հարմարեցվել է այլ լեզուների համար, այդ թվում՝ անգլերենի, պորտուգալերենի, ուկրաիներենի, ղրղզերենի, թաթարերենի և վրացերենի: Կոդը գրված է C++ լեզվով և տարածվում է LGPL 2.1 լիցենզիայով: Աջակցվում է նաև GNU/Linux-ի աջակցությունը:Linux, Windows и AndroidԾրագիրը համատեղելի է տեքստը խոսքի փոխակերպելու համար նախատեսված TTS (տեքստից խոսք) տիպիկ ինտերֆեյսների հետ՝ SAPI5 (Windows), խոսքի դիսպետչեր (GNU/Linux) Եվ Android Տեքստային խոսքի API է, բայց կարող է օգտագործվել նաև NVDA էկրանի ընթերցողի հետ։ RHVoice-ի ստեղծողը և գլխավոր մշակողը Օլգա Յակովլևան է, ով շարունակում է զարգացնել նախագիծը՝ չնայած լիովին կույր լինելուն։

Նոր տարբերակում ավելացվել են ռուսերեն խոսքի 5 նոր ձայնային տարբերակներ: Ներդրվել է ալբաներենի աջակցություն: Թարմացվել է ուկրաիներեն բառարանը: Էմոջիների արտասանության աջակցությունը ընդլայնվել է: Հարթակի հավելվածում շտկվել են սխալներ: Android, օգտատիրոջ բառարանների ներմուծումը պարզեցվել է, և ավելացվել է հարթակի աջակցությունը Android 11. Շարժիչի միջուկին ավելացվել են նոր կարգավորումներ և ֆունկցիոնալություն, այդ թվում՝ g2p.case, word_break և հավասարեցման ֆիլտրերի աջակցություն։

Հիշեցնենք, որ RHVoice-ն օգտագործում է HTS նախագծի մշակումները (HMM/DNN-ի վրա հիմնված Խոսքի սինթեզի համակարգ) և պարամետրային սինթեզի մեթոդը վիճակագրական մոդելներով (Statistical Parametric Synthesis based on HMM – Hidden Markov Model): Վիճակագրական մոդելի առավելությունը ցածր վերադիր ծախսերն են և պրոցեսորի անպահանջ հզորությունը: Բոլոր գործողությունները կատարվում են լոկալ՝ օգտագործողի համակարգում: Աջակցվում է խոսքի որակի երեք մակարդակ (որքան ցածր է որակը, այնքան բարձր է կատարումը և այնքան կարճ է արձագանքման ժամանակը):

Վիճակագրական մոդելի բացասական կողմը արտասանության համեմատաբար ցածր որակն է, որը չի հասնում սինթեզատորների այն մակարդակին, որոնք խոսք են ստեղծում բնական խոսքի հատվածների համակցության հիման վրա, բայց, այնուամենայնիվ, արդյունքը բավականին ընթեռնելի է և նման է բարձրախոսից ձայնագրության հեռարձակմանը: . Համեմատության համար նշենք, որ Silero նախագիծը, որն ապահովում է խոսքի բաց սինթեզի շարժիչ, որը հիմնված է մեքենայական ուսուցման տեխնոլոգիաների և ռուսաց լեզվի մոդելների մի շարքի վրա, որակով գերազանցում է RHVoice-ին:

Ռուսերենի համար հասանելի է 13 ձայնային տարբերակ, իսկ անգլերենի համար՝ 5։ Ձայները ձևավորվում են բնական խոսքի ձայնագրությունների հիման վրա։ Կարգավորումներում կարող եք փոխել արագությունը, ձայնի բարձրությունը և ձայնը: Sonic գրադարանը կարող է օգտագործվել տեմպը փոխելու համար: Մուտքային տեքստի վերլուծության հիման վրա հնարավոր է ավտոմատ կերպով հայտնաբերել և փոխել լեզուներ (օրինակ՝ մեկ այլ լեզվով բառերի և մեջբերումների համար կարող է օգտագործվել այդ լեզվի բնածին սինթեզի մոդելը): Ձայնային պրոֆիլները աջակցվում են՝ սահմանելով ձայների համակցություններ տարբեր լեզուների համար:

Source: opennet.ru

Գնեք հուսալի հոստինգ DDoS պաշտպանությամբ կայքերի, VPS VDS սերվերների համար 🔥 Գնեք հուսալի կայքերի հոսթինգ՝ DDoS պաշտպանությամբ, VPS VDS սերվերներով | ProHoster