Neurale netwurken hawwe de kwaliteit fan Russyske spraaksynteze nei in nij nivo brocht

De MDG-groep fan bedriuwen, diel fan it Sberbank-ekosysteem, kundige de ûntwikkeling fan in avansearre spraaksyntezeplatfoarm oan, dat wurdt sein om glêd en ekspressive lêzen fan elke tekst te garandearjen.

De presintearre oplossing is de tredde generaasje fan it spraaksyntezesysteem. Audiosinjalen fan hege kwaliteit wurde generearre troch komplekse neurale netwurkmodellen. De ûntwikkelders beweare dat it resultaat fan dizze algoritmen de meast realistyske synteze is fan Russysktalige spraak.

Neurale netwurken hawwe de kwaliteit fan Russyske spraaksynteze nei in nij nivo brocht

It platfoarm omfettet in module foar it foarsizzen fan stress yn wurden dy't noch net yn it basiswurdboek steane. Dêrneist wurdt automatyske korreksje fan mienskiplike staveringsflaters foarsjoen. Troch djippe taalkundige analyze fan 'e tekst sil de útspraak ek yn drege gefallen oerienkomme mei de noarmen fan' e taal.

In oar foardiel fan it platfoarm is dat it gjin djoere servers nedich is foarsjoen fan GPU-versnellers. Jo kinne de technology op twa manieren brûke: fia in wolktsjinst of troch it te yntegrearjen yn jo eigen oplossing.


Neurale netwurken hawwe de kwaliteit fan Russyske spraaksynteze nei in nij nivo brocht

Under de mooglike gebieten fan tapassing fan 'e ûntwikkeling binne chatbots en stimassistenten, ynformaasje- en notifikaasjetsjinsten, stimtsjinsten mei direkte synteze fan elke tekst tidens in oprop, ensfh.

"Yn automatisearre senario's fan kommunikaasje mei kliïnten lit de technology jo yndividueel ynteraksje mei elke abonnee, om't d'r gjin fêste berjochten binne, en elke tekst kin synthesisearre wurde tidens de oprop," sizze de ûntwikkelders.

Jo kinne de technology besykje hjir



Boarne: 3dnews.ru

Add a comment