Nevronske mreže so dvignile kakovost sinteze ruskega govora na novo raven

Skupina podjetij MDG, del ekosistema Sberbank, je napovedala razvoj napredne platforme za sintezo govora, ki naj bi zagotavljala gladko in ekspresivno branje katerega koli besedila.

Predstavljena rešitev je tretja generacija sistema za sintezo govora. Visokokakovostne zvočne signale generirajo kompleksni modeli nevronske mreže. Razvijalci trdijo, da je rezultat teh algoritmov najbolj realistična sinteza govora v ruskem jeziku.

Nevronske mreže so dvignile kakovost sinteze ruskega govora na novo raven

Platforma vključuje modul za napovedovanje naglasa v besedah, ki še niso v osnovnem slovarju. Poleg tega je zagotovljeno samodejno popravljanje pogostih črkovalnih napak. Zahvaljujoč globoki jezikovni analizi besedila bo izgovorjava ustrezala normam jezika tudi v težkih primerih.

Druga prednost platforme je, da ne potrebuje dragih strežnikov, opremljenih z GPU pospeševalniki. Tehnologijo lahko uporabljate na dva načina: prek storitve v oblaku ali z integracijo v lastno rešitev.


Nevronske mreže so dvignile kakovost sinteze ruskega govora na novo raven

Med možnimi področji uporabe razvoja so chatboti in glasovni pomočniki, storitve obveščanja in obveščanja, glasovne storitve s takojšnjo sintezo katerega koli besedila med klicem itd.

"V avtomatiziranih scenarijih komunikacije s strankami vam tehnologija omogoča individualno interakcijo z vsakim naročnikom, saj ni fiksnih sporočil in med klicem je mogoče sintetizirati katero koli besedilo," pravijo razvijalci.

Lahko preizkusite tehnologijo tukaj



Vir: 3dnews.ru

Dodaj komentar