Neuroverkot ovat nostaneet venäläisen puhesynteesin laadun uudelle tasolle

Sberbankin ekosysteemiin kuuluva MDG-yritysryhmä ilmoitti kehittävänsä edistyneen puhesynteesialustan, jonka sanotaan varmistavan minkä tahansa tekstin sujuvan ja ilmeikäs lukemisen.

Esitetty ratkaisu on puhesynteesijärjestelmän kolmas sukupolvi. Monimutkaiset hermoverkkomallit tuottavat korkealaatuisia äänisignaaleja. Kehittäjät väittävät, että näiden algoritmien tulos on venäjänkielisen puheen realistisin synteesi.

Neuroverkot ovat nostaneet venäläisen puhesynteesin laadun uudelle tasolle

Alusta sisältää moduulin stressin ennustamiseen sanoissa, joita ei vielä ole perussanakirjassa. Lisäksi tarjolla on automaattinen yleisten kirjoitusvirheiden korjaus. Tekstin syvällisen kielellisen analyysin ansiosta ääntäminen vastaa kielen normeja vaikeissakin tapauksissa.

Toinen alustan etu on, että se ei vaadi kalliita GPU-kiihdyttimillä varustettuja palvelimia. Voit käyttää teknologiaa kahdella tavalla: pilvipalvelun kautta tai integroimalla se omaan ratkaisuusi.


Neuroverkot ovat nostaneet venäläisen puhesynteesin laadun uudelle tasolle

Kehityksen mahdollisia sovellusalueita ovat chatbotit ja puheavustajat, tieto- ja ilmoituspalvelut, puhepalvelut, joissa puhelun aikana syntetisoidaan mitä tahansa tekstiä, jne.

"Automaattisissa skenaarioissa viestinnässä asiakkaiden kanssa teknologia mahdollistaa yksilöllisen vuorovaikutuksen jokaisen tilaajan kanssa, koska kiinteitä viestejä ei ole ja mikä tahansa teksti voidaan syntetisoida puhelun aikana", kehittäjät sanovat.

Voit kokeilla tekniikkaa täällä



Lähde: 3dnews.ru

Lisää kommentti