Närvivõrgud on viinud venekeelse kõnesünteesi kvaliteedi uuele tasemele

Sberbanki ökosüsteemi kuuluv MDG ettevõtete grupp teatas täiustatud kõnesünteesiplatvormi väljatöötamisest, mis väidetavalt tagab mis tahes teksti sujuva ja väljendusrikka lugemise.

Esitatud lahendus on kõnesünteesisüsteemi kolmas põlvkond. Kvaliteetseid helisignaale genereerivad keerukad närvivõrgu mudelid. Arendajad väidavad, et nende algoritmide tulemus on venekeelse kõne kõige realistlikum süntees.

Närvivõrgud on viinud venekeelse kõnesünteesi kvaliteedi uuele tasemele

Platvorm sisaldab moodulit stressi ennustamiseks sõnades, mida veel baassõnaraamatus pole. Lisaks pakutakse tavaliste õigekirjavigade automaatset parandamist. Tänu teksti sügavale keelelisele analüüsile vastab hääldus ka rasketel juhtudel keelenormidele.

Platvormi eeliseks on ka see, et see ei nõua kalleid GPU kiirenditega varustatud servereid. Tehnoloogiat saab kasutada kahel viisil: läbi pilveteenuse või integreerides selle enda lahendusse.


Närvivõrgud on viinud venekeelse kõnesünteesi kvaliteedi uuele tasemele

Arenduse võimalike rakendusvaldkondade hulgas on vestlusrobotid ja hääleassistendid, info- ja teavitusteenused, kõneteenused, mis kõne ajal mis tahes teksti kohe sünteesivad jne.

"Klientidega suhtlemise automatiseeritud stsenaariumide korral võimaldab tehnoloogia iga abonendiga individuaalselt suhelda, kuna fikseeritud sõnumeid pole ja kõne ajal saab sünteesida mis tahes teksti," ütlevad arendajad.

Võite tehnoloogiat proovida siin



Allikas: 3dnews.ru

Lisa kommentaar