Neuronske mreže dovele su kvalitetu sinteze ruskog govora na novu razinu

Grupa kompanija MDG, dio ekosustava Sberbank, najavila je razvoj napredne platforme za sintezu govora, za koju se kaže da osigurava glatko i izražajno čitanje bilo kojeg teksta.

Prikazano rješenje je treća generacija sustava za sintezu govora. Visokokvalitetni audio signali generiraju se pomoću složenih modela neuronskih mreža. Programeri tvrde da je rezultat ovih algoritama najrealnija sinteza govora na ruskom jeziku.

Neuronske mreže dovele su kvalitetu sinteze ruskog govora na novu razinu

Platforma uključuje modul za predviđanje naglaska u riječima koje još nisu u osnovnom rječniku. Osim toga, omogućeno je automatsko ispravljanje uobičajenih pravopisnih pogrešaka. Zahvaljujući dubokoj lingvističkoj analizi teksta, izgovor će odgovarati normama jezika čak iu teškim slučajevima.

Još jedna prednost platforme je što ne zahtijeva skupe poslužitelje opremljene GPU akceleratorima. Tehnologiju možete koristiti na dva načina: putem usluge u oblaku ili integracijom u vlastito rješenje.


Neuronske mreže dovele su kvalitetu sinteze ruskog govora na novu razinu

Među mogućim područjima primjene razvoja su chatbotovi i glasovni pomoćnici, usluge informacija i obavijesti, glasovne usluge s trenutnom sintezom bilo kojeg teksta tijekom poziva itd.

"U automatiziranim scenarijima komunikacije s klijentima, tehnologija vam omogućuje individualnu interakciju sa svakim pretplatnikom, budući da nema fiksnih poruka, a bilo koji tekst može se sintetizirati tijekom poziva", kažu programeri.

Možete isprobati tehnologiju здесь



Izvor: 3dnews.ru

Dodajte komentar