Neuronske mreže su dovele kvalitet sinteze ruskog govora na novi nivo

Grupa kompanija MDG, dio ekosistema Sberbanke, najavila je razvoj napredne platforme za sintezu govora, za koju se kaže da osigurava glatko i izražajno čitanje bilo kojeg teksta.

Predstavljeno rješenje je treća generacija sistema za sintezu govora. Visokokvalitetni audio signali se generiraju pomoću složenih modela neuronske mreže. Programeri tvrde da je rezultat ovih algoritama najrealnija sinteza govora na ruskom jeziku.

Neuronske mreže su dovele kvalitet sinteze ruskog govora na novi nivo

Platforma uključuje modul za predviđanje naglaska u riječima koje još nisu u osnovnom rječniku. Osim toga, omogućeno je automatsko ispravljanje uobičajenih pravopisnih grešaka. Zahvaljujući dubokoj lingvističkoj analizi teksta, izgovor će odgovarati normama jezika čak i u teškim slučajevima.

Još jedna prednost platforme je da ne zahtijeva skupe servere opremljene GPU akceleratorima. Tehnologiju možete koristiti na dva načina: putem usluge u oblaku ili integracijom u vlastito rješenje.


Neuronske mreže su dovele kvalitet sinteze ruskog govora na novi nivo

Među mogućim područjima primjene razvoja su chatbotovi i glasovni asistenti, servisi informacija i obavještavanja, glasovni servisi sa trenutnom sintezom bilo kojeg teksta tokom poziva itd.

„U automatizovanim scenarijima komunikacije sa klijentima, tehnologija vam omogućava individualnu interakciju sa svakim pretplatnikom, budući da nema fiksnih poruka, a bilo koji tekst se može sintetizirati tokom poziva“, kažu programeri.

Možete isprobati tehnologiju ovdje



izvor: 3dnews.ru

Dodajte komentar