Neurale netwerke het die kwaliteit van Russiese spraaksintese na 'n nuwe vlak gebring

Die MDG-groep van maatskappye, deel van die Sberbank-ekosisteem, het die ontwikkeling van 'n gevorderde spraaksintese-platform aangekondig, wat na bewering gladde en ekspressiewe lees van enige teks verseker.

Die voorgestelde oplossing is die derde generasie van die spraaksintesestelsel. Hoë kwaliteit klank seine word gegenereer deur komplekse neurale netwerk modelle. Die ontwikkelaars beweer dat die resultaat van hierdie algoritmes die mees realistiese sintese van Russiese taalspraak is.

Neurale netwerke het die kwaliteit van Russiese spraaksintese na 'n nuwe vlak gebring

Die platform sluit 'n module in om stres te voorspel in woorde wat nog nie in die basiswoordeboek is nie. Daarbenewens word outomatiese regstelling van algemene spelfoute verskaf. Danksy diep linguistiese ontleding van die teks sal uitspraak selfs in moeilike gevalle ooreenstem met die norme van die taal.

Nog 'n voordeel van die platform is dat dit nie duur bedieners benodig wat toegerus is met GPU-versnellers nie. Jy kan die tegnologie op twee maniere gebruik: deur 'n wolkdiens of deur dit in jou eie oplossing te integreer.


Neurale netwerke het die kwaliteit van Russiese spraaksintese na 'n nuwe vlak gebring

Onder die moontlike toepassingsareas van die ontwikkeling is kletsbotte en stemassistente, inligtings- en kennisgewingdienste, stemdienste met onmiddellike sintese van enige teks tydens 'n oproep, ens.

"In outomatiese scenario's van kommunikasie met kliënte, laat die tegnologie jou toe om individueel met elke intekenaar te kommunikeer, aangesien daar geen vaste boodskappe is nie, en enige teks kan gesintetiseer word tydens die oproep," sê die ontwikkelaars.

Jy kan die tegnologie probeer hier



Bron: 3dnews.ru

Voeg 'n opmerking