Rețelele neuronale au adus calitatea sintezei vorbirii rusești la un nou nivel

Grupul de companii MDG, parte a ecosistemului Sberbank, a anunțat dezvoltarea unei platforme avansate de sinteză a vorbirii, despre care se spune că asigură o citire lină și expresivă a oricărui text.

Soluția prezentată este a treia generație a sistemului de sinteză a vorbirii. Semnalele audio de înaltă calitate sunt generate de modele complexe de rețele neuronale. Dezvoltatorii susțin că rezultatul acestor algoritmi este cea mai realistă sinteză a vorbirii în limba rusă.

Rețelele neuronale au adus calitatea sintezei vorbirii rusești la un nou nivel

Platforma include un modul pentru prezicerea stresului în cuvinte care nu sunt încă în dicționarul de bază. În plus, este oferită corectarea automată a erorilor de ortografie comune. Datorită analizei lingvistice profunde a textului, pronunția va corespunde normelor limbii chiar și în cazuri dificile.

Un alt avantaj al platformei este că nu necesită servere scumpe echipate cu acceleratoare GPU. Puteți utiliza tehnologia în două moduri: printr-un serviciu cloud sau integrându-l în propria soluție.


Rețelele neuronale au adus calitatea sintezei vorbirii rusești la un nou nivel

Printre posibilele domenii de aplicare ale dezvoltării se numără chatboții și asistenții vocali, serviciile de informare și notificare, serviciile de voce cu sinteza instantanee a oricărui text în timpul unui apel etc.

„În scenariile automatizate de comunicare cu clienții, tehnologia vă permite să interacționați individual cu fiecare abonat, deoarece nu există mesaje fixe, iar orice text poate fi sintetizat în timpul apelului”, spun dezvoltatorii.

Puteți încerca tehnologia aici



Sursa: 3dnews.ru

Adauga un comentariu