Neironu tīkli ir pacēluši krievu runas sintēzes kvalitāti jaunā līmenī

Tūkstošgades attīstības mērķu uzņēmumu grupa, kas ir daļa no Sberbank ekosistēmas, paziņoja par progresīvas runas sintēzes platformas izstrādi, kas it kā nodrošina vienmērīgu un izteiksmīgu jebkura teksta lasīšanu.

Piedāvātais risinājums ir runas sintēzes sistēmas trešā paaudze. Augstas kvalitātes audio signālus ģenerē sarežģīti neironu tīklu modeļi. Izstrādātāji apgalvo, ka šo algoritmu rezultāts ir visreālākā krievu valodas runas sintēze.

Neironu tīkli ir pacēluši krievu runas sintēzes kvalitāti jaunā līmenī

Platformā ir iekļauts modulis stresa prognozēšanai vārdos, kas vēl nav iekļauti pamata vārdnīcā. Turklāt tiek nodrošināta automātiska bieži sastopamo pareizrakstības kļūdu labošana. Pateicoties dziļai teksta lingvistiskajai analīzei, izruna atbildīs valodas normām pat sarežģītos gadījumos.

Vēl viena platformas priekšrocība ir tā, ka tai nav nepieciešami dārgi serveri, kas aprīkoti ar GPU paātrinātājiem. Tehnoloģiju var izmantot divos veidos: izmantojot mākoņpakalpojumu vai integrējot to savā risinājumā.


Neironu tīkli ir pacēluši krievu runas sintēzes kvalitāti jaunā līmenī

Starp iespējamām izstrādes pielietojuma jomām ir tērzēšanas roboti un balss palīgi, informācijas un paziņojumu pakalpojumi, balss pakalpojumi ar tūlītēju jebkura teksta sintēzi sarunas laikā utt.

“Automatizētos saziņas ar klientiem scenārijos tehnoloģija ļauj individuāli mijiedarboties ar katru abonentu, jo nav fiksētu ziņojumu un zvana laikā var sintezēt jebkuru tekstu,” saka izstrādātāji.

Jūs varat izmēģināt tehnoloģiju šeit



Avots: 3dnews.ru

Pievieno komentāru