Tūkstošgades attīstības mērķu uzņēmumu grupa, kas ir daļa no Sberbank ekosistēmas, paziņoja par progresīvas runas sintēzes platformas izstrādi, kas it kā nodrošina vienmērīgu un izteiksmīgu jebkura teksta lasīšanu.
Piedāvātais risinājums ir runas sintēzes sistēmas trešā paaudze. Augstas kvalitātes audio signālus ģenerē sarežģīti neironu tīklu modeļi. Izstrādātāji apgalvo, ka šo algoritmu rezultāts ir visreālākā krievu valodas runas sintēze.
Platformā ir iekļauts modulis stresa prognozēšanai vārdos, kas vēl nav iekļauti pamata vārdnīcā. Turklāt tiek nodrošināta automātiska bieži sastopamo pareizrakstības kļūdu labošana. Pateicoties dziļai teksta lingvistiskajai analīzei, izruna atbildīs valodas normām pat sarežģītos gadījumos.
Vēl viena platformas priekšrocība ir tā, ka tai nav nepieciešami dārgi serveri, kas aprīkoti ar GPU paātrinātājiem. Tehnoloģiju var izmantot divos veidos: izmantojot mākoņpakalpojumu vai integrējot to savā risinājumā.
Starp iespējamām izstrādes pielietojuma jomām ir tērzēšanas roboti un balss palīgi, informācijas un paziņojumu pakalpojumi, balss pakalpojumi ar tūlītēju jebkura teksta sintēzi sarunas laikā utt.
“Automatizētos saziņas ar klientiem scenārijos tehnoloģija ļauj individuāli mijiedarboties ar katru abonentu, jo nav fiksētu ziņojumu un zvana laikā var sintezēt jebkuru tekstu,” saka izstrādātāji.
Jūs varat izmēģināt tehnoloģiju
Avots: 3dnews.ru