Neurónové siete posunuli kvalitu syntézy ruskej reči na novú úroveň

Skupina spoločností MDG, ktorá je súčasťou ekosystému Sberbank, oznámila vývoj pokročilej platformy syntézy reči, ktorá má zabezpečiť plynulé a výrazné čítanie akéhokoľvek textu.

Prezentované riešenie je treťou generáciou systému syntézy reči. Vysokokvalitné audio signály sú generované komplexnými modelmi neurónových sietí. Vývojári tvrdia, že výsledkom týchto algoritmov je najrealistickejšia syntéza reči v ruskom jazyku.

Neurónové siete posunuli kvalitu syntézy ruskej reči na novú úroveň

Platforma obsahuje modul na predpovedanie stresu v slovách, ktoré ešte nie sú v základnom slovníku. Okrem toho je k dispozícii automatická oprava bežných pravopisných chýb. Vďaka hĺbkovej lingvistickej analýze textu bude výslovnosť zodpovedať normám jazyka aj v zložitých prípadoch.

Ďalšou výhodou platformy je, že nevyžaduje drahé servery vybavené GPU akcelerátormi. Technológiu môžete využívať dvoma spôsobmi: prostredníctvom cloudovej služby alebo integráciou do vlastného riešenia.


Neurónové siete posunuli kvalitu syntézy ruskej reči na novú úroveň

Medzi možné oblasti uplatnenia vývoja patria chatboti a hlasoví asistenti, informačné a notifikačné služby, hlasové služby s okamžitou syntézou akéhokoľvek textu počas hovoru atď.

„V automatizovaných scenároch komunikácie s klientmi vám technológia umožňuje individuálnu interakciu s každým účastníkom, pretože neexistujú žiadne pevné správy a počas hovoru je možné syntetizovať akýkoľvek text,“ hovoria vývojári.

Technológiu si môžete vyskúšať tu



Zdroj: 3dnews.ru

Pridať komentár