Jaringan saraf telah membawa kualitas sintesis ucapan Rusia ke tingkat yang baru

Grup perusahaan MDG, bagian dari ekosistem Sberbank, mengumumkan pengembangan platform sintesis ucapan tingkat lanjut, yang dikatakan dapat memastikan pembacaan teks apa pun dengan lancar dan ekspresif.

Solusi yang disajikan adalah sistem sintesis ucapan generasi ketiga. Sinyal audio berkualitas tinggi dihasilkan oleh model jaringan saraf yang kompleks. Pengembang mengklaim bahwa hasil dari algoritme ini adalah sintesis ucapan berbahasa Rusia yang paling realistis.

Jaringan saraf telah membawa kualitas sintesis ucapan Rusia ke tingkat yang baru

Platform ini menyertakan modul untuk memprediksi tekanan pada kata-kata yang belum ada dalam kamus dasar. Selain itu, koreksi otomatis atas kesalahan ejaan umum juga disediakan. Berkat analisis linguistik yang mendalam terhadap teks, pengucapan akan sesuai dengan norma-norma bahasa bahkan dalam kasus-kasus sulit.

Keunggulan lain dari platform ini adalah tidak memerlukan server mahal yang dilengkapi akselerator GPU. Anda dapat menggunakan teknologi ini dengan dua cara: melalui layanan cloud atau dengan mengintegrasikannya ke dalam solusi Anda sendiri.


Jaringan saraf telah membawa kualitas sintesis ucapan Rusia ke tingkat yang baru

Di antara kemungkinan penerapan pengembangan ini adalah chatbots dan asisten suara, layanan informasi dan notifikasi, layanan suara dengan sintesis instan teks apa pun selama panggilan, dll.

β€œDalam skenario komunikasi otomatis dengan klien, teknologi ini memungkinkan Anda untuk berinteraksi secara individual dengan setiap pelanggan, karena tidak ada pesan tetap, dan teks apa pun dapat disintesis selama panggilan,” kata para pengembang.

Anda bisa mencoba teknologinya di sini



Sumber: 3dnews.ru

Tambah komentar