Rangkaian saraf telah membawa kualiti sintesis pertuturan Rusia ke tahap yang baharu

Kumpulan syarikat MDG, sebahagian daripada ekosistem Sberbank, mengumumkan pembangunan platform sintesis pertuturan termaju, yang dikatakan memastikan bacaan lancar dan ekspresif bagi sebarang teks.

Penyelesaian yang dibentangkan ialah generasi ketiga sistem sintesis pertuturan. Isyarat audio berkualiti tinggi dijana oleh model rangkaian saraf yang kompleks. Pemaju mendakwa bahawa hasil daripada algoritma ini adalah sintesis paling realistik pertuturan bahasa Rusia.

Rangkaian saraf telah membawa kualiti sintesis pertuturan Rusia ke tahap yang baharu

Platform ini termasuk modul untuk meramal tekanan dalam perkataan yang belum ada dalam kamus asas. Di samping itu, pembetulan automatik kesilapan ejaan biasa disediakan. Terima kasih kepada analisis linguistik yang mendalam terhadap teks, sebutan akan sesuai dengan norma bahasa walaupun dalam kes yang sukar.

Satu lagi kelebihan platform ini ialah ia tidak memerlukan pelayan mahal yang dilengkapi dengan pemecut GPU. Anda boleh menggunakan teknologi dalam dua cara: melalui perkhidmatan awan atau dengan menyepadukannya ke dalam penyelesaian anda sendiri.


Rangkaian saraf telah membawa kualiti sintesis pertuturan Rusia ke tahap yang baharu

Antara bidang aplikasi pembangunan yang mungkin adalah chatbots dan pembantu suara, perkhidmatan maklumat dan pemberitahuan, perkhidmatan suara dengan sintesis segera sebarang teks semasa panggilan, dsb.

"Dalam senario komunikasi automatik dengan pelanggan, teknologi ini membolehkan anda berinteraksi secara individu dengan setiap pelanggan, kerana tiada mesej tetap, dan sebarang teks boleh disintesis semasa panggilan," kata pembangun.

Anda boleh mencuba teknologinya di sini



Sumber: 3dnews.ru

Tambah komen