โครงข่ายประสาทเทียมได้ยกระดับคุณภาพการสังเคราะห์เสียงพูดภาษารัสเซียขึ้นไปอีกระดับ

กลุ่มบริษัท MDG ซึ่งเป็นส่วนหนึ่งของระบบนิเวศของ Sberbank ได้ประกาศการพัฒนาแพลตฟอร์มการสังเคราะห์เสียงพูดขั้นสูง ซึ่งกล่าวกันว่าเพื่อให้แน่ใจว่าการอ่านข้อความใดๆ จะราบรื่นและสื่ออารมณ์ได้

แนวทางแก้ไขที่นำเสนอคือระบบสังเคราะห์เสียงพูดรุ่นที่สาม สัญญาณเสียงคุณภาพสูงถูกสร้างขึ้นโดยโมเดลโครงข่ายประสาทเทียมที่ซับซ้อน นักพัฒนาอ้างว่าผลลัพธ์ของอัลกอริธึมเหล่านี้คือการสังเคราะห์คำพูดภาษารัสเซียที่สมจริงที่สุด

โครงข่ายประสาทเทียมได้ยกระดับคุณภาพการสังเคราะห์เสียงพูดภาษารัสเซียขึ้นไปอีกระดับ

แพลตฟอร์มนี้มีโมดูลสำหรับทำนายความเครียดด้วยคำที่ยังไม่มีอยู่ในพจนานุกรมพื้นฐาน นอกจากนี้ยังมีการแก้ไขข้อผิดพลาดในการสะกดทั่วไปโดยอัตโนมัติ ด้วยการวิเคราะห์ภาษาเชิงลึกของข้อความ การออกเสียงจะสอดคล้องกับบรรทัดฐานของภาษาแม้ในกรณีที่ยากลำบาก

ข้อดีอีกประการของแพลตฟอร์มนี้คือไม่ต้องใช้เซิร์ฟเวอร์ราคาแพงที่ติดตั้งตัวเร่งความเร็ว GPU คุณสามารถใช้เทคโนโลยีได้สองวิธี: ผ่านบริการคลาวด์หรือโดยการรวมเข้ากับโซลูชันของคุณเอง


โครงข่ายประสาทเทียมได้ยกระดับคุณภาพการสังเคราะห์เสียงพูดภาษารัสเซียขึ้นไปอีกระดับ

แอปพลิเคชันการพัฒนาที่เป็นไปได้ ได้แก่ แชทบอทและผู้ช่วยเสียง บริการข้อมูลและการแจ้งเตือน บริการเสียงที่มีการสังเคราะห์ข้อความทันทีระหว่างการโทร ฯลฯ

“ในสถานการณ์การสื่อสารอัตโนมัติกับลูกค้า เทคโนโลยีนี้ช่วยให้คุณโต้ตอบกับสมาชิกแต่ละคนได้เป็นรายบุคคล เนื่องจากไม่มีข้อความคงที่ และสามารถสังเคราะห์ข้อความใดๆ ได้ระหว่างการโทร” นักพัฒนากล่าว

คุณสามารถลองใช้เทคโนโลยี ที่นี่



ที่มา: 3dnews.ru

เพิ่มความคิดเห็น