การเปิดตัวเครื่องสังเคราะห์เสียงพูด RHVoice 1.2.4 พัฒนาขึ้นสำหรับภาษารัสเซีย

การเปิดตัวระบบสังเคราะห์เสียงพูดแบบเปิด RHVoice 1.2.4 ได้รับการเผยแพร่แล้ว โดยเริ่มแรกพัฒนาขึ้นเพื่อให้การสนับสนุนคุณภาพสูงสำหรับภาษารัสเซีย แต่ต่อมาได้ปรับให้เข้ากับภาษาอื่นๆ เช่น อังกฤษ โปรตุเกส ยูเครน คีร์กีซ ตาตาร์ และจอร์เจีย รหัสนี้เขียนด้วยภาษา C++ และเผยแพร่ภายใต้ลิขสิทธิ์ LGPL 2.1 รองรับการทำงานบน GNU/Linux, Windows และ Android โปรแกรมนี้เข้ากันได้กับอินเทอร์เฟซ TTS (ข้อความเป็นคำพูด) มาตรฐานสำหรับการแปลงข้อความเป็นคำพูด: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) และ API การแปลงข้อความเป็นคำพูดของ Android แต่ยังสามารถใช้ใน NVDA ได้ด้วย โปรแกรมอ่านหน้าจอ

โปรแกรมใช้วิธีการสังเคราะห์พาราเมตริกกับแบบจำลองทางสถิติ (การสังเคราะห์พาราเมตริกทางสถิติตาม HMM - โมเดล Markov ที่ซ่อนอยู่) ข้อดีของแบบจำลองทางสถิติคือต้นทุนค่าโสหุ้ยต่ำและกำลัง CPU ที่ไม่ต้องการมาก การดำเนินการทั้งหมดจะดำเนินการภายในระบบของผู้ใช้ รองรับคุณภาพคำพูดสามระดับ (ยิ่งคุณภาพต่ำ ประสิทธิภาพก็จะยิ่งสูงขึ้น และเวลาตอบสนองก็จะสั้นลง)

รองรับการตั้งค่าและเปลี่ยนเสียง มีตัวเลือกเสียงให้เลือก 9 แบบสำหรับภาษารัสเซีย และ 5 แบบสำหรับภาษาอังกฤษ เสียงถูกสร้างขึ้นจากการบันทึกเสียงพูดที่เป็นธรรมชาติ เนื่องจากการใช้แบบจำลองทางสถิติ คุณภาพการออกเสียงจึงไม่ถึงระดับของการสังเคราะห์เสียงที่สร้างคำพูดโดยอาศัยการผสมผสานของส่วนของคำพูดที่เป็นธรรมชาติ แต่อย่างไรก็ตามผลลัพธ์ที่ได้ก็ค่อนข้างเข้าใจได้และคล้ายกับการถ่ายทอดการบันทึกจากลำโพง .

ในการตั้งค่า คุณสามารถเปลี่ยนความเร็ว ระดับเสียง และระดับเสียงได้ ไลบรารี Sonic สามารถใช้เพื่อเปลี่ยนจังหวะได้ เป็นไปได้ที่จะตรวจจับและสลับภาษาโดยอัตโนมัติตามการวิเคราะห์ข้อความที่ป้อน (เช่น สำหรับคำและเครื่องหมายคำพูดในภาษาอื่น สามารถใช้แบบจำลองการสังเคราะห์ที่เป็นของภาษานั้นได้) รองรับโปรไฟล์เสียง โดยกำหนดการผสมเสียงสำหรับภาษาต่างๆ

ที่มา: opennet.ru

เพิ่มความคิดเห็น