Lyra 1.3 อัพเดตตัวแปลงสัญญาณเสียงแบบเปิด

Google ได้เผยแพร่การเปิดตัวตัวแปลงสัญญาณเสียง Lyra 1.3 ซึ่งมุ่งเป้าไปที่การรับส่งข้อมูลเสียงคุณภาพสูงภายใต้เงื่อนไขของข้อมูลที่ส่งในจำนวนจำกัด คุณภาพเสียงพูดที่บิตเรต 3.2 kbps, 6 kbps และ 9.2 kbps เมื่อใช้ Lyra codec จะเทียบเท่ากับบิตเรต 10 kbps, 13 kbps และ 14 kbps โดยประมาณเมื่อใช้ Opus codec เพื่อแก้ไขปัญหานี้ นอกเหนือจากวิธีการบีบอัดเสียงและการแปลงสัญญาณแบบเดิมๆ แล้ว Lyra ยังใช้โมเดลเสียงพูดตามระบบการเรียนรู้ของเครื่อง ซึ่งช่วยให้คุณสร้างข้อมูลที่ขาดหายไปขึ้นใหม่ตามลักษณะเสียงพูดทั่วไป การใช้งานโค้ดอ้างอิงเขียนด้วยภาษา C++ และเผยแพร่ภายใต้ลิขสิทธิ์ Apache 2.0

แตกต่างจากการเปิดตัว Lyra 1.2 ที่ออกแบบใหม่อย่างสิ้นเชิงซึ่งเสนอในเดือนตุลาคม ซึ่งแปลเป็นสถาปัตยกรรมโครงข่ายประสาทเทียมใหม่ เวอร์ชัน 1.3 ปรับโมเดลการเรียนรู้ของเครื่องให้เหมาะสมโดยไม่มีการเปลี่ยนแปลงทางสถาปัตยกรรม เวอร์ชันใหม่ใช้จำนวนเต็ม 32 บิตแทนตัวเลขทศนิยม 8 บิตเพื่อเก็บน้ำหนักและดำเนินการทางคณิตศาสตร์ ส่งผลให้ขนาดโมเดลลดลง 43% และเร็วขึ้น 20% เมื่อทดสอบบนสมาร์ทโฟน Pixel 6 Pro คุณภาพเสียงพูดยังคงอยู่ที่ระดับเดิม แต่รูปแบบของข้อมูลที่ส่งมีการเปลี่ยนแปลงและเข้ากันไม่ได้กับรุ่นก่อนหน้า

ที่มา: opennet.ru

เพิ่มความคิดเห็น