Google ได้เปิดแหล่งที่มาที่ขาดหายไปสำหรับตัวแปลงสัญญาณเสียง Lyra

Google ได้เผยแพร่การอัปเดตตัวแปลงสัญญาณเสียง Lyra 0.0.2 ซึ่งได้รับการปรับให้เหมาะสมเพื่อให้ได้คุณภาพเสียงสูงสุดเมื่อใช้ช่องทางการสื่อสารที่ช้ามาก ตัวแปลงสัญญาณถูกเปิดเมื่อต้นเดือนเมษายน แต่ได้รับการจัดเตรียมร่วมกับห้องสมุดคณิตศาสตร์ที่เป็นกรรมสิทธิ์ ในเวอร์ชัน 0.0.2 ข้อเสียเปรียบนี้ได้ถูกกำจัดไปแล้วและมีการสร้างการแทนที่แบบเปิดสำหรับไลบรารีที่ระบุ - sparse_matmul ซึ่งเหมือนกับตัวแปลงสัญญาณเองที่เผยแพร่ภายใต้ลิขสิทธิ์ Apache 2.0 การปรับปรุงอื่นๆ ได้แก่ ความสามารถในการใช้ระบบ Bazel build กับคอมไพเลอร์ GCC และการใช้บันเดิลนี้เป็นค่าเริ่มต้นใน Linux แทน Bazel+Clang

ให้เราระลึกว่าในแง่ของคุณภาพของข้อมูลเสียงที่ส่งด้วยความเร็วต่ำ Lyra นั้นเหนือกว่าตัวแปลงสัญญาณแบบดั้งเดิมที่ใช้วิธีการประมวลผลสัญญาณดิจิทัลอย่างมาก เพื่อให้ได้การส่งสัญญาณเสียงคุณภาพสูงในเงื่อนไขของข้อมูลที่ส่งในจำนวนจำกัด นอกเหนือจากวิธีการบีบอัดเสียงและการแปลงสัญญาณแบบเดิม Lyra ใช้โมเดลเสียงพูดตามระบบการเรียนรู้ของเครื่อง ซึ่งช่วยให้คุณสร้างข้อมูลที่ขาดหายไปขึ้นมาใหม่ตาม ลักษณะการพูดทั่วไป โมเดลที่ใช้สร้างเสียงได้รับการฝึกฝนโดยใช้การบันทึกเสียงหลายพันชั่วโมงในกว่า 70 ภาษา ประสิทธิภาพของการดำเนินการที่นำเสนอนั้นเพียงพอสำหรับการเข้ารหัสและถอดรหัสคำพูดแบบเรียลไทม์บนสมาร์ทโฟนราคากลาง โดยมีความล่าช้าในการส่งสัญญาณ 90 มิลลิวินาที

ที่มา: opennet.ru

เพิ่มความคิดเห็น