Google เผยแพร่ข้อมูลและโมเดลการเรียนรู้ของเครื่องเพื่อแยกเสียง

Google การตีพิมพ์ ฐานข้อมูลที่มีคำอธิบายประกอบของเสียงมิกซ์อ้างอิงที่สามารถใช้ในระบบการเรียนรู้ของเครื่องที่ใช้ในการแยกเสียงมิกซ์ตามอำเภอใจออกเป็นแต่ละองค์ประกอบ โมเดลการเรียนรู้ของเครื่องเชิงลึกทั่วไป (TDCN++) ได้รับการเผยแพร่ซึ่งสามารถใช้ใน Tensorflow เพื่อแยกเสียงได้ ข้อมูลที่จัดทำขึ้นตามการรวบรวม ฟรีซาวด์.org и ที่ตีพิมพ์ ได้รับอนุญาตภายใต้ CC BY 4.0

โครงการที่นำเสนอ FUSS (การแยกเสียงสากลฟรี) มีวัตถุประสงค์เพื่อแก้ไขปัญหาการแยกเสียงตามอำเภอใจจำนวนเท่าใดก็ได้ซึ่งไม่ทราบลักษณะของเสียงล่วงหน้า โดยทั่วไประบบอื่นๆ ที่คล้ายคลึงกันมักจำกัดอยู่ที่งานในการแยกแยะระหว่างเสียงบางอย่าง เช่น เสียงและไม่มีเสียง หรือคำพูดของบุคคลอื่น

ฐานข้อมูลมีการผสมประมาณ 20 รายการ ชุดนี้ยังรวมถึงการตอบสนองแรงกระตุ้นของห้องที่คำนวณไว้ล่วงหน้าโดยใช้เครื่องจำลองห้องที่สร้างขึ้นเอง ซึ่งคำนึงถึงการสะท้อนของผนัง ตำแหน่งแหล่งกำเนิดเสียง และตำแหน่งไมโครโฟน

ที่มา: opennet.ru

เพิ่มความคิดเห็น