อัพเดต Mozilla Common Voice 12.0

Mozilla ได้อัปเดตชุดข้อมูล Common Voice เพื่อรวมตัวอย่างการออกเสียงจากผู้คนมากกว่า 200 คน ข้อมูลถูกเผยแพร่เป็นสาธารณสมบัติ (CC0) ชุดที่นำเสนอสามารถใช้ในระบบการเรียนรู้ของเครื่องเพื่อสร้างแบบจำลองการรู้จำเสียงและการสังเคราะห์เสียง

เมื่อเทียบกับการอัปเดตครั้งก่อน ปริมาณคำพูดในคอลเลกชันเพิ่มขึ้นจาก 23.8 เป็น 25.8 พันชั่วโมงในการพูด มีผู้คนมากกว่า 88 คนมีส่วนร่วมในการเตรียมสื่อภาษาอังกฤษโดยใช้เวลาพูด 3161 ชั่วโมง (มีผู้เข้าร่วม 84 คนและ 3098 ชั่วโมง) ชุดภาษาเบลารุสครอบคลุมผู้เข้าร่วม 7903 คนและสื่อการพูด 1419 ชั่วโมง (มีผู้เข้าร่วม 6965 คนและ 1217 ชั่วโมง) รัสเซีย - ผู้เข้าร่วม 2815 คนและ 229 ชั่วโมง (มีผู้เข้าร่วม 2731 คนและ 215 ชั่วโมง) อุซเบก - ผู้เข้าร่วม 2092 คนและ 262 ชั่วโมง ( มีผู้เข้าร่วม 2025 คนและ 258 ชั่วโมง) ภาษายูเครน - ผู้เข้าร่วม 780 คนและ 87 ชั่วโมง (มีผู้เข้าร่วม 759 คนและ 87 ชั่วโมง)

โครงการ Common Voice มีวัตถุประสงค์เพื่อร่วมกันจัดทำฐานข้อมูลรูปแบบเสียงที่คำนึงถึงความหลากหลายของเสียงและรูปแบบการพูด ผู้ใช้จะได้รับเชิญให้ใช้วลีเสียงที่แสดงบนหน้าจอหรือประเมินคุณภาพของข้อมูลที่เพิ่มโดยผู้ใช้รายอื่น ฐานข้อมูลที่สะสมพร้อมบันทึกการออกเสียงวลีทั่วไปของคำพูดของมนุษย์สามารถใช้งานได้โดยไม่มีข้อจำกัดในระบบการเรียนรู้ของเครื่องและในโครงการวิจัย

ที่มา: opennet.ru

เพิ่มความคิดเห็น