ผู้พัฒนาไลบรารี Vosk ได้เผยแพร่โมเดลใหม่สำหรับการรู้จำเสียงภาษารัสเซีย: เซิร์ฟเวอร์ vosk-model-ru-0.22 และมือถือ Vosk-model-small-ru-0.22 โมเดลเหล่านี้ใช้ข้อมูลคำพูดใหม่ รวมถึงสถาปัตยกรรมโครงข่ายประสาทเทียมใหม่ ซึ่งเพิ่มความแม่นยำในการจดจำขึ้น 10-20% รหัสและข้อมูลเผยแพร่ภายใต้ลิขสิทธิ์ Apache 2.0
การเปลี่ยนแปลงที่สำคัญ:
- ข้อมูลใหม่ที่รวบรวมในลำโพงเสียงช่วยปรับปรุงการจดจำคำสั่งคำพูดที่พูดจากระยะไกลได้อย่างมาก
- รูปแบบการแยกเสียงใหม่ได้ปรับปรุงความแม่นยำในการจดจำสำหรับการบันทึกย่านความถี่กว้างขึ้นอย่างมาก ในขณะเดียวกัน ความแม่นยำของการจดจำโทรศัพท์ก็ได้รับการปรับปรุงเช่นกัน
- แพ็คเกจส่วนขยายพจนานุกรมช่วยให้คุณปรับแต่งการจดจำบันทึกทางเทคนิคที่ซับซ้อนได้
เพื่อให้ได้ผลลัพธ์ที่แม่นยำที่สุด ขอแนะนำให้อัปเดต Vosk เป็นเวอร์ชัน 0.3.32 นอกจากนี้ คุณอาจสนใจคุณสมบัติใหม่ๆ ของ Vosk เช่น การผสานรวมกับ Unity, NativeScript และ Jigasi รวมถึงโมเดลสำหรับการจดจำภาษาคาซัคและยูเครน โมเดลเซิร์ฟเวอร์ต้องการ... โปรเซสเซอร์สมัยใหม่ และมีหน่วยความจำ 8GB รุ่นพกพานี้สามารถใช้งานได้ในโทรศัพท์และ Raspberry Pi 3+
ที่มา: opennet.ru
