โมเดลใหม่สำหรับการรู้จำเสียงภาษารัสเซียในไลบรารี Vosk

ผู้พัฒนาไลบรารี Vosk ได้เผยแพร่โมเดลใหม่สำหรับการรู้จำเสียงภาษารัสเซีย: เซิร์ฟเวอร์ vosk-model-ru-0.22 และมือถือ Vosk-model-small-ru-0.22 โมเดลเหล่านี้ใช้ข้อมูลคำพูดใหม่ รวมถึงสถาปัตยกรรมโครงข่ายประสาทเทียมใหม่ ซึ่งเพิ่มความแม่นยำในการจดจำขึ้น 10-20% รหัสและข้อมูลเผยแพร่ภายใต้ลิขสิทธิ์ Apache 2.0

การเปลี่ยนแปลงที่สำคัญ:

  • ข้อมูลใหม่ที่รวบรวมในลำโพงเสียงช่วยปรับปรุงการจดจำคำสั่งคำพูดที่พูดจากระยะไกลได้อย่างมาก
  • รูปแบบการแยกเสียงใหม่ได้ปรับปรุงความแม่นยำในการจดจำสำหรับการบันทึกย่านความถี่กว้างขึ้นอย่างมาก ในขณะเดียวกัน ความแม่นยำของการจดจำโทรศัพท์ก็ได้รับการปรับปรุงเช่นกัน
  • แพ็คเกจส่วนขยายพจนานุกรมช่วยให้คุณปรับแต่งการจดจำบันทึกทางเทคนิคที่ซับซ้อนได้

เพื่อให้ได้ผลลัพธ์ที่แม่นยำที่สุด ขอแนะนำให้อัปเดต Vosk เป็นเวอร์ชัน 0.3.32 นอกจากนี้ คุณอาจสนใจคุณสมบัติใหม่ๆ ของ Vosk เช่น การผสานรวมกับ Unity, NativeScript และ Jigasi รวมถึงโมเดลสำหรับการจดจำภาษาคาซัคและยูเครน โมเดลเซิร์ฟเวอร์ต้องการ... โปรเซสเซอร์สมัยใหม่ และมีหน่วยความจำ 8GB รุ่นพกพานี้สามารถใช้งานได้ในโทรศัพท์และ Raspberry Pi 3+

ที่มา: opennet.ru

ซื้อโฮสติ้งที่เชื่อถือได้สำหรับไซต์ที่มีการป้องกัน DDoS เซิร์ฟเวอร์ VPS VDS 🔥 ซื้อบริการเว็บโฮสติ้งที่เชื่อถือได้ พร้อมระบบป้องกัน DDoS และเซิร์ฟเวอร์ VPS/VDS | ProHoster