نماذج جديدة للتعرف على الكلام الروسي في مكتبة فوسك

نشر مطورو مكتبة Vosk نماذج جديدة للتعرف على الكلام الروسي: من جانب الخادم vosk-model-ru-0.22 و Mobile Vosk-model-small-ru-0.22. تستخدم النماذج بيانات كلام جديدة ، بالإضافة إلى بنية شبكة عصبية جديدة ، مما جعل من الممكن زيادة دقة التعرف بنسبة 10-20٪. يتم توزيع الكود والبيانات بموجب ترخيص Apache 2.0.

تغييرات مهمة:

  • تعمل البيانات الجديدة التي تم جمعها في أعمدة الصوت على تحسين التعرف على أوامر الكلام المنطوقة من مسافة بعيدة.
  • أدى نظام استخراج الصوت الجديد إلى تحسين دقة التعرف على تسجيلات النطاق العريض بشكل كبير. في الوقت نفسه ، تحسنت أيضًا دقة التعرف على المكالمات الهاتفية.
  • تسمح لك حزمة القاموس الإضافية بتخصيص التعرف على الإدخالات التقنية المعقدة.

للحصول على أفضل دقة ، يوصى بتحديث إصدار Wax إلى 0.3.32 أيضًا. قد تكون مهتمًا أيضًا بميزات Wax الجديدة - التكامل مع Unity و Nativescript و Jigasi. نماذج للاعتراف باللغتين الكازاخستانية والأوكرانية. يحتاج طراز الخادم إلى معالج حديث وذاكرة 8 جيجابايت للعمل. يمكن استخدام طراز الهاتف المحمول في الهواتف و RaspberryPi 3+.

المصدر: opennet.ru

إضافة تعليق