ووسک لائبریری کے ڈویلپرز نے روسی اسپیچ ریکگنیشن کے لیے نئے ماڈل شائع کیے ہیں: سرور-سائیڈ ووسک-ماڈل-ru-0.22 اور موبائل Vosk-model-small-ru-0.22۔ ماڈلز نئے اسپیچ ڈیٹا کے ساتھ ساتھ ایک نئے نیورل نیٹ ورک فن تعمیر کا استعمال کرتے ہیں، جس نے شناخت کی درستگی کو 10-20% تک بڑھانا ممکن بنایا۔ کوڈ اور ڈیٹا اپاچی 2.0 لائسنس کے تحت تقسیم کیے گئے ہیں۔
اہم تبدیلیاں:
- صوتی کالموں میں اکٹھا کیا گیا نیا ڈیٹا دور سے بولی جانے والی اسپیچ کمانڈز کی پہچان کو نمایاں طور پر بہتر بناتا ہے۔
- نئی آواز نکالنے کی اسکیم نے وائیڈ بینڈ ریکارڈنگ کے لیے شناخت کی درستگی کو نمایاں طور پر بہتر کیا ہے۔ ایک ہی وقت میں، ٹیلی فونی شناخت کی درستگی میں بھی بہتری آئی ہے۔
- لغت کا اضافہ پیکیج آپ کو پیچیدہ تکنیکی اندراجات کی شناخت کو اپنی مرضی کے مطابق کرنے کی اجازت دیتا ہے۔
بہترین درستگی کے لیے، ووسک کو ورژن 0.3.32 میں اپ ڈیٹ کرنے کی سفارش کی جاتی ہے۔ آپ کو ووسک کی نئی خصوصیات میں بھی دلچسپی ہو سکتی ہے، جیسے کہ Unity، NativeScript، اور Jigasi کے ساتھ انضمام۔ قازق اور یوکرینی زبانوں کو پہچاننے کے ماڈل۔ سرور ماڈل کی ضرورت ہے۔ جدید پروسیسر اور 8GB میموری۔ موبائل ماڈل فونز اور Raspberry Pi 3+ میں استعمال کیا جا سکتا ہے۔
ماخذ: opennet.ru
