Modelau newydd ar gyfer adnabod lleferydd Rwsiaidd yn llyfrgell Vosk

Mae datblygwyr llyfrgell Vosk wedi cyhoeddi modelau newydd ar gyfer adnabod lleferydd Rwsiaidd: gweinydd vosk-model-ru-0.22 a Vosk-model-small-ru-0.22 symudol. Mae'r modelau'n defnyddio data lleferydd newydd, yn ogystal â phensaernïaeth rhwydwaith niwral newydd, sydd wedi cynyddu cywirdeb cydnabyddiaeth 10-20%. Dosberthir y cod a'r data o dan drwydded Apache 2.0.

Newidiadau pwysig:

  • Mae data newydd a gesglir mewn siaradwyr llais yn gwella'n sylweddol y gydnabyddiaeth o orchmynion lleferydd a siaredir o bell.
  • Mae'r cynllun echdynnu sain newydd wedi gwella cywirdeb cydnabyddiaeth ar gyfer recordiadau band eang yn sylweddol. Ar yr un pryd, mae cywirdeb adnabod teleffoni hefyd wedi gwella.
  • Mae'r pecyn estyniad geiriadur yn caniatáu ichi addasu'r gydnabyddiaeth o gofnodion technegol cymhleth.

Ar gyfer cywirdeb gorau, argymhellir diweddaru'r fersiwn Wax i 0.3.32. Efallai y bydd gennych ddiddordeb hefyd yn nodweddion newydd Vosk - integreiddio ag Unity, Nativescript, Jigasi. Modelau ar gyfer adnabod ieithoedd Kazakh a Wcrain. Mae model y gweinydd yn gofyn am brosesydd modern ac 8GB o gof i weithredu. Gellir defnyddio'r model symudol mewn ffonau a RaspberryPi 3+.

Ffynhonnell: opennet.ru

Ychwanegu sylw