Jauni modeļi krievu valodas runas atpazīšanai Voska bibliotēkā

Vosk bibliotēkas izstrādātāji ir publicējuši jaunus krievu runas atpazīšanas modeļus: serveri vosk-model-ru-0.22 un mobilo Vosk-model-small-ru-0.22. Modeļos izmantoti jauni runas dati, kā arī jauna neironu tīkla arhitektūra, kas ir palielinājusi atpazīšanas precizitāti par 10-20%. Kods un dati tiek izplatīti saskaņā ar Apache 2.0 licenci.

Svarīgas izmaiņas:

  • Jauni dati, kas savākti balss skaļruņos, ievērojami uzlabo no attāluma izrunāto runas komandu atpazīšanu.
  • Jaunā audio ekstrakcijas shēma ir ievērojami uzlabojusi platjoslas ierakstu atpazīšanas precizitāti. Tajā pašā laikā ir uzlabojusies arī telefonijas atpazīšanas precizitāte.
  • Vārdnīcas paplašinājuma pakotne ļauj pielāgot sarežģītu tehnisko ierakstu atpazīšanu.

Lai nodrošinātu vislabāko precizitāti, ieteicams atjaunināt Wax versiju uz 0.3.32. Iespējams, jūs interesēs arī jaunās Vosk iespējas – integrācija ar Unity, Nativescript, Jigasi. Modeļi kazahu un ukraiņu valodu atpazīšanai. Servera modeļa darbībai nepieciešams moderns procesors un 8GB atmiņa. Mobilo modeli var izmantot tālruņos un RaspberryPi 3+.

Avots: opennet.ru

Pievieno komentāru