Vosk bibliotēkas izstrādātāji ir publicējuši jaunus krievu runas atpazīšanas modeļus: serveri vosk-model-ru-0.22 un mobilo Vosk-model-small-ru-0.22. Modeļos izmantoti jauni runas dati, kā arī jauna neironu tīkla arhitektūra, kas ir palielinājusi atpazīšanas precizitāti par 10-20%. Kods un dati tiek izplatīti saskaņā ar Apache 2.0 licenci.
Svarīgas izmaiņas:
- Jauni dati, kas savākti balss skaļruņos, ievērojami uzlabo no attāluma izrunāto runas komandu atpazīšanu.
- Jaunā audio ekstrakcijas shēma ir ievērojami uzlabojusi platjoslas ierakstu atpazīšanas precizitāti. Tajā pašā laikā ir uzlabojusies arī telefonijas atpazīšanas precizitāte.
- Vārdnīcas paplašinājuma pakotne ļauj pielāgot sarežģītu tehnisko ierakstu atpazīšanu.
Lai nodrošinātu vislabāko precizitāti, ieteicams atjaunināt Wax versiju uz 0.3.32. Iespējams, jūs interesēs arī jaunās Vosk iespējas – integrācija ar Unity, Nativescript, Jigasi. Modeļi kazahu un ukraiņu valodu atpazīšanai. Servera modeļa darbībai nepieciešams moderns procesors un 8GB atmiņa. Mobilo modeli var izmantot tālruņos un RaspberryPi 3+.
Avots: opennet.ru