Programeri Vosk biblioteke objavili su nove modele za prepoznavanje ruskog govora: server-side vosk-model-ru-0.22 i mobile Vosk-model-small-ru-0.22. Modeli koriste nove govorne podatke, kao i novu arhitekturu neuronske mreže, što je omogućilo povećanje tačnosti prepoznavanja za 10-20%. Kod i podaci se distribuiraju pod licencom Apache 2.0.
Važne promjene:
- Novi podaci prikupljeni u glasovnim kolonama značajno poboljšavaju prepoznavanje govornih komandi izgovorenih sa udaljenosti.
- Nova shema izdvajanja zvuka značajno je poboljšala preciznost prepoznavanja za širokopojasne snimke. Istovremeno, poboljšana je i preciznost telefonskog prepoznavanja.
- Dodatni paket za rječnik vam omogućava da prilagodite prepoznavanje složenih tehničkih unosa.
Za najbolju tačnost, preporučuje se ažuriranje Voska na verziju 0.3.32. Možda će vas zanimati i nove funkcije Voska, kao što su integracije sa Unity, NativeScript i Jigasi. Modeli za prepoznavanje kazaškog i ukrajinskog jezika. Model servera zahtijeva savremeni procesor i 8 GB memorije. Mobilni model se može koristiti u telefonima i Raspberry Pi 3+.
izvor: opennet.ru
