Novi modeli za prepoznavanje ruskog govora u biblioteci Vosk

Programeri Vosk biblioteke objavili su nove modele za prepoznavanje ruskog govora: server-side vosk-model-ru-0.22 i mobile Vosk-model-small-ru-0.22. Modeli koriste nove govorne podatke, kao i novu arhitekturu neuronske mreže, što je omogućilo povećanje tačnosti prepoznavanja za 10-20%. Kod i podaci se distribuiraju pod licencom Apache 2.0.

Važne promjene:

  • Novi podaci prikupljeni u glasovnim kolonama značajno poboljšavaju prepoznavanje govornih komandi izgovorenih sa udaljenosti.
  • Nova shema izdvajanja zvuka značajno je poboljšala preciznost prepoznavanja za širokopojasne snimke. Istovremeno, poboljšana je i preciznost telefonskog prepoznavanja.
  • Dodatni paket za rječnik vam omogućava da prilagodite prepoznavanje složenih tehničkih unosa.

Za najbolju tačnost, preporučuje se ažuriranje Voska na verziju 0.3.32. Možda će vas zanimati i nove funkcije Voska, kao što su integracije sa Unity, NativeScript i Jigasi. Modeli za prepoznavanje kazaškog i ukrajinskog jezika. Model servera zahtijeva savremeni procesor i 8 GB memorije. Mobilni model se može koristiti u telefonima i Raspberry Pi 3+.

izvor: opennet.ru

Kupite pouzdan hosting za sajtove sa DDoS zaštitom, VPS VDS servere 🔥 Kupite pouzdan web hosting sa DDoS zaštitom, VPS VDS servere | ProHoster