Novi modeli za prepoznavanje ruskog govora u biblioteci Vosk

Programeri Vosk biblioteke objavili su nove modele za prepoznavanje ruskog govora: server-side vosk-model-ru-0.22 i mobile Vosk-model-small-ru-0.22. Modeli koriste nove govorne podatke, kao i novu arhitekturu neuronske mreže, što je omogućilo povećanje tačnosti prepoznavanja za 10-20%. Kod i podaci se distribuiraju pod licencom Apache 2.0.

Važne promjene:

  • Novi podaci prikupljeni u glasovnim kolonama značajno poboljšavaju prepoznavanje govornih komandi izgovorenih sa udaljenosti.
  • Nova shema izdvajanja zvuka značajno je poboljšala preciznost prepoznavanja za širokopojasne snimke. Istovremeno, poboljšana je i preciznost telefonskog prepoznavanja.
  • Dodatni paket za rječnik vam omogućava da prilagodite prepoznavanje složenih tehničkih unosa.

Za najbolju preciznost, preporučuje se ažuriranje Wax verzije na 0.3.32. Možda će vas zanimati i nove Wax karakteristike - integracija sa Unity, Nativescript, Jigasi. Modeli za prepoznavanje kazahstanskog i ukrajinskog jezika. Serverskom modelu je za rad potreban moderan procesor i 8 GB memorije. Mobilni model se može koristiti u telefonima i RaspberryPi 3+.

izvor: opennet.ru

Dodajte komentar