Razvijalci knjižnice Vosk so objavili nove modele za prepoznavanje ruskega govora: strežnik vosk-model-ru-0.22 in mobilni Vosk-model-small-ru-0.22. Modeli uporabljajo nove govorne podatke, kot tudi novo arhitekturo nevronske mreže, ki je povečala natančnost prepoznavanja za 10-20 %. Koda in podatki se distribuirajo pod licenco Apache 2.0.
Pomembne spremembe:
- Novi podatki, zbrani v glasovnih zvočnikih, znatno izboljšajo prepoznavanje govornih ukazov, izgovorjenih na daljavo.
- Nova shema ekstrakcije zvoka je bistveno izboljšala natančnost prepoznavanja za širokopasovne posnetke. Hkrati se je izboljšala tudi natančnost prepoznavanja telefonije.
- Paket razširitve slovarja vam omogoča prilagoditev prepoznavanja kompleksnih tehničnih zapisov.
Za najboljšo natančnost je priporočljivo posodobiti različico Wax na 0.3.32. Morda vas bodo zanimale tudi nove funkcije Voska - integracija z Unity, Nativescript, Jigasi. Modeli za prepoznavanje kazahstanskega in ukrajinskega jezika. Model strežnika za delovanje zahteva sodoben procesor in 8GB pomnilnika. Mobilni model se lahko uporablja v telefonih in RaspberryPi 3+.
Vir: opennet.ru