Vývojári knižnice Vosk zverejnili nové modely pre rozpoznávanie ruskej reči: server vosk-model-ru-0.22 a mobilný Vosk-model-small-ru-0.22. Modely využívajú nové dáta reči, ako aj novú architektúru neurónovej siete, ktorá zvýšila presnosť rozpoznávania o 10 – 20 %. Kód a údaje sú distribuované pod licenciou Apache 2.0.
Dôležité zmeny:
- Nové údaje zhromaždené v hlasových reproduktoroch výrazne zlepšujú rozpoznávanie hlasových príkazov hovorených na diaľku.
- Nová schéma extrakcie zvuku výrazne zlepšila presnosť rozpoznávania pre širokopásmové nahrávky. Zároveň sa zlepšila aj presnosť rozpoznávania telefonovania.
- Balík rozšírenia slovníka vám umožňuje prispôsobiť rozpoznávanie zložitých technických záznamov.
Pre najlepšiu presnosť sa odporúča aktualizovať verziu Wax na 0.3.32. Možno vás budú zaujímať aj nové funkcie Voska – integrácia s Unity, Nativescript, Jigasi. Modely na rozpoznávanie kazašského a ukrajinského jazyka. Serverový model vyžaduje na prevádzku moderný procesor a 8 GB pamäte. Mobilný model je možné použiť v telefónoch a RaspberryPi 3+.
Zdroj: opennet.ru