Nové modely pre rozpoznávanie ruskej reči v knižnici Vosk

Vývojári knižnice Vosk zverejnili nové modely pre rozpoznávanie ruskej reči: server vosk-model-ru-0.22 a mobilný Vosk-model-small-ru-0.22. Modely využívajú nové dáta reči, ako aj novú architektúru neurónovej siete, ktorá zvýšila presnosť rozpoznávania o 10 – 20 %. Kód a údaje sú distribuované pod licenciou Apache 2.0.

Dôležité zmeny:

  • Nové údaje zhromaždené v hlasových reproduktoroch výrazne zlepšujú rozpoznávanie hlasových príkazov hovorených na diaľku.
  • Nová schéma extrakcie zvuku výrazne zlepšila presnosť rozpoznávania pre širokopásmové nahrávky. Zároveň sa zlepšila aj presnosť rozpoznávania telefonovania.
  • Balík rozšírenia slovníka vám umožňuje prispôsobiť rozpoznávanie zložitých technických záznamov.

Pre najlepšiu presnosť sa odporúča aktualizovať verziu Wax na 0.3.32. Možno vás budú zaujímať aj nové funkcie Voska – integrácia s Unity, Nativescript, Jigasi. Modely na rozpoznávanie kazašského a ukrajinského jazyka. Serverový model vyžaduje na prevádzku moderný procesor a 8 GB pamäte. Mobilný model je možné použiť v telefónoch a RaspberryPi 3+.

Zdroj: opennet.ru

Pridať komentár