Novaj modeloj por rusa parolrekono en la Vosk-biblioteko

La programistoj de la biblioteko Vosk publikigis novajn modelojn por rusa parolrekono: servilo vosk-model-ru-0.22 kaj movebla Vosk-model-small-ru-0.22. La modeloj uzas novajn paroldatenojn, same kiel novan neŭralan retan arkitekturon, kiu pliigis rekonan precizecon je 10-20%. La kodo kaj datumoj estas distribuitaj sub la permesilo Apache 2.0.

Gravaj ŝanĝoj:

  • Novaj datumoj kolektitaj en voĉaj laŭtparoliloj signife plibonigas la rekonon de parolkomandoj parolitaj de malproksime.
  • La nova aŭd-eltira skemo signife plibonigis rekonoprecizecon por larĝbendaj registradoj. Samtempe, la precizeco de telefona rekono ankaŭ pliboniĝis.
  • La vortara etendaĵo ebligas al vi personecigi la rekonon de kompleksaj teknikaj registroj.

Por plej bona precizeco, rekomendas ĝisdatigi la version de Wax al 0.3.32. Vi ankaŭ eble interesiĝos pri la novaj funkcioj de Vosk - integriĝo kun Unity, Nativescript, Jigasi. Modeloj por rekoni kazaĥajn kaj ukrainajn lingvojn. La servila modelo postulas modernan procesoron kaj 8GB da memoro por funkcii. La poŝtelefona modelo povas esti uzata en telefonoj kaj RaspberryPi 3+.

fonto: opennet.ru

Aldoni komenton