Novi modeli za prepoznavanje ruskega govora v knjižnici Vosk

Razvijalci knjižnice Vosk so objavili nove modele za prepoznavanje ruskega govora: strežnik vosk-model-ru-0.22 in mobilni Vosk-model-small-ru-0.22. Modeli uporabljajo nove govorne podatke, kot tudi novo arhitekturo nevronske mreže, ki je povečala natančnost prepoznavanja za 10-20 %. Koda in podatki se distribuirajo pod licenco Apache 2.0.

Pomembne spremembe:

  • Novi podatki, zbrani v glasovnih zvočnikih, znatno izboljšajo prepoznavanje govornih ukazov, izgovorjenih na daljavo.
  • Nova shema ekstrakcije zvoka je bistveno izboljšala natančnost prepoznavanja za širokopasovne posnetke. Hkrati se je izboljšala tudi natančnost prepoznavanja telefonije.
  • Paket razširitve slovarja vam omogoča prilagoditev prepoznavanja kompleksnih tehničnih zapisov.

Za najboljšo natančnost je priporočljivo posodobiti različico Wax na 0.3.32. Morda vas bodo zanimale tudi nove funkcije Voska - integracija z Unity, Nativescript, Jigasi. Modeli za prepoznavanje kazahstanskega in ukrajinskega jezika. Model strežnika za delovanje zahteva sodoben procesor in 8GB pomnilnika. Mobilni model se lahko uporablja v telefonih in RaspberryPi 3+.

Vir: opennet.ru

Dodaj komentar