Nije modellen foar Russyske spraakherkenning yn 'e Vosk-bibleteek

De ûntwikkelders fan 'e Vosk-biblioteek hawwe nije modellen publisearre foar Russyske spraakherkenning: server vosk-model-ru-0.22 en mobile Vosk-model-small-ru-0.22. De modellen brûke nije spraakgegevens, lykas ek in nije arsjitektuer foar neuronale netwurken, dy't de krektens fan 'e erkenning hat ferhege mei 10-20%. De koade en gegevens wurde ferspraat ûnder de Apache 2.0-lisinsje.

Wichtige feroarings:

  • Nije gegevens sammele yn spraaksprekkers ferbetterje de herkenning fan spraakkommando's dy't op ôfstân sprutsen wurde signifikant.
  • It nije skema foar audio-ekstraksje hat de herkenningsnauwkeurigens foar breedbânopnames signifikant ferbettere. Tagelyk is de krektens fan telefoanyske erkenning ek ferbettere.
  • It wurdboek-útwreidingspakket lit jo de erkenning fan komplekse technyske records oanpasse.

Foar bêste krektens wurdt it oanrikkemandearre om de Wax-ferzje te aktualisearjen nei 0.3.32. Jo kinne ek ynteressearre wêze yn 'e nije funksjes fan Vosk - yntegraasje mei Unity, Nativescript, Jigasi. Modellen foar it erkennen fan Kazachsk en Oekraynsk talen. It servermodel fereasket in moderne prosessor en 8 GB ûnthâld om te operearjen. It mobile model kin brûkt wurde yn tillefoans en RaspberryPi 3+.

Boarne: opennet.ru

Add a comment