Novi mudelli per a ricunniscenza di a parolla russa in a biblioteca Vosk

I sviluppatori di a libreria Vosk anu publicatu novi mudelli per u ricunniscenza di a voce russa: u servitore vosk-model-ru-0.22 è mobile Vosk-model-small-ru-0.22. I mudelli utilizanu novi dati di parlà, è ancu una nova architettura di rete neurale, chì hà permessu di aumentà a precisione di ricunniscenza da 10-20%. U codice è e dati sò distribuiti sottu a licenza Apache 2.0.

Cambiamenti impurtanti:

  • I novi dati raccolti in e colonne di voce miglioranu significativamente u ricunniscenza di i cumandamenti di parlà da una distanza.
  • U novu schema di estrazione di sonu hà miglioratu significativamente a precisione di ricunniscenza per e registrazioni di banda larga. À u listessu tempu, a precisione di ricunniscenza di a telefonia hè ancu migliorata.
  • U pacchettu add-on di dizziunariu permette di persunalizà a ricunniscenza di entrate tecniche cumplesse.

Per a megliu precisione, hè cunsigliatu per aghjurnà a versione di Wax à 0.3.32. Pudete ancu esse interessatu à e novi funziunalità di Wax - integrazione cù Unity, Nativescript, Jigasi. Modelli per a ricunniscenza di e lingue kazakh è ucraina. U mudellu di u servitore hà bisognu di un processatore mudernu è 8GB di memoria per travaglià. U mudellu mobile pò esse usatu in telefoni è RaspberryPi 3+.

Source: opennet.ru

Add a comment