Uusia malleja venäjän puheentunnistukseen Vosk-kirjastossa

Vosk-kirjaston kehittäjät ovat julkaisseet uusia malleja venäläiseen puheentunnistukseen: palvelin vosk-model-ru-0.22 ja mobiili Vosk-model-small-ru-0.22. Mallit käyttävät uutta puhedataa sekä uutta hermoverkkoarkkitehtuuria, joka on lisännyt tunnistustarkkuutta 10-20 %. Koodi ja tiedot jaetaan Apache 2.0 -lisenssillä.

Tärkeitä muutoksia:

  • Uudet äänikaiuttimiin kerätyt tiedot parantavat merkittävästi etäältä puhuttujen puhekomentojen tunnistamista.
  • Uusi äänenpoistojärjestelmä on parantanut merkittävästi laajakaistatallenteiden tunnistustarkkuutta. Samalla myös puhelimen tunnistuksen tarkkuus on parantunut.
  • Sanakirjalaajennuspaketin avulla voit mukauttaa monimutkaisten teknisten tietueiden tunnistamista.

Parhaan tarkkuuden saavuttamiseksi on suositeltavaa päivittää Wax-versio versioon 0.3.32. Saatat myös olla kiinnostunut Voskin uusista ominaisuuksista - integraatiosta Unityn, Nativescriptin, Jigasin kanssa. Mallit kazakstanin ja ukrainan kielten tunnistamiseen. Palvelinmalli vaatii toimiakseen nykyaikaisen prosessorin ja 8 Gt muistia. Mobiilimallia voidaan käyttää puhelimissa ja RaspberryPi 3+:ssa.

Lähde: opennet.ru

Lisää kommentti