Ný módel fyrir rússneska talgreiningu í Vosk bókasafninu

Hönnuðir Vosk bókasafnsins hafa gefið út nýjar gerðir fyrir rússneska talgreiningu: netþjónn vosk-model-ru-0.22 og farsíma Vosk-model-small-ru-0.22. Líkönin nota ný talgögn, auk nýrrar taugakerfisarkitektúrs, sem hefur aukið greiningarnákvæmni um 10-20%. Kóðanum og gögnunum er dreift undir Apache 2.0 leyfinu.

Mikilvægar breytingar:

  • Ný gögn sem safnað er í raddhátölurum bæta verulega greiningu talskipana sem talaðar eru úr fjarlægð.
  • Nýja hljóðútdráttarkerfið hefur verulega bætt greiningarnákvæmni fyrir breiðbandsupptökur. Á sama tíma hefur nákvæmni símagreiningar einnig batnað.
  • Orðabókarviðbótapakkinn gerir þér kleift að sérsníða viðurkenningu á flóknum tæknilegum gögnum.

Fyrir bestu nákvæmni er mælt með því að uppfæra Wax útgáfuna í 0.3.32. Þú gætir líka haft áhuga á nýju eiginleikum Vosk - samþættingu við Unity, Nativescript, Jigasi. Líkön til að þekkja kasakska og úkraínska tungumál. Miðlaralíkanið þarf nútímalegan örgjörva og 8GB af minni til að starfa. Hægt er að nota farsímagerðina í símum og RaspberryPi 3+.

Heimild: opennet.ru

Bæta við athugasemd