Aina mpya za utambuzi wa hotuba ya Kirusi kwenye maktaba ya Vosk

Watengenezaji wa maktaba ya Vosk wamechapisha mifano mpya ya utambuzi wa hotuba ya Kirusi: seva vosk-model-ru-0.22 na simu ya Vosk-model-small-ru-0.22. Mifano hutumia data mpya ya hotuba, pamoja na usanifu mpya wa mtandao wa neural, ambao umeongeza usahihi wa utambuzi kwa 10-20%. Nambari na data inasambazwa chini ya leseni ya Apache 2.0.

Mabadiliko muhimu:

  • Data mpya inayokusanywa katika spika za sauti huboresha kwa kiasi kikubwa utambuzi wa amri za usemi zinazosemwa kwa mbali.
  • Mpango mpya wa kutoa sauti umeboresha kwa kiasi kikubwa usahihi wa utambuzi wa rekodi za bendi pana. Wakati huo huo, usahihi wa utambuzi wa simu pia umeboreshwa.
  • Kifurushi cha kiendelezi cha kamusi hukuruhusu kubinafsisha utambuzi wa rekodi changamano za kiufundi.

Kwa usahihi bora, inashauriwa kusasisha toleo la Wax hadi 0.3.32. Unaweza pia kupendezwa na vipengele vipya vya Vosk - ushirikiano na Umoja, Nativescript, Jigasi. Mifano ya kutambua lugha za Kazakh na Kiukreni. Mfano wa seva unahitaji processor ya kisasa na 8GB ya kumbukumbu kufanya kazi. Mfano wa simu inaweza kutumika katika simu na RaspberryPi 3+.

Chanzo: opennet.ru

Kuongeza maoni