Modele të reja për njohjen e të folurit rus në bibliotekën Vosk

Zhvilluesit e bibliotekës Vosk kanë publikuar modele të reja për njohjen e të folurit rus: server vosk-model-ru-0.22 dhe celular Vosk-model-small-ru-0.22. Modelet përdorin të dhëna të reja të të folurit, si dhe një arkitekturë të re të rrjetit nervor, e cila ka rritur saktësinë e njohjes me 10-20%. Kodi dhe të dhënat shpërndahen nën licencën Apache 2.0.

Ndryshime të rëndësishme:

  • Të dhënat e reja të mbledhura në altoparlantët zanorë përmirësojnë ndjeshëm njohjen e komandave të të folurit të shqiptuara nga distanca.
  • Skema e re e nxjerrjes audio ka përmirësuar ndjeshëm saktësinë e njohjes për regjistrimet me brez të gjerë. Në të njëjtën kohë, saktësia e njohjes së telefonisë është përmirësuar gjithashtu.
  • Paketa e zgjerimit të fjalorit ju lejon të personalizoni njohjen e të dhënave komplekse teknike.

Për saktësinë më të mirë, rekomandohet të përditësoni versionin Wax në 0.3.32. Ju gjithashtu mund të interesoheni për veçoritë e reja të Vosk - integrimi me Unity, Nativescript, Jigasi. Modele për njohjen e gjuhëve kazake dhe ukrainase. Modeli i serverit kërkon një procesor modern dhe 8 GB memorie për të funksionuar. Modeli celular mund të përdoret në telefona dhe RaspberryPi 3+.

Burimi: opennet.ru

Shto një koment