Model anyar kanggo pangenalan wicara Rusia ing perpustakaan Vosk

Pengembang perpustakaan Vosk wis nerbitake model anyar kanggo pangenalan wicara Rusia: server vosk-model-ru-0.22 lan seluler Vosk-model-small-ru-0.22. Model kasebut nggunakake data ucapan anyar, uga arsitektur jaringan saraf anyar, sing nambah akurasi pangenalan kanthi 10-20%. Kode lan data disebarake miturut lisensi Apache 2.0.

Owah-owahan penting:

  • Data anyar sing diklumpukake ing speaker swara kanthi signifikan nambah pangenalan prentah wicara sing diucapake saka kadohan.
  • Skema ekstraksi audio anyar wis ningkatake akurasi pangenalan kanthi signifikan kanggo rekaman pita lebar. Ing wektu sing padha, akurasi pangenalan telephony uga saya apik.
  • Paket ekstensi kamus ngidini sampeyan ngatur pangenalan cathetan teknis sing rumit.

Kanggo akurasi paling apik, dianjurake kanggo nganyari versi Wax kanggo 0.3.32. Sampeyan bisa uga kasengsem ing fitur anyar Vosk - integrasi karo Unity, Nativescript, Jigasi. Model kanggo ngenali basa Kazakh lan Ukrainia. Model server mbutuhake prosesor modern lan memori 8GB kanggo operate. Model seluler bisa digunakake ing telpon lan RaspberryPi 3+.

Source: opennet.ru

Add a comment