Model baharu untuk pengecaman pertuturan Rusia di perpustakaan Vosk

Pembangun perpustakaan Vosk telah menerbitkan model baharu untuk pengecaman pertuturan Rusia: pelayan vosk-model-ru-0.22 dan mudah alih Vosk-model-small-ru-0.22. Model menggunakan data pertuturan baharu, serta seni bina rangkaian saraf baharu, yang telah meningkatkan ketepatan pengecaman sebanyak 10-20%. Kod dan data diedarkan di bawah lesen Apache 2.0.

Perubahan penting:

  • Data baharu yang dikumpul dalam pembesar suara suara meningkatkan dengan ketara pengecaman perintah pertuturan yang dituturkan dari jauh.
  • Skim pengekstrakan audio baharu telah meningkatkan ketepatan pengecaman dengan ketara untuk rakaman jalur lebar. Pada masa yang sama, ketepatan pengecaman telefon juga telah bertambah baik.
  • Pakej sambungan kamus membolehkan anda menyesuaikan pengiktirafan rekod teknikal yang kompleks.

Untuk ketepatan terbaik, disyorkan untuk mengemas kini versi Wax kepada 0.3.32. Anda juga mungkin berminat dengan ciri baharu Vosk - integrasi dengan Unity, Nativescript, Jigasi. Model untuk mengenali bahasa Kazakh dan Ukraine. Model pelayan memerlukan pemproses moden dan memori 8GB untuk beroperasi. Model mudah alih boleh digunakan dalam telefon dan RaspberryPi 3+.

Sumber: opennet.ru

Tambah komen