Errusiako hizkera ezagutzeko eredu berriak Vosk liburutegian

Vosk liburutegiko garatzaileek errusiar hizkera ezagutzeko eredu berriak argitaratu dituzte: zerbitzaria vosk-model-ru-0.22 eta mugikorra Vosk-model-small-ru-0.22. Ereduek hizketa-datu berriak erabiltzen dituzte, baita sare neuronalaren arkitektura berria ere, zeinak % 10-20 handitu du antzematearen zehaztasuna. Kodea eta datuak Apache 2.0 lizentziapean banatzen dira.

Aldaketa garrantzitsuak:

  • Ahots bozgorailuetan bildutako datu berriek nabarmen hobetzen dute urrutitik esandako ahozko aginduen antzematea.
  • Audioa ateratzeko eskema berriak nabarmen hobetu du banda zabaleko grabazioen ezagutzaren zehaztasuna. Aldi berean, telefonoaren aitorpenaren zehaztasuna ere hobetu da.
  • Hiztegiaren luzapen paketeak erregistro tekniko konplexuen aitorpena pertsonalizatzeko aukera ematen du.

Zehaztasun onena lortzeko, Wax bertsioa 0.3.32ra eguneratzea gomendatzen da. Baliteke Vosk-en ezaugarri berriak ere interesatzea: Unity, Nativescript, Jigasi-rekin integratzea. Kazakh eta ukrainar hizkuntzak ezagutzeko ereduak. Zerbitzariaren ereduak prozesadore moderno bat eta 8 GB memoria behar ditu funtzionatzeko. Mugikorren eredua telefonoetan eta RaspberryPi 3+etan erabil daiteke.

Iturria: opennet.ru

Gehitu iruzkin berria