Voski raamatukogu arendajad on avaldanud uued venekeelse kõnetuvastuse mudelid: server vosk-model-ru-0.22 ja mobiilne Vosk-model-small-ru-0.22. Mudelites kasutatakse uusi kõneandmeid, aga ka uut närvivõrgu arhitektuuri, mis on suurendanud tuvastamise täpsust 10-20%. Koodi ja andmeid levitatakse Apache 2.0 litsentsi alusel.
Olulised muudatused:
- Kõlaritesse kogutud uued andmed parandavad oluliselt eemalt öeldud kõnekäskude äratundmist.
- Uus heli eraldamise skeem on oluliselt parandanud lairibasalvestuste tuvastamise täpsust. Samal ajal on paranenud ka telefonituvastuse täpsus.
- Sõnastiku laienduspakett võimaldab kohandada keerukate tehniliste kirjete tuvastamist.
Parima täpsuse saavutamiseks on soovitatav Wax versiooni värskendada versioonile 0.3.32. Teid võivad huvitada ka Voski uued funktsioonid – integratsioon Unity, Nativescripti, Jigasiga. Kasahhi ja ukraina keelte äratundmise mudelid. Serverimudeli tööks on vaja kaasaegset protsessorit ja 8 GB mälu. Mobiilimudelit saab kasutada telefonides ja RaspberryPi 3+.
Allikas: opennet.ru