Uued mudelid vene keele kõnetuvastuseks Voski raamatukogus

Voski raamatukogu arendajad on avaldanud uued venekeelse kõnetuvastuse mudelid: server vosk-model-ru-0.22 ja mobiilne Vosk-model-small-ru-0.22. Mudelites kasutatakse uusi kõneandmeid, aga ka uut närvivõrgu arhitektuuri, mis on suurendanud tuvastamise täpsust 10-20%. Koodi ja andmeid levitatakse Apache 2.0 litsentsi alusel.

Olulised muudatused:

  • Kõlaritesse kogutud uued andmed parandavad oluliselt eemalt öeldud kõnekäskude äratundmist.
  • Uus heli eraldamise skeem on oluliselt parandanud lairibasalvestuste tuvastamise täpsust. Samal ajal on paranenud ka telefonituvastuse täpsus.
  • Sõnastiku laienduspakett võimaldab kohandada keerukate tehniliste kirjete tuvastamist.

Parima täpsuse saavutamiseks on soovitatav Wax versiooni värskendada versioonile 0.3.32. Teid võivad huvitada ka Voski uued funktsioonid – integratsioon Unity, Nativescripti, Jigasiga. Kasahhi ja ukraina keelte äratundmise mudelid. Serverimudeli tööks on vaja kaasaegset protsessorit ja 8 GB mälu. Mobiilimudelit saab kasutada telefonides ja RaspberryPi 3+.

Allikas: opennet.ru

Lisa kommentaar