„Mozilla Common Voice 12.0“ balso naujinimas

„Mozilla“ atnaujino savo „Common Voice“ duomenų rinkinius, įtraukdama daugiau nei 200 0 žmonių tarimo pavyzdžius. Duomenys skelbiami kaip viešasis domenas (CCXNUMX). Siūlomi rinkiniai gali būti naudojami mašininio mokymosi sistemose, kuriant kalbos atpažinimo ir sintezės modelius.

Palyginti su ankstesniu atnaujinimu, kalbinės medžiagos apimtis rinkinyje padidėjo nuo 23.8 iki 25.8 tūkstančio kalbėjimo valandų. Rengiant medžiagą anglų kalba dalyvavo daugiau nei 88 tūkst. žmonių, padiktavusių 3161 valandą kalbos (dalyvių buvo 84 tūkst. ir 3098 val.). Rinkinys baltarusių kalbai apima 7903 dalyvius ir 1419 valandų kalbos medžiagos (buvo 6965 dalyviai ir 1217 valandų), rusų - 2815 dalyvių ir 229 valandas (buvo 2731 dalyvis ir 215 valandų), uzbekų - 2092 dalyviai ir 262 valandas ( buvo 2025 dalyviai ir 258 valandos), ukrainiečių kalba - 780 dalyvių ir 87 valandos (buvo 759 dalyviai ir 87 valandos).

Projektu „Bendras balsas“ siekiama organizuoti bendrą darbą, siekiant kaupti balso modelių duomenų bazę, kurioje būtų atsižvelgiama į balsų ir kalbėjimo stilių įvairovę. Vartotojai kviečiami išgirsti ekrane rodomas frazes arba įvertinti kitų vartotojų pridėtų duomenų kokybę. Sukaupta duomenų bazė su įvairių tipinių žmogaus kalbos frazių tarimo įrašais gali būti be apribojimų naudojama mašininio mokymosi sistemose ir tyrimų projektuose.

Šaltinis: opennet.ru

Добавить комментарий