Ùrachadh Guth Coitcheann Mozilla 12.0

Tha Mozilla air na stòran-dàta Common Voice aca ùrachadh gus sampallan fuaimneachaidh bho barrachd air 200 neach a ghabhail a-steach. Tha an dàta air fhoillseachadh mar raon poblach (CC0). Faodar na seataichean a thathar a’ moladh a chleachdadh ann an siostaman ionnsachaidh innealan gus modalan aithneachadh cainnt agus synthesis a thogail.

An coimeas ris an ùrachadh roimhe, chaidh an àireamh de stuthan cainnte sa chruinneachadh suas bho 23.8 gu 25.8 mìle uair de òraid. Ghabh còrr air 88 mìle neach pàirt ann an ullachadh stuthan ann am Beurla, ag òrdachadh 3161 uair de òraid (bha 84 mìle com-pàirtiche ann agus 3098 uairean). Tha an seata airson cànan Belarus a’ còmhdach 7903 com-pàirtiche agus 1419 uairean de stuth cainnt (bha 6965 com-pàirtiche ann agus 1217 uairean), Ruiseanach - com-pàirtichean 2815 agus 229 uairean (bha 2731 com-pàirtiche ann agus 215 uairean), Uzbek - com-pàirtichean 2092 agus 262 uairean ( bha 2025 com-pàirtiche ann agus 258 uairean), cànan Ucràinis - 780 com-pàirtiche agus 87 uairean (bha 759 com-pàirtiche ann agus 87 uairean).

Tha am pròiseact Common Voice ag amas air co-obrachadh a chuir air dòigh gus stòr-dàta de phàtranan gutha a chruinneachadh a bheir aire do iomadachd guthan agus stoidhlichean cainnt. Thathas a’ toirt cuireadh do luchd-cleachdaidh abairtean guth a thaisbeanadh air an sgrion no measadh càileachd an dàta a chuir luchd-cleachdaidh eile ris. Faodar an stòr-dàta cruinnichte le clàran de dhiofar fhuaimneachadh de abairtean àbhaisteach de chainnt daonna a chleachdadh gun chuingealachaidhean ann an siostaman ionnsachaidh innealan agus ann am pròiseactan rannsachaidh.

Source: fosgailtenet.ru

Cuir beachd ann