Ùrachadh Guth Coitcheann Mozilla 8.0

Tha Mozilla air ùrachadh fhoillseachadh dha na stòran-dàta Common Voice aige, a tha a’ toirt a-steach sampallan fuaimneachaidh bho faisg air 200 neach. Tha an dàta air fhoillseachadh mar raon poblach (CC0). Faodar na seataichean a thathar a’ moladh a chleachdadh ann an siostaman ionnsachaidh innealan gus modalan aithneachadh cainnt agus synthesis a thogail. An coimeas ris an ùrachadh roimhe, mheudaich an àireamh de stuthan cainnt anns a ‘chruinneachadh le 30% – bho 13.9 gu 18.2 mìle uair de òraid. Tha an àireamh de chànanan le taic air a dhol suas bho 67 gu 87.

Tha an seata airson cànan na Ruis a’ còmhdach 2452 com-pàirtiche agus 193 uair de stuth cainnt (bha 2136 com-pàirtiche ann agus 173 uair), airson cànan Belarus - 6160 com-pàirtiche agus 987 uairean (bha 3831 com-pàirtiche ann agus 356 uairean), airson cànan na h-Ucrain - com-pàirtichean 684 agus 76 uairean (bha 615 com-pàirtiche ann agus 66 uairean). Ghabh còrr air 79 mìle neach pàirt ann an ullachadh stuthan ann am Beurla, ag òrdachadh 2886 uair de dh ’òraid dearbhte (bha 75 mìle com-pàirtiche ann agus 2637 uairean).

Cuimhnichidh sinn gu bheil am pròiseact Common Voice ag amas air co-obrachadh a chuir air dòigh gus stòr-dàta de phàtranan gutha a chruinneachadh a bheir aire do iomadachd ghuthan agus stoidhlichean cainnt. Thathas a’ toirt cuireadh do luchd-cleachdaidh abairtean guth a thaisbeanadh air an sgrion no measadh càileachd an dàta a chuir luchd-cleachdaidh eile ris. Faodar an stòr-dàta cruinnichte le clàran de dhiofar fhuaimneachadh de abairtean àbhaisteach de chainnt daonna a chleachdadh gun chuingealachaidhean ann an siostaman ionnsachaidh innealan agus ann am pròiseactan rannsachaidh. A rèir ùghdar leabharlann aithne cainnt leantainneach Vosk, is e na h-eas-bhuannachdan a tha ann an seata Guth Coitcheann an stuth guth aon-taobhach (mar as trice fireannaich 20-30 bliadhna a dh'aois, agus dìth stuth le guthan boireannaich. , clann agus seann daoine), dìth caochlaidheachd anns an fhaclair (ath-aithris de na h-aon abairtean) agus sgaoileadh chlàran ann an cruth MP3 a tha a’ gluasad air falbh.

A bharrachd air an sin, is urrainn dhuinn toirt fa-near gun deach an inneal NVIDIA NeMo 1.6 a leigeil ma sgaoil, a bheir seachad dòighean ionnsachaidh inneal airson siostaman aithneachadh cainnt a chruthachadh, synthesis cainnt agus giollachd cànain nàdarra. Tha NeMo a’ toirt a-steach modalan trèanaidh deiseil airson an cleachdadh airson siostaman ionnsachaidh inneal stèidhichte air frèam PyTorch, air ullachadh le NVIDIA a’ cleachdadh dàta cainnt Common Voice agus a’ còmhdach grunn chànanan, sràcan agus cruthan cainnte. Faodaidh na modailean a bhith feumail do luchd-rannsachaidh a tha a’ leasachadh siostaman còmhraidh stèidhichte air guth, àrd-ùrlaran tar-sgrìobhaidh, agus ionadan gairm fèin-ghluasadach. Mar eisimpleir, tha NVIDIA NeMo air a chleachdadh ann an seirbheisean guth fèin-ghluasadach MTS agus Sberbank. Tha an còd NeMo sgrìobhte ann am Python a’ cleachdadh PyTorch agus air a chuairteachadh fo chead Apache 2.0.

Source: fosgailtenet.ru

Cuir beachd ann