Ùrachadh Guth Coitcheann Mozilla 7.0

Tha NVIDIA agus Mozilla air ùrachadh fhoillseachadh air na stòran-dàta Common Voice aca, a tha a’ toirt a-steach sampallan cainnt 182 neach, suas 25% bho chionn 6 mìosan. Tha an dàta air fhoillseachadh mar raon poblach (CC0). Faodar na seataichean a thathar a’ moladh a chleachdadh ann an siostaman ionnsachaidh innealan gus modalan aithneachadh cainnt agus synthesis a thogail.

An coimeas ris an ùrachadh roimhe, tha meud an stuth cainnt sa chruinneachadh air a dhol suas bho 9 gu 13.9 mìle uair de òraid. Tha an àireamh de chànanan le taic air a dhol suas bho 60 gu 76, a’ toirt a-steach taic airson a’ chiad uair airson cànanan Bealarúisis, Kazakh, Uzbek, Bulgàiris, Armenia, Azerbaijani agus Bashkir. Tha an seata airson cànan na Ruis a 'còmhdach com-pàirtichean 2136 agus 173 uairean de stuth cainnt (bha 1412 com-pàirtiche ann agus 111 uairean), agus airson cànan na h-Ucrain - 615 com-pàirtiche agus 66 uairean (bha 459 com-pàirtiche ann agus 30 uairean).

Ghabh còrr air 75 mìle neach pàirt ann an ullachadh stuthan ann am Beurla, ag òrdachadh 2637 uair de dh ’òraid dearbhte (bha 66 mìle com-pàirtiche ann agus 1686 uairean). Gu inntinneach, is e Rwanda an cànan san dàrna àite a thaobh na tha de dhàta cruinnichte, agus chaidh 2260 uair a chruinneachadh airson sin. Tha seo air a leantainn le Gearmailtis (1040), Catalanais (920) agus Esperanto (840). Am measg an fheadhainn as adhartaiche a tha a’ meudachadh meud dàta guth tha cànan Thai (àrdachadh 20-fhillte anns a’ bhunait, bho 12 gu 250 uair), Luganda (bho 8 gu 80 uairean), Esperanto (bho 100 gu 840 uairean) agus Tamil ( bho 24 gu 220 uair) uairean).

Mar phàirt den chom-pàirteachadh anns a’ phròiseact Common Voice, dh’ullaich NVIDIA modalan deiseil deiseil airson siostaman ionnsachaidh innealan (le taic bho PyTorch) stèidhichte air an dàta a chaidh a chruinneachadh. Tha na modailean air an sgaoileadh mar phàirt den inneal NVIDIA NeMo an-asgaidh agus fosgailte, a tha, mar eisimpleir, air a chleachdadh mar-thà ann an seirbheisean guth fèin-ghluasadach MTS agus Sberbank. Tha na modailean an dùil a bhith air an cleachdadh ann an aithneachadh cainnt, synthesis cainnt, agus siostaman giullachd cànain nàdarra, agus dh’ fhaodadh iad a bhith feumail do luchd-rannsachaidh a tha a’ togail siostaman còmhraidh gnìomhaichte le guth, àrd-ùrlaran tar-sgrìobhaidh, agus ionadan gairm fèin-ghluasadach. Eu-coltach ri pròiseactan a bha rim faighinn roimhe seo, chan eil na modailean foillsichte cuingealaichte ri aithneachadh Beurla agus tha iad a’ còmhdach grunn chànanan, sràcan agus cruthan cainnte.

Cuimhnichidh sinn gu bheil am pròiseact Common Voice ag amas air co-obrachadh a chuir air dòigh gus stòr-dàta de phàtranan gutha a chruinneachadh a bheir aire do iomadachd ghuthan agus stoidhlichean cainnt. Thathas a’ toirt cuireadh do luchd-cleachdaidh abairtean guth a thaisbeanadh air an sgrion no measadh càileachd an dàta a chuir luchd-cleachdaidh eile ris. Faodar an stòr-dàta cruinnichte le clàran de dhiofar fhuaimneachadh de abairtean àbhaisteach de chainnt daonna a chleachdadh gun chuingealachaidhean ann an siostaman ionnsachaidh innealan agus ann am pròiseactan rannsachaidh.

A rèir ùghdar leabharlann aithne cainnt leantainneach Vosk, is e na h-eas-bhuannachdan a tha ann an seata Guth Coitcheann an stuth guth aon-taobhach (mar as trice fireannaich 20-30 bliadhna a dh'aois, agus dìth stuth le guthan boireannaich. , clann agus seann daoine), dìth caochlaidheachd anns an fhaclair (ath-aithris de na h-aon abairtean) agus sgaoileadh chlàran ann an cruth MP3 a tha a’ gluasad air falbh.

Source: fosgailtenet.ru

Cuir beachd ann