🥇Mozilla Common Voice 8.0 Mmelite

Mozilla ewepụtala mmelite na ntọala data nkịtị Voice ya, nke gụnyere nlele ịkpọ okwu sitere na ihe fọrọ nke nta ka ọ bụrụ mmadụ 200. Ebipụtara data a dị ka ngalaba ọha (CC0). Enwere ike iji setịpụ ndị a tụrụ aro na sistemụ mmụta igwe iji wuo njirimara okwu na ụdị njikọ. E jiri ya tụnyere mmelite gara aga, olu okwu okwu na nchịkọta mụbara site na 30% - site na 13.9 ruo 18.2 puku awa okwu. Ọnụ ọgụgụ asụsụ ndị akwadoro amụbaala site na 67 ruo 87.

Ntọala maka asụsụ Russian na-ekpuchi ndị sonyere 2452 na awa 193 nke okwu okwu (e nwere ndị sonyere 2136 na awa 173), maka asụsụ Belarusian - ndị sonyere 6160 na awa 987 (ndị sonyere 3831 na awa 356), maka asụsụ Ukraine - Ndị sonyere 684 na awa 76 (nwere ndị sonyere 615 na awa 66). Ihe karịrị puku mmadụ 79 na-ekere òkè na nkwadebe nke ihe na English, na-ekwupụta 2886 awa nke okwu kwadoro (e nwere 75 puku ndị sonyere na 2637 awa).

Ka anyị chetara gị na ọrụ olu nkịtị bụ n'ịhazi ọrụ nkwonkwo iji kpokọta nchekwa data nke ụkpụrụ olu na-eburu n'uche ụdị olu na ụdị okwu dị iche iche. A na-akpọ ndị ọrụ òkù ka ha bịa na nkebiokwu olu egosiri na ihuenyo ma ọ bụ nyochaa ogo data nke ndị ọrụ ndị ọzọ gbakwunyere. Enwere ike iji nchekwa data chịkọbara nwere ndekọ dị iche iche nke mkpọpụta nkebiokwu nke okwu mmadụ na-enweghị mgbochi na sistemụ mmụta igwe yana n'ọrụ nyocha. Dị ka onye na-ede akwụkwọ nke Vosk na-aga n'ihu na-amata ọbá akwụkwọ, adịghị ike nke Common Voice set bụ otu akụkụ nke olu ihe (ibu nke ndị ikom 20-30 afọ, na enweghị ihe onwunwe na olu nke ndị inyom. , ụmụaka na ndị agadi), enweghị mgbanwe dị na akwụkwọ ọkọwa okwu (nkwugharị nke otu ahịrịokwu) na nkesa nke ndekọ na usoro MP3 na-agbagọ.

Ọzọkwa, anyị nwere ike ịhụ ntọhapụ nke NVIDIA NeMo 1.6 Toolkit, nke na-enye usoro mmụta igwe maka ịmepụta usoro njirimara okwu, njikọ okwu na nhazi asụsụ okike. NeMo na-agụnye ụdị a zụrụ azụ maka usoro mmụta igwe dabere na PyTorch framework, nke NVIDIA kwadoro site na iji data okwu nkịtị na-ekpuchi asụsụ dị iche iche, ụda olu na ụdị okwu. Ụdị ahụ nwere ike ịba uru maka ndị nchọpụta na-emepụta usoro mkparịta ụka dabere na olu, nyiwe ederede, na ebe oku na-akpaghị aka. Dịka ọmụmaatụ, a na-eji NVIDIA NeMo na ọrụ olu akpaghị aka nke MTS na Sberbank. Edere koodu NeMo na Python site na iji PyTorch wee kesaa n'okpuru ikike Apache 2.0.

isi: opennet.ru

Mmelite 8.0 Mozilla nkịtị

ProHoster