Fanavaozana ny Mozilla Common Voice 8.0

Mozilla dia namoaka fanavaozam-baovao ho an'ny angona Common Voice, izay ahitana santionan'ny fanononana avy amin'ny olona efa ho 200. Ny angona dia navoaka ho sehatra ho an'ny daholobe (CC0). Ireo andiany natolotra dia azo ampiasaina amin'ny rafitra fianarana milina mba hananganana modely amin'ny fanekena kabary sy synthesis. Raha oharina amin'ny fanavaozana teo aloha dia nitombo 30% ny habetsaky ny lahateny tao amin'ny fanangonana - avy amin'ny 13.9 ka hatramin'ny 18.2 arivo ora fitenenana. Nitombo 67 ka hatramin'ny 87 ny isan'ny fiteny tohana.

Ny setroka ho an'ny teny Rosiana dia mandrakotra mpandray anjara 2452 sy 193 ora ny lahateny (nisy mpandray anjara 2136 ary 173 ora), ho an'ny fiteny Belarosiana - 6160 mpandray anjara ary 987 ora (nisy mpandray anjara 3831 ary 356 ora), ho an'ny fiteny Okrainiana - 684 ny mpandray anjara ary 76 ora (615 ny mpandray anjara ary 66 ora). Maherin'ny 79 ny olona nandray anjara tamin'ny fanomanana ny fitaovana amin'ny teny anglisy, nibaiko 2886 ora ny kabary voamarina (nisy mpandray anjara 75 arivo sy 2637 ora).

MamelΓ  anay hampahatsiahy anao fa ny tetikasa Common Voice dia mikendry ny handamina ny fiaraha-miasa mba hanangonana angon-drakitra momba ny lamin'ny feo izay mandinika ny fahasamihafan'ny feo sy ny fomba fitenenana. Ny mpampiasa dia asaina amin'ny fehezanteny misy feo aseho eo amin'ny efijery na manombantombana ny kalitaon'ny angona nampian'ny mpampiasa hafa. Ny angon-drakitra voaangona miaraka amin'ny firaketana fanononana isan-karazany amin'ny andian-teny mahazatra amin'ny tenin'olombelona dia azo ampiasaina tsy misy famerana amin'ny rafitra fianarana milina sy amin'ny tetikasa fikarohana. Araka ny voalazan'ny mpanoratra ny Vosk Continuous Speech Recognition Library, ny tsy fahampian'ny Common Voice set dia ny tsy fitovian'ny fitaovana amin'ny feo (ny fanjakazakan'ny lehilahy 20-30 taona, ary ny tsy fahampian'ny fitaovana miaraka amin'ny feon'ny vehivavy. , ankizy sy antitra), ny tsy fisian'ny fiovaovana ao amin'ny rakibolana (famerimberenan'ireo andian-teny mitovy) ary ny fizarana raki-peo amin'ny endrika MP3 manodinkodina.

Ho fanampin'izay, azontsika atao ny manamarika ny famoahana ny fitaovana NVIDIA NeMo 1.6, izay manome fomba fianarana milina amin'ny famoronana rafitra famantarana ny kabary, synthesis kabary ary fanodinana fiteny voajanahary. Ny NeMo dia ahitana maodely voaofana efa vonona ho an'ny rafitra fianarana milina mifototra amin'ny rafitra PyTorch, nomanin'ny NVIDIA amin'ny fampiasana angona kabary Common Voice ary mandrakotra fiteny isan-karazany, lantom-peo ary endrika fitenenana. Ireo maodely dia mety ilaina ho an'ny mpikaroka amin'ny famolavolana rafitra fifanakalozan-kevitra mifototra amin'ny feo, sehatra fandikana, ary ivom-pivoriana mandeha ho azy. Ohatra, NVIDIA NeMo dia ampiasaina amin'ny serivisy feo mandeha ho azy amin'ny MTS sy Sberbank. Ny kaody NeMo dia nosoratana tamin'ny Python mampiasa PyTorch ary zaraina amin'ny alΓ lan'ny lisansa Apache 2.0.

Source: opennet.ru

Add a comment