Fanavaozana ny Mozilla Common Voice 7.0

NVIDIA sy Mozilla dia namoaka fanavaozam-baovao ho an'ny angon-drakitra Common Voice, izay ahitana santionany kabary 182, niakatra 25% raha 6 volana lasa izay. Ny angona dia navoaka ho sehatra ho an'ny daholobe (CC0). Ireo andiany naroso dia azo ampiasaina amin'ny rafitra fianarana milina mba hananganana modely amin'ny fanekena kabary sy synthesis.

Raha oharina amin'ny fanavaozana teo aloha, ny haben'ny fitaovana lahateny ao amin'ny fanangonana dia nitombo avy amin'ny 9 ka hatramin'ny 13.9 arivo ora fitenenana. Nitombo avy amin'ny 60 ka hatramin'ny 76 ny isan'ny fiteny tohanana, anisan'izany ny fanohanana voalohany ny fiteny Belarosiana, Kazakh, Ozbek, Boligara, Armeniana, Azerbaijani ary Bashkir. Ny setroka ho an'ny teny Rosiana dia mandrakotra mpandray anjara 2136 sy 173 ora ny lahateny (nisy mpandray anjara 1412 sy 111 ora), ary ho an'ny fiteny Okrainiana - mpandray anjara 615 sy 66 ora (nisy mpandray anjara 459 sy 30 ora).

Maherin'ny 75 arivo ny olona nandray anjara tamin'ny fanomanana ny fitaovana amin'ny teny anglisy, nibaiko 2637 ora ny kabary voamarina (nisy mpandray anjara 66 arivo sy 1686 ora). Mahaliana fa ny fiteny eo amin'ny laharana faharoa amin'ny lafin'ny angon-drakitra voaangona dia Rwanda, izay 2260 ora no nangonina. Manaraka izany ny Alemana (1040), ny Catalan (920) ary ny Esperanto (840). Anisan'ny mampitombo mavitrika indrindra ny haben'ny angon-drakitra ny feo dia ny fiteny Thai (fitomboana 20 heny amin'ny fototra, 12 ka hatramin'ny 250 ora), Luganda (avy amin'ny 8 ka hatramin'ny 80 ora), Esperanto (100 ka hatramin'ny 840 ora) ary Tamil ( manomboka amin'ny 24 ka hatramin'ny 220 ora).

Ao anatin'ny fandraisany anjara amin'ny tetikasa Common Voice, NVIDIA dia nanomana modely efa voaofana ho an'ny rafitra fianarana milina (tohanan'i PyTorch) mifototra amin'ny angona voaangona. Ireo modely dia zaraina ho ampahany amin'ny fitaovana maimaim-poana sy misokatra NVIDIA NeMo, izay, ohatra, dia efa ampiasaina amin'ny serivisy feo mandeha ho azy MTS sy Sberbank. Ireo maodely ireo dia natao hampiasaina amin'ny fanekena kabary, synthesis kabary, ary rafitra fanodinana fiteny voajanahary, ary mety ho ilaina ho an'ny mpikaroka amin'ny fananganana rafitra fifanakalozan-dresaka, sehatra fandikan-teny, ary foibe fiantsoana mandeha ho azy. Tsy toy ny tetikasa efa nisy teo aloha, ireo maodely navoaka dia tsy voafetra ho amin'ny fanekena ny teny anglisy ary mandrakotra fiteny isan-karazany, lantom-peo ary endrika fitenenana.

MamelΓ  anay hampahatsiahy anao fa ny tetikasa Common Voice dia mikendry ny handamina ny fiaraha-miasa mba hanangonana angon-drakitra momba ny lamin'ny feo izay mandinika ny fahasamihafan'ny feo sy ny fomba fitenenana. Ny mpampiasa dia asaina amin'ny fehezanteny misy feo aseho eo amin'ny efijery na manombantombana ny kalitaon'ny angona nampian'ny mpampiasa hafa. Ny angon-drakitra voaangona miaraka amin'ny firaketana fanononana isan-karazany amin'ny andian-teny mahazatra amin'ny tenin'olombelona dia azo ampiasaina tsy misy famerana amin'ny rafitra fianarana milina sy amin'ny tetikasa fikarohana.

Araka ny voalazan'ny mpanoratra ny Vosk Continuous Speech Recognition Library, ny tsy fahampian'ny Common Voice set dia ny tsy fitovian'ny fitaovana amin'ny feo (ny fanjakazakan'ny lehilahy 20-30 taona, ary ny tsy fahampian'ny fitaovana miaraka amin'ny feon'ny vehivavy. , ankizy sy antitra), ny tsy fisian'ny fiovaovana ao amin'ny rakibolana (famerimberenan'ireo andian-teny mitovy) ary ny fizarana raki-peo amin'ny endrika MP3 manodinkodina.

Source: opennet.ru

Add a comment