NVIDIA tinvesti $1.5 miljun fil-proġett Mozilla Common Voice

NVIDIA qed tinvesti $1.5 miljun fil-proġett Mozilla Common Voice. L-interess fis-sistemi ta’ rikonoxximent tad-diskors ġej mit-tbassir li matul l-għaxar snin li ġejjin, it-teknoloġija tal-vuċi se ssir waħda mill-modi ewlenin kif in-nies jinteraġixxu ma’ apparat li jvarja minn kompjuters u telefowns għal assistenti diġitali u kjosks.

Il-prestazzjoni tas-sistemi tal-vuċi hija dipendenti ħafna fuq il-volum u l-varjetà tad-dejta tal-vuċi disponibbli għat-taħriġ tal-mudelli tat-tagħlim tal-magni. It-teknoloġija tal-vuċi tal-lum tiffoka primarjament fuq ir-rikonoxximent tal-lingwa Ingliża u ma tkoprix il-firxa vasta ta’ lingwi, aċċenti, u xejriet tad-diskors. L-investiment se jgħin biex jaċċellera t-tkabbir tad-dejta tal-vuċi pubblika, jinvolvi aktar komunitajiet u voluntiera, u jespandi n-numru ta 'persunal tal-proġett full-time.

Ejjew infakkru li l-proġett Common Voice huwa mmirat biex jorganizza ħidma konġunta biex jakkumula database ta’ mudelli tal-vuċi li tqis id-diversità tal-vuċijiet u stili ta’ diskors. L-utenti huma mistiedna biex vuċi frażijiet murija fuq l-iskrin jew jevalwaw il-kwalità tad-dejta miżjuda minn utenti oħra. Id-database akkumulata b'rekords ta 'diversi pronunzji ta' frażijiet tipiċi ta 'diskors tal-bniedem tista' tintuża mingħajr restrizzjonijiet f'sistemi ta 'tagħlim bil-magni u fi proġetti ta' riċerka.

Is-sett tal-Vuċi Komuni bħalissa jinkludi eżempji ta’ pronunzja minn aktar minn 164 persuna. Madwar 9 elef siegħa ta 'dejta tal-vuċi ġew akkumulati f'60 lingwa differenti. Is-sett għall-lingwa Russa jkopri 1412 parteċipant u 111-il siegħa ta 'materjal ta' diskors, u għall-lingwa Ukraina - 459 parteċipant u 30 siegħa. Għal tqabbil, aktar minn 66 elf ruħ ħadu sehem fil-preparazzjoni ta 'materjali bl-Ingliż, li jiddettaw 1686 siegħa ta' diskors verifikat. Is-settijiet proposti jistgħu jintużaw f'sistemi ta 'tagħlim tal-magni biex jinbnew mudelli ta' rikonoxximent u sintesi tad-diskors. Id-dejta hija ppubblikata bħala dominju pubbliku (CC0).

Skond l-awtur tal-librerija ta 'rikonoxximent tad-diskors kontinwu Vosk, l-iżvantaġġi tas-sett tal-Vuċi Komuni huma l-one-sidedness tal-materjal tal-vuċi (il-predominanza ta' nies irġiel 20-30 sena, u n-nuqqas ta 'materjal bil-vuċijiet tan-nisa , tfal u anzjani), in-nuqqas ta’ varjabbiltà fid-dizzjunarju (ripetizzjoni tal-istess frażijiet) u d-distribuzzjoni ta’ reġistrazzjonijiet fil-format MP3 li jgħawġu.

Sors: opennet.ru

Żid kumment