NVIDIA inawekeza $1.5 milioni katika mradi wa Mozilla Common Voice

NVIDIA inawekeza $1.5 milioni katika mradi wa Mozilla Common Voice. Kuvutiwa na mifumo ya utambuzi wa usemi kunatokana na utabiri kwamba katika miaka kumi ijayo, teknolojia ya sauti itakuwa mojawapo ya njia kuu za watu kutumia vifaa kuanzia kompyuta na simu hadi visaidizi vya kidijitali na vibanda.

Utendaji wa mifumo ya sauti unategemea sana sauti na anuwai ya data ya sauti inayopatikana kwa miundo ya mafunzo ya mashine. Teknolojia ya leo ya sauti inalenga zaidi utambuzi wa lugha ya Kiingereza na haijumuishi safu nyingi za lugha, lafudhi na mifumo ya usemi. Uwekezaji huo utasaidia kuharakisha ukuaji wa data ya sauti ya umma, kushirikisha jumuiya zaidi na watu wanaojitolea, na kupanua idadi ya wafanyakazi wa muda wote wa mradi.

Hebu tukumbushe kwamba mradi wa Sauti ya Kawaida unalenga kuandaa kazi ya pamoja ili kukusanya hifadhidata ya mifumo ya sauti ambayo inazingatia utofauti wa sauti na mitindo ya usemi. Watumiaji wanaalikwa kutoa vifungu vya sauti vinavyoonyeshwa kwenye skrini au kutathmini ubora wa data iliyoongezwa na watumiaji wengine. Hifadhidata iliyokusanywa yenye rekodi za matamshi mbalimbali ya vishazi vya kawaida vya usemi wa binadamu inaweza kutumika bila vikwazo katika mifumo ya kujifunza kwa mashine na katika miradi ya utafiti.

Seti ya Sauti ya Kawaida kwa sasa inajumuisha mifano ya matamshi kutoka kwa zaidi ya watu 164. Takriban saa elfu 9 za data ya sauti imekusanywa katika lugha 60 tofauti. Seti ya lugha ya Kirusi inashughulikia washiriki 1412 na masaa 111 ya nyenzo za hotuba, na kwa lugha ya Kiukreni - washiriki 459 na masaa 30. Kwa kulinganisha, zaidi ya watu elfu 66 walishiriki katika utayarishaji wa vifaa kwa Kiingereza, wakiamuru masaa 1686 ya hotuba iliyothibitishwa. Seti zinazopendekezwa zinaweza kutumika katika mifumo ya kujifunza ya mashine ili kujenga utambuzi wa usemi na miundo ya usanisi. Data inachapishwa kama kikoa cha umma (CC0).

Kulingana na mwandishi wa maktaba inayoendelea ya utambuzi wa hotuba ya Vosk, ubaya wa seti ya Sauti ya Kawaida ni upande mmoja wa nyenzo za sauti (ukubwa wa wanaume wenye umri wa miaka 20-30, na ukosefu wa nyenzo na sauti za wanawake. , watoto na wazee), ukosefu wa kutofautiana katika kamusi (kurudia misemo sawa) na usambazaji wa rekodi katika muundo wa MP3 unaopotosha.

Chanzo: opennet.ru

Kuongeza maoni