Mae NVIDIA yn buddsoddi $1.5 miliwn ym mhrosiect Mozilla Common Voice. Mae'r diddordeb mewn systemau adnabod lleferydd yn deillio o'r rhagfynegiad y bydd technoleg llais, o fewn y deng mlynedd nesaf, yn dod yn un o'r prif ffyrdd y mae pobl yn rhyngweithio â gwahanol ddyfeisiau, o gyfrifiaduron a ffonau i gynorthwywyr digidol a pheiriannau gwerthu.
Mae perfformiad systemau llais yn dibynnu'n fawr ar gyfaint ac amrywiaeth y data llais sydd ar gael ar gyfer hyfforddi modelau dysgu peirianyddol. Mae technolegau llais cyfredol yn canolbwyntio'n bennaf ar adnabod Saesneg ac nid ydynt yn cwmpasu ystod eang o ieithoedd, acenion a phatrymau lleferydd. Bydd buddsoddiadau'n helpu i gyflymu twf data llais sydd ar gael yn gyhoeddus, yn ymgysylltu â mwy o gymunedau a gwirfoddolwyr, ac yn ehangu nifer y staff prosiect llawn amser.
Gadewch inni eich atgoffa mai nod prosiect Common Voice yw trefnu gwaith ar y cyd i gronni cronfa ddata o batrymau llais sy’n ystyried amrywiaeth lleisiau ac arddulliau lleferydd. Gwahoddir defnyddwyr i leisio ymadroddion a ddangosir ar y sgrin neu werthuso ansawdd y data a ychwanegir gan ddefnyddwyr eraill. Gellir defnyddio'r gronfa ddata gronedig gyda chofnodion o wahanol ynganiadau ymadroddion nodweddiadol o lefaru dynol heb gyfyngiadau mewn systemau dysgu peirianyddol ac mewn prosiectau ymchwil.
Ar hyn o bryd mae set ddata Common Voice yn cynnwys samplau ynganiad gan dros 164 o bobl, sy'n cynnwys tua 9 awr o ddata llais mewn 60 iaith wahanol. Mae set ddata Rwsieg yn cynnwys 1412 o gyfranogwyr a 111 awr o ddeunydd lleferydd, tra bod set ddata Wcreineg yn cynnwys 459 o gyfranogwyr a 30 awr. I gymharu, cyfrannodd dros 66 o bobl 1686 awr o leferydd wedi'i wirio i'r set ddata Saesneg. Gellir defnyddio'r setiau data hyn mewn systemau dysgu peirianyddol i adeiladu modelau adnabod a synthesis lleferydd. Cyhoeddir y data yn y parth cyhoeddus (CC0).
Yn ôl awdur llyfrgell adnabod lleferydd parhaus Vosk, anfanteision set Common Voice yw unochrogrwydd y deunydd llais (goruchafiaeth dynion 20-30 oed, a diffyg deunydd gyda lleisiau menywod , plant a'r henoed), y diffyg amrywioldeb yn y geiriadur (ailadrodd yr un ymadroddion) a dosbarthu recordiadau yn y fformat MP3 ystumio.
Ffynhonnell: opennet.ru
