Mae NVIDIA yn buddsoddi $1.5 miliwn ym mhrosiect Mozilla Common Voice

Mae NVIDIA yn buddsoddi $1.5 miliwn ym mhrosiect Mozilla Common Voice. Mae diddordeb mewn systemau adnabod lleferydd yn deillio o'r rhagfynegiad y bydd technoleg llais yn dod yn un o'r prif ffyrdd y bydd pobl yn rhyngweithio â dyfeisiau sy'n amrywio o gyfrifiaduron a ffonau i gynorthwywyr digidol a chiosgau dros y deng mlynedd nesaf.

Mae perfformiad systemau llais yn ddibynnol iawn ar gyfaint ac amrywiaeth y data llais sydd ar gael ar gyfer hyfforddi modelau dysgu peiriannau. Mae technoleg llais heddiw yn canolbwyntio'n bennaf ar adnabod Saesneg ac nid yw'n cwmpasu'r amrywiaeth eang o ieithoedd, acenion a phatrymau lleferydd. Bydd y buddsoddiad yn helpu i gyflymu twf data llais y cyhoedd, ymgysylltu â mwy o gymunedau a gwirfoddolwyr, ac ehangu nifer y staff prosiect amser llawn.

Gadewch inni eich atgoffa mai nod prosiect Common Voice yw trefnu gwaith ar y cyd i gronni cronfa ddata o batrymau llais sy’n ystyried amrywiaeth lleisiau ac arddulliau lleferydd. Gwahoddir defnyddwyr i leisio ymadroddion a ddangosir ar y sgrin neu werthuso ansawdd y data a ychwanegir gan ddefnyddwyr eraill. Gellir defnyddio'r gronfa ddata gronedig gyda chofnodion o wahanol ynganiadau ymadroddion nodweddiadol o lefaru dynol heb gyfyngiadau mewn systemau dysgu peirianyddol ac mewn prosiectau ymchwil.

Mae set Common Voice ar hyn o bryd yn cynnwys enghreifftiau o ynganu gan dros 164 o bobl. Mae tua 9 mil awr o ddata llais wedi'i gronni mewn 60 o ieithoedd gwahanol. Mae'r set ar gyfer yr iaith Rwsieg yn cynnwys 1412 o gyfranogwyr a 111 awr o ddeunydd llafar, ac ar gyfer yr iaith Wcreineg - 459 o gyfranogwyr a 30 awr. Er mwyn cymharu, cymerodd mwy na 66 mil o bobl ran yn y gwaith o baratoi deunyddiau yn Saesneg, gan bennu 1686 awr o araith wedi'i dilysu. Gellir defnyddio'r setiau arfaethedig mewn systemau dysgu peirianyddol i adeiladu modelau adnabod lleferydd a synthesis. Cyhoeddir y data fel parth cyhoeddus (CC0).

Yn ôl awdur llyfrgell adnabod lleferydd parhaus Vosk, anfanteision set Common Voice yw unochrogrwydd y deunydd llais (goruchafiaeth dynion 20-30 oed, a diffyg deunydd gyda lleisiau menywod , plant a'r henoed), y diffyg amrywioldeb yn y geiriadur (ailadrodd yr un ymadroddion) a dosbarthu recordiadau yn y fformat MP3 ystumio.

Ffynhonnell: opennet.ru

Ychwanegu sylw