Mozilla Common Voice 7.0 Nûvekirin

NVIDIA û Mozilla nûvekirinek danehevên Dengê Hevbeş, ku tê de 182 nimûneyên axaftinê yên mirovan vedihewîne, li gorî 25 meh berê 6% zêde bûye. Daneyên wekî qada gelemperî (CC0) têne weşandin. Komên pêşniyarkirî dikarin di pergalên fêrbûna makîneyê de werin bikar anîn da ku modelên naskirina axaftinê û hevrêziyê ava bikin.

Li gorî nûvekirina berê, mezinahiya materyalên axaftinê yên di berhevokê de ji 9-an gihîştiye 13.9 hezar demjimêrên axaftinê. Hejmara zimanên destekkirî ji 60-an gihîştiye 76-an, di nav de yekem car piştgirî ji bo zimanên Belarûsî, Kazakistanî, Ozbekkî, Bulgarî, Ermenî, Azerî û Başkîrî jî heye. Set ji bo zimanê rûsî 2136 beşdaran û 173 saetan materyalê axaftinê digire (1412 beşdar û 111 saet hebûn), û ji bo zimanê Ukraynî - 615 beşdar û 66 demjimêran (459 beşdar û 30 saet hebûn).

Zêdetirî 75 hezar kes beşdarî amadekirina materyalên bi îngilîzî bûn, 2637 demjimêrên axaftinê yên piştrast kirin (66 hezar beşdar û 1686 saet hebûn). Hêjayî balkişandinê ye ku zimanê di rêza duyemîn de di warê hejmara daneyên berhevkirî de Rwanda ye ku ji bo wê 2260 saet hatine berhev kirin. Li pey Almanî (1040), Katalanî (920) û esperanto (840) tê. Di nav yên herî dînamîk de ku mezinahiya daneyên deng zêde dibin zimanê Taylandî (20 qat zêdebûn di bingehê de, ji 12 heta 250 demjimêran), Luganda (ji 8 heta 80 demjimêran), esperanto (ji 100 heya 840 demjimêran) û Tamîlî ( ji saet 24 heta 220 saetan).

Wekî beşek ji beşdarbûna xwe ya di projeya Common Voice de, NVIDIA li ser bingeha daneyên berhevkirî ji bo pergalên fêrbûna makîneyê (piştevaniya PyTorch) modelên perwerdekirî yên amade amade kir. Model wekî beşek amûrek belaş û vekirî ya NVIDIA NeMo, ku, mînakî, berê di karûbarên dengê otomatîk ên MTS û Sberbank de tê bikar anîn, têne belav kirin. Model ji bo karanîna di naskirina axaftinê, senteza axaftinê, û pergalên pêvajoya zimanê xwezayî de têne bikar anîn, û dibe ku ji bo lêkolînerên ku pergalên diyalogê yên aktîfkirî yên deng, platformên veguheztinê, û navendên bangê yên otomatîk ava dikin kêrhatî bin. Berevajî projeyên berê yên berdest, modelên hatine weşandin tenê bi naskirina zimanê îngilîzî re sînordar nînin û cûrbecûr ziman, devok û formên axaftinê vedigirin.

Werin em bînin bîra we ku projeya Dengê Hevbeş organîzekirina xebata hevbeş e ji bo berhevkirina databasek ji qalibên dengan ku cihêrengiya dengan û şêwazên axaftinê li ber çavan digire. Bikarhêner têne vexwendin ku bêjeyên dengî yên ku li ser ekranê têne xuyang kirin an jî kalîteya daneya ku ji hêla bikarhênerên din ve hatî zêdekirin dinirxînin. Databasa berhevkirî ya bi tomarên bilêvkirinên cihêreng ên biwêjên tîpîk ên axaftina mirovî dikare di pergalên fêrbûna makîneyê û di projeyên lêkolînê de bê sînor were bikar anîn.

Li gorî nivîskarê pirtûkxaneya naskirina axaftina berdewam a Vosk, kêmasiyên koma Dengê Hevbeş yekalîbûna materyalê deng e (serdestiya mêrên 20-30 salî, û kêmbûna materyalên bi dengê jinan. , zarok û extiyar), nebûna guhêrbariya ferhengê (dubarekirina heman hevokan) û belavkirina tomarên bi formata MP3 ya berovajîkirî.

Source: opennet.ru

Add a comment