Mozilla Common Voice 20 yangilanishi

Mozilla o'zining Common Voice ma'lumotlar to'plamini 200 0 dan ortiq odamning talaffuz namunalarini o'z ichiga olgan holda yangiladi. Ma'lumotlar jamoat mulki sifatida e'lon qilinadi (CC32.6). Tavsiya etilgan to'plamlardan nutqni aniqlash va sintez modellarini yaratish uchun mashinani o'rganish tizimlarida foydalanish mumkin. Oldingi yangilanish bilan taqqoslaganda, to'plamdagi nutq materialining hajmi 33.1 dan 22.1 ming soat nutqqa oshdi, shundan 129 ming soati tekshirish tartibidan o'tdi. Qo'llab-quvvatlanadigan tillar soni Aragonese, Isindebele, Janubiy Soto va Tupuri qo'shilishi bilan 133 dan XNUMX gacha ko'tarildi.

Ingliz tilidagi materiallarni tayyorlashda 94.9 soat nutq so‘zlagan holda 3631 ming kishi ishtirok etdi (93.9 ming ishtirokchi va 3587 soat). Belorus tili bo'yicha to'plam 8521 ishtirokchi va 1860 soat nutq materialini (8444 ishtirokchi va 1846 soat), rus tili - 3365 ishtirokchi va 281 soat (3296 ishtirokchi va 278 soat), o'zbek tili - 2211 ishtirokchi va 265 soatni qamrab oladi. 2200 ishtirokchi va 265 soat), ukrain tili - 1120 ishtirokchi va 114 soat (1104 ishtirokchi va 114 soat).

“Common Voice” loyihasi ovozlar va nutq uslublarining xilma-xilligini hisobga oladigan ovoz namunalari bazasini to‘plash bo‘yicha qo‘shma ishlarni tashkil etadi. Foydalanuvchilar ekranda ko'rsatilgan ovozli iboralarga taklif qilinadi yoki boshqa foydalanuvchilar tomonidan qo'shilgan ma'lumotlar sifatini baholaydi. Inson nutqining tipik iboralarining turli talaffuzlari yozuvlari bilan to'plangan ma'lumotlar bazasidan mashinani o'rganish tizimlarida va tadqiqot loyihalarida cheklovlarsiz foydalanish mumkin.

Manba: opennet.ru

DDoS himoyasi, VPS VDS serverlari bo'lgan saytlar uchun ishonchli hosting sotib oling 🔥 DDoS himoyasi, VPS VDS serverlari bilan ishonchli veb-sayt xostingini sotib oling | ProHoster