Mozilla Common Voice 12.0 yangilanishi

Mozilla o'zining Common Voice ma'lumotlar to'plamini 200 0 dan ortiq odamning talaffuz namunalarini o'z ichiga olgan holda yangiladi. Ma'lumotlar jamoat mulki sifatida e'lon qilinadi (CCXNUMX). Tavsiya etilgan to'plamlardan nutqni aniqlash va sintez modellarini yaratish uchun mashinani o'rganish tizimlarida foydalanish mumkin.

Oldingi yangilanish bilan taqqoslaganda, to'plamdagi nutq materialining hajmi 23.8 dan 25.8 ming soat nutqqa oshdi. Ingliz tilidagi materiallarni tayyorlashda 88 soat nutq so'zlagan (3161 ming ishtirokchi va 84 soat) 3098 mingdan ortiq kishi ishtirok etdi. Belorus tili bo'yicha to'plam 7903 ishtirokchi va 1419 soat nutq materialini (6965 ishtirokchi va 1217 soat), rus tili - 2815 ishtirokchi va 229 soat (2731 ishtirokchi va 215 soat), o'zbek tili - 2092 ishtirokchi va 262 soatni o'z ichiga oladi. 2025 ishtirokchi va 258 soat), ukrain tili - 780 ishtirokchi va 87 soat (759 ishtirokchi va 87 soat).

“Common Voice” loyihasi ovozlar va nutq uslublarining xilma-xilligini hisobga oladigan ovoz namunalari bazasini to‘plash bo‘yicha qo‘shma ishlarni tashkil etishga qaratilgan. Foydalanuvchilar ekranda ko'rsatilgan ovozli iboralarga taklif qilinadi yoki boshqa foydalanuvchilar tomonidan qo'shilgan ma'lumotlar sifatini baholaydi. Inson nutqining tipik iboralarining turli talaffuzlari yozuvlari bilan to'plangan ma'lumotlar bazasidan mashinani o'rganish tizimlarida va tadqiqot loyihalarida cheklovlarsiz foydalanish mumkin.

Manba: opennet.ru

a Izoh qo'shish