Mozilla Common Voice 12.0 шинэчлэлт

Mozilla 200 гаруй хүний ​​дуудлагын дээжийг оруулахын тулд Common Voice мэдээллийн багцаа шинэчилсэн. Мэдээллийг нийтийн домэйн (CC0) болгон нийтэлсэн. Санал болгож буй багцуудыг яриа таних болон синтезийн загваруудыг бүтээхэд машин сургалтын системд ашиглаж болно.

Өмнөх шинэчлэлтэй харьцуулахад цуглуулгын ярианы материалын хэмжээ 23.8-аас 25.8 мянган цаг болж өссөн байна. Англи хэл дээр материал бэлтгэхэд 88 мянга гаруй хүн оролцож, 3161 цаг илтгэл тавьсан (84 мянган оролцогч, 3098 цаг). Беларусь хэлний багцад 7903 оролцогч, 1419 цагийн ярианы материал (6965 оролцогч, 1217 цаг), Орос хэл - 2815 оролцогч, 229 цаг (2731 оролцогч, 215 цаг), Узбек хэл - 2092 оролцогч, 262 цаг ( 2025 оролцогч, 258 цаг), Украин хэл - 780 оролцогч, 87 цаг (759 оролцогч, 87 цаг).

“Common Voice” төсөл нь дуу хоолой, ярианы хэв маягийн олон талт байдлыг харгалзан дуу хоолойны хэв маягийн мэдээллийн санг бүрдүүлэх хамтарсан ажлыг зохион байгуулах зорилготой юм. Хэрэглэгчдийг дэлгэцэн дээр харуулсан дуут хэллэг эсвэл бусад хэрэглэгчдийн нэмсэн өгөгдлийн чанарыг үнэлэхийг урьж байна. Хүний ярианы ердийн хэллэгүүдийн янз бүрийн дуудлагын бүртгэл бүхий хуримтлагдсан мэдээллийн санг машин сургалтын систем болон судалгааны төслүүдэд хязгаарлалтгүйгээр ашиглах боломжтой.

Эх сурвалж: opennet.ru

сэтгэгдэл нэмэх