به روز رسانی Mozilla Common Voice 12.0

موزیلا مجموعه داده های Common Voice خود را به روز کرده است تا نمونه های تلفظ بیش از 200 نفر را شامل شود. داده ها به عنوان دامنه عمومی (CC0) منتشر می شود. مجموعه‌های پیشنهادی را می‌توان در سیستم‌های یادگیری ماشین برای ساخت مدل‌های تشخیص و سنتز گفتار استفاده کرد.

در مقایسه با به روز رسانی قبلی، حجم مطالب سخنرانی در مجموعه از 23.8 به 25.8 هزار ساعت سخنرانی افزایش یافته است. بیش از 88 هزار نفر در تهیه مطالب به زبان انگلیسی شرکت کردند و 3161 ساعت سخنرانی را دیکته کردند (84 هزار شرکت کننده و 3098 ساعت). مجموعه برای زبان بلاروسی شامل 7903 شرکت‌کننده و 1419 ساعت مطالب سخنرانی (6965 شرکت‌کننده و 1217 ساعت)، روسی - 2815 شرکت‌کننده و 229 ساعت (2731 شرکت‌کننده و 215 ساعت)، ازبکی - 2092 شرکت‌کننده و 262 ساعت است. 2025 شرکت‌کننده و 258 ساعت، زبان اوکراینی - 780 شرکت‌کننده و 87 ساعت (759 شرکت‌کننده و 87 ساعت بودند).

هدف پروژه Common Voice سازماندهی کار مشترک برای جمع آوری پایگاه داده ای از الگوهای صوتی است که تنوع صداها و سبک های گفتار را در نظر می گیرد. کاربران به عبارات صوتی نمایش داده شده بر روی صفحه یا ارزیابی کیفیت داده های اضافه شده توسط سایر کاربران دعوت می شوند. پایگاه داده انباشته شده با سوابق تلفظ های مختلف عبارات معمولی گفتار انسان را می توان بدون محدودیت در سیستم های یادگیری ماشین و در پروژه های تحقیقاتی استفاده کرد.

منبع: opennet.ru

اضافه کردن نظر