موزیلا مجموعه داده های Common Voice خود را به روز کرده است تا نمونه های تلفظ بیش از 200 نفر را شامل شود. داده ها به عنوان دامنه عمومی (CC0) منتشر می شود. مجموعههای پیشنهادی را میتوان در سیستمهای یادگیری ماشین برای ساخت مدلهای تشخیص و سنتز گفتار استفاده کرد.
در مقایسه با به روز رسانی قبلی، حجم مطالب سخنرانی در مجموعه از 23.8 به 25.8 هزار ساعت سخنرانی افزایش یافته است. بیش از 88 هزار نفر در تهیه مطالب به زبان انگلیسی شرکت کردند و 3161 ساعت سخنرانی را دیکته کردند (84 هزار شرکت کننده و 3098 ساعت). مجموعه برای زبان بلاروسی شامل 7903 شرکتکننده و 1419 ساعت مطالب سخنرانی (6965 شرکتکننده و 1217 ساعت)، روسی - 2815 شرکتکننده و 229 ساعت (2731 شرکتکننده و 215 ساعت)، ازبکی - 2092 شرکتکننده و 262 ساعت است. 2025 شرکتکننده و 258 ساعت، زبان اوکراینی - 780 شرکتکننده و 87 ساعت (759 شرکتکننده و 87 ساعت بودند).
هدف پروژه Common Voice سازماندهی کار مشترک برای جمع آوری پایگاه داده ای از الگوهای صوتی است که تنوع صداها و سبک های گفتار را در نظر می گیرد. کاربران به عبارات صوتی نمایش داده شده بر روی صفحه یا ارزیابی کیفیت داده های اضافه شده توسط سایر کاربران دعوت می شوند. پایگاه داده انباشته شده با سوابق تلفظ های مختلف عبارات معمولی گفتار انسان را می توان بدون محدودیت در سیستم های یادگیری ماشین و در پروژه های تحقیقاتی استفاده کرد.
منبع: opennet.ru