به روز رسانی Mozilla Common Voice 9.0

موزیلا یک به روز رسانی به مجموعه داده های Common Voice خود ارائه کرده است که شامل نمونه های تلفظی از حدود 200 نفر است. داده ها به عنوان دامنه عمومی (CC0) منتشر می شود. مجموعه‌های پیشنهادی را می‌توان در سیستم‌های یادگیری ماشین برای ساخت مدل‌های تشخیص و سنتز گفتار استفاده کرد.

در مقایسه با به روز رسانی قبلی، حجم مطالب سخنرانی در مجموعه 10٪ افزایش یافت - از 18.2 به 20.2 هزار ساعت گفتار. تعداد زبان های پشتیبانی شده از 87 به 93 افزایش یافته است. برای 27 زبان، بیش از 100 ساعت داده گفتاری جمع آوری شده است، و برای 9 - بیش از 500 ساعت داده گفتاری جمع آوری شده است. برای 9 زبان نیز امکان دستیابی به سهم گفتار زنانه حداقل 45٪ وجود داشت.

بیش از 81 هزار نفر در تهیه مطالب به زبان انگلیسی شرکت کردند و 2953 ساعت سخنرانی را دیکته کردند (79 هزار شرکت کننده و 2886 ساعت). این مجموعه برای زبان بلاروسی شامل 6326 شرکت‌کننده و 1054 ساعت مطالب سخنرانی (6160 شرکت‌کننده و 987 ساعت)، روسی - 2585 شرکت‌کننده و 201 ساعت (2452 شرکت‌کننده و 193 ساعت)، ازبکی - 1503 شرکت‌کننده و 231 ساعت است. 1355 شرکت کننده و 227 ساعت، زبان اوکراینی - 696 شرکت کننده و 79 ساعت (684 شرکت کننده و 76 ساعت وجود داشت).

هدف پروژه Common Voice سازماندهی کار مشترک برای جمع آوری پایگاه داده ای از الگوهای صوتی است که تنوع صداها و سبک های گفتار را در نظر می گیرد. کاربران به عبارات صوتی نمایش داده شده بر روی صفحه یا ارزیابی کیفیت داده های اضافه شده توسط سایر کاربران دعوت می شوند. پایگاه داده انباشته شده با سوابق تلفظ های مختلف عبارات معمولی گفتار انسان را می توان بدون محدودیت در سیستم های یادگیری ماشین و در پروژه های تحقیقاتی استفاده کرد.

منبع: opennet.ru

اضافه کردن نظر