تحديث Mozilla Common Voice 8.0

أصدرت Mozilla تحديثًا لمجموعات بيانات Common Voice، والتي تتضمن عينات نطق لما يقرب من 200 شخص. يتم نشر البيانات كمجال عام (CC0). يمكن استخدام المجموعات المقترحة في أنظمة التعلم الآلي لبناء نماذج التعرف على الكلام وتركيبه. بالمقارنة مع التحديث السابق، زاد حجم مادة الكلام في المجموعة بنسبة 30٪ - من 13.9 إلى 18.2 ألف ساعة من الكلام. ارتفع عدد اللغات المدعومة من 67 إلى 87.

تغطي مجموعة اللغة الروسية 2452 مشاركًا و193 ساعة من مادة الكلام (كان هناك 2136 مشاركًا و173 ساعة)، للغة البيلاروسية - 6160 مشاركًا و987 ساعة (كان هناك 3831 مشاركًا و356 ساعة) للغة الأوكرانية - 684 مشاركاً و 76 ساعة (كان هناك 615 مشاركاً و 66 ساعة). شارك أكثر من 79 ألف شخص في إعداد المواد باللغة الإنجليزية، بإملاء 2886 ساعة من الكلام المؤكد (كان هناك 75 ألف مشارك و2637 ساعة).

ولنذكركم أن مشروع الصوت المشترك يهدف إلى تنظيم العمل المشترك لتجميع قاعدة بيانات للأنماط الصوتية التي تأخذ في الاعتبار تنوع الأصوات وأنماط الكلام. تتم دعوة المستخدمين إلى عرض العبارات الصوتية على الشاشة أو تقييم جودة البيانات التي يضيفها المستخدمون الآخرون. يمكن استخدام قاعدة البيانات المتراكمة التي تحتوي على سجلات النطق المختلفة للعبارات النموذجية للكلام البشري دون قيود في أنظمة التعلم الآلي وفي المشاريع البحثية. وبحسب مؤلف مكتبة فوسك للتعرف المستمر على الكلام، فإن عيوب مجموعة الصوت المشترك هي أحادية المادة الصوتية (غلبة الذكور الذين تتراوح أعمارهم بين 20-30 سنة، وقلة المادة بأصوات النساء) والأطفال وكبار السن) وعدم التباين في القاموس (تكرار نفس العبارات) وتوزيع التسجيلات بصيغة MP3 المشوهة.

بالإضافة إلى ذلك، يمكننا أن نلاحظ إصدار مجموعة أدوات NVIDIA NeMo 1.6، التي توفر أساليب التعلم الآلي لإنشاء أنظمة التعرف على الكلام، وتوليف الكلام ومعالجة اللغة الطبيعية. يتضمن NeMo نماذج مدربة جاهزة للاستخدام لأنظمة التعلم الآلي استنادًا إلى إطار عمل PyTorch، والتي أعدتها NVIDIA باستخدام بيانات الكلام Common Voice وتغطي مجموعة متنوعة من اللغات واللهجات وأشكال الكلام. قد تكون النماذج مفيدة للباحثين الذين يقومون بتطوير أنظمة الحوار الصوتي، ومنصات النسخ، ومراكز الاتصال الآلية. على سبيل المثال، يتم استخدام NVIDIA NeMo في الخدمات الصوتية الآلية لـ MTS وSberbank. تتم كتابة كود NeMo بلغة Python باستخدام PyTorch ويتم توزيعه بموجب ترخيص Apache 2.0.

المصدر: opennet.ru

إضافة تعليق