మొజిల్లా కామన్ వాయిస్ 12.0 వాయిస్ అప్‌డేట్

200 మంది వ్యక్తుల నుండి ఉచ్చారణ నమూనాలను చేర్చడానికి Mozilla దాని సాధారణ వాయిస్ డేటాసెట్‌లను నవీకరించింది. డేటా పబ్లిక్ డొమైన్ (CC0)గా ప్రచురించబడింది. ప్రతిపాదిత సెట్‌లను స్పీచ్ రికగ్నిషన్ మరియు సింథసిస్ మోడల్‌లను రూపొందించడానికి మెషిన్ లెర్నింగ్ సిస్టమ్‌లలో ఉపయోగించవచ్చు.

మునుపటి నవీకరణతో పోలిస్తే, సేకరణలో ప్రసంగ మెటీరియల్ వాల్యూమ్ 23.8 నుండి 25.8 వేల గంటల ప్రసంగానికి పెరిగింది. 88 గంటల ప్రసంగాన్ని నిర్దేశిస్తూ (3161 వేల మంది పాల్గొనేవారు మరియు 84 గంటలు) ఆంగ్లంలో పదార్థాల తయారీలో 3098 వేల మందికి పైగా పాల్గొన్నారు. బెలారసియన్ భాష కోసం సెట్‌లో 7903 మంది పాల్గొనేవారు మరియు 1419 గంటల ప్రసంగ సామగ్రి (6965 మంది పాల్గొనేవారు మరియు 1217 గంటలు), రష్యన్ - 2815 మంది పాల్గొనేవారు మరియు 229 గంటలు (2731 మంది పాల్గొనేవారు మరియు 215 గంటలు ఉన్నారు), ఉజ్బెక్ - 2092 గంటలు మరియు 262 పార్ట్ 2025 మంది పాల్గొనేవారు మరియు 258 గంటలు), ఉక్రేనియన్ భాష - 780 మంది పాల్గొనేవారు మరియు 87 గంటలు (759 మంది పాల్గొనేవారు మరియు 87 గంటలు ఉన్నారు).

కామన్ వాయిస్ ప్రాజెక్ట్ స్వరాలు మరియు ప్రసంగ శైలుల వైవిధ్యాన్ని పరిగణనలోకి తీసుకునే వాయిస్ నమూనాల డేటాబేస్‌ను సేకరించేందుకు ఉమ్మడి పనిని నిర్వహించడం లక్ష్యంగా పెట్టుకుంది. స్క్రీన్‌పై ప్రదర్శించబడే వాయిస్ పదబంధాలకు లేదా ఇతర వినియోగదారులు జోడించిన డేటా నాణ్యతను అంచనా వేయడానికి వినియోగదారులు ఆహ్వానించబడ్డారు. మానవ ప్రసంగం యొక్క సాధారణ పదబంధాల యొక్క వివిధ ఉచ్చారణల రికార్డులతో సేకరించబడిన డేటాబేస్ యంత్ర అభ్యాస వ్యవస్థలలో మరియు పరిశోధన ప్రాజెక్టులలో పరిమితులు లేకుండా ఉపయోగించబడుతుంది.

మూలం: opennet.ru

ఒక వ్యాఖ్యను జోడించండి