የሞዚላ የጋራ ድምጽ 12.0 ዝማኔ

ሞዚላ የጋራ ድምጽ መረጃ ስብስቦችን ከ200 በላይ ሰዎች የአነባበብ ናሙናዎችን ለማካተት አዘምኗል። ውሂቡ እንደ ይፋዊ ጎራ (CC0) ታትሟል። የቀረቡት ስብስቦች የንግግር ማወቂያን እና የማዋሃድ ሞዴሎችን ለመገንባት በማሽን መማሪያ ስርዓቶች ውስጥ ጥቅም ላይ ሊውሉ ይችላሉ.

ከቀዳሚው ዝመና ጋር ሲነፃፀር በስብስቡ ውስጥ ያለው የንግግር ቁሳቁስ መጠን ከ 23.8 ወደ 25.8 ሺህ ሰዓታት ንግግር ጨምሯል። ከ 88 ሺህ በላይ ሰዎች በእንግሊዘኛ ቁሳቁሶች ዝግጅት ላይ ተሳትፈዋል, የ 3161 ሰዓታት ንግግርን በማዘዝ (84 ሺህ ተሳታፊዎች እና 3098 ሰዓታት ነበሩ). የቤላሩስ ቋንቋ ስብስብ 7903 ተሳታፊዎችን እና 1419 ሰዓታት የንግግር ቁሳቁስ (6965 ተሳታፊዎች እና 1217 ሰዓታት ነበሩ) ፣ ሩሲያኛ - 2815 ተሳታፊዎች እና 229 ሰዓታት (2731 ተሳታፊዎች እና 215 ሰዓታት ነበሩ) ፣ ኡዝቤክ - 2092 ተሳታፊዎች እና 262 ሰዓታት (እ.ኤ.አ.) 2025 ተሳታፊዎች እና 258 ሰዓቶች ነበሩ), የዩክሬን ቋንቋ - 780 ተሳታፊዎች እና 87 ሰዓታት (759 ተሳታፊዎች እና 87 ሰዓቶች ነበሩ).

የጋራ ቮይስ ፕሮጀክት የድምፅ እና የንግግር ዘይቤዎችን ልዩነት ያገናዘበ የድምፅ ዘይቤዎችን የውሂብ ጎታ ለማከማቸት የጋራ ስራዎችን ለማደራጀት ያለመ ነው። ተጠቃሚዎች በማያ ገጹ ላይ ለሚታዩ የድምጽ ሀረጎች ተጋብዘዋል ወይም በሌሎች ተጠቃሚዎች የተጨመረውን የውሂብ ጥራት ይገመግማሉ። የተከማቸ የውሂብ ጎታ የተለያዩ የሰዎች ንግግር የተለመዱ ሀረጎች አጠራር መዝገቦች በማሽን መማሪያ ስርዓቶች እና በምርምር ፕሮጀክቶች ውስጥ ያለ ገደብ ጥቅም ላይ ሊውል ይችላል.

ምንጭ: opennet.ru

አስተያየት ያክሉ