የሞዚላ የጋራ ድምጽ 9.0 ዝማኔ

ሞዚላ ወደ 200 የሚጠጉ ሰዎች የቃላት አጠራር ናሙናዎችን የሚያጠቃልለውን የጋራ ድምጽ መረጃ ስብስቦችን ማሻሻያ አውጥቷል። ውሂቡ እንደ ይፋዊ ጎራ (CC0) ታትሟል። የቀረቡት ስብስቦች የንግግር ማወቂያ እና ውህደት ሞዴሎችን ለመገንባት በማሽን መማሪያ ስርዓቶች ውስጥ ጥቅም ላይ ሊውሉ ይችላሉ.

ከቀዳሚው ዝመና ጋር ሲነፃፀር በስብስቡ ውስጥ ያለው የንግግር ቁሳቁስ መጠን በ 10% ጨምሯል - ከ 18.2 እስከ 20.2 ሺህ ሰዓታት ንግግር። የሚደገፉ ቋንቋዎች ቁጥር ከ 87 ወደ 93 ጨምሯል ለ 27 ቋንቋዎች ከ 100 ሰዓታት በላይ የንግግር መረጃ ተከማችቷል, እና ለ 9 - ከ 500 ሰዓታት በላይ የንግግር ውሂብ. ለ 9 ቋንቋዎች የሴት ንግግር ቢያንስ 45% ድርሻ ማግኘት ተችሏል.

ከ 81 ሺህ በላይ ሰዎች በእንግሊዘኛ ቁሳቁሶች ዝግጅት ላይ ተሳትፈዋል, የ 2953 ሰዓታት ንግግር (79 ሺህ ተሳታፊዎች እና 2886 ሰዓታት ነበሩ). የቤላሩስ ቋንቋ ስብስብ 6326 ተሳታፊዎችን እና 1054 ሰዓታት የንግግር ቁሳቁስ (6160 ተሳታፊዎች እና 987 ሰዓታት ነበሩ) ፣ ሩሲያኛ - 2585 ተሳታፊዎች እና 201 ሰዓታት (2452 ተሳታፊዎች እና 193 ሰዓታት ነበሩ) ፣ ኡዝቤክ - 1503 ተሳታፊዎች እና 231 ሰዓታት (እ.ኤ.አ.) 1355 ተሳታፊዎች እና 227 ሰዓታት) ፣ የዩክሬን ቋንቋ - 696 ተሳታፊዎች እና 79 ሰዓታት (684 ተሳታፊዎች እና 76 ሰዓታት ነበሩ)።

የጋራ ቮይስ ፕሮጀክት የድምፅ እና የንግግር ዘይቤዎችን ልዩነት ያገናዘበ የድምፅ ዘይቤዎችን የውሂብ ጎታ ለማከማቸት የጋራ ስራዎችን ለማደራጀት ያለመ ነው። ተጠቃሚዎች በማያ ገጹ ላይ ለሚታዩ የድምጽ ሀረጎች ተጋብዘዋል ወይም በሌሎች ተጠቃሚዎች የተጨመረውን የውሂብ ጥራት ይገመግማሉ። የተከማቸ የውሂብ ጎታ የተለያዩ የሰዎች ንግግር የተለመዱ ሀረጎች አጠራር መዝገቦች በማሽን መማሪያ ስርዓቶች እና በምርምር ፕሮጀክቶች ውስጥ ያለ ገደብ ጥቅም ላይ ሊውል ይችላል.

ምንጭ: opennet.ru

አስተያየት ያክሉ