የሞዚላ የጋራ ድምጽ 7.0 ዝማኔ

ኒቪዲ እና ሞዚላ የ182 ሰዎች የንግግር ናሙናዎችን ያካተቱ የጋራ ቮይስ ዳታ ስብስቦችን ማሻሻያ አውጥተዋል ይህም ከ25 ወራት በፊት ከነበረው 6% አድጓል። ውሂቡ እንደ ይፋዊ ጎራ (CC0) ታትሟል። የቀረቡት ስብስቦች የንግግር ማወቂያን እና የማዋሃድ ሞዴሎችን ለመገንባት በማሽን መማሪያ ስርዓቶች ውስጥ ጥቅም ላይ ሊውሉ ይችላሉ.

ከቀዳሚው ዝመና ጋር ሲነፃፀር በስብስቡ ውስጥ ያለው የንግግር ቁሳቁስ መጠን ከ 9 ወደ 13.9 ሺህ ሰዓታት ንግግር ጨምሯል። ለመጀመሪያ ጊዜ ለቤላሩስኛ ፣ ለካዛክኛ ፣ ለኡዝቤክ ፣ ለቡልጋሪያኛ ፣ ለአርሜኒያ ፣ ለአዘርባጃኒ እና ለባሽኪር ቋንቋዎች ድጋፍን ጨምሮ የሚደገፉ ቋንቋዎች ብዛት ከ 60 ወደ 76 ጨምሯል። ለሩስያ ቋንቋ የተዘጋጀው ስብስብ 2136 ተሳታፊዎች እና 173 ሰዓታት የንግግር ቁሳቁስ (1412 ተሳታፊዎች እና 111 ሰዓታት ነበሩ), እና ለዩክሬን ቋንቋ - 615 ተሳታፊዎች እና 66 ሰዓታት (459 ተሳታፊዎች እና 30 ሰዓታት ነበሩ).

ከ 75 ሺህ በላይ ሰዎች በእንግሊዘኛ ቁሳቁሶች ዝግጅት ላይ ተሳትፈዋል, 2637 ሰዓታት የተረጋገጠ ንግግር (66 ሺህ ተሳታፊዎች እና 1686 ሰዓታት ነበሩ). የሚገርመው፣ ከተጠራቀመው መረጃ መጠን አንፃር በሁለተኛ ደረጃ ላይ ያለው ቋንቋ 2260 ሰአታት የተሰበሰበበት ሩዋንዳ ነው። ይህን ተከትሎ ጀርመንኛ (1040)፣ ካታላን (920) እና ኢስፔራንቶ (840) ናቸው። የድምፅ መረጃ መጠን በጣም ተለዋዋጭ ከሆኑት መካከል የታይ ቋንቋ (በመሠረቱ 20 እጥፍ ጭማሪ ፣ ከ 12 እስከ 250 ሰዓታት) ፣ ሉጋንዳ (ከ 8 እስከ 80 ሰዓታት) ፣ ኢስፔራንቶ (ከ 100 እስከ 840 ሰዓታት) እና ታሚል ( ከ 24 እስከ 220 ሰዓታት)።

በኮመን ቮይስ ፕሮጄክት ውስጥ ያለው ተሳትፎ አካል የሆነው ኤንቪዲ በተሰበሰበው መረጃ መሰረት ዝግጁ የሆኑ የሰለጠኑ ሞዴሎችን ለማሽን መማሪያ ስርዓቶች (በፒቶርች የተደገፈ) አዘጋጅቷል። ሞዴሎቹ እንደ ነፃ እና ክፍት የNVDIA NeMo Toolkit አካል ሆነው ተሰራጭተዋል፣ እሱም ለምሳሌ፣ አስቀድሞ በ MTS እና Sberbank አውቶሜትድ የድምጽ አገልግሎቶች ውስጥ ጥቅም ላይ ይውላል። ሞዴሎቹ በንግግር ማወቂያ፣ በንግግር ውህድ እና በተፈጥሮ የቋንቋ ማቀነባበሪያ ስርዓቶች ውስጥ ጥቅም ላይ እንዲውሉ የታሰቡ ናቸው፣ እና ተመራማሪዎች በድምፅ የሚንቀሳቀሱ የውይይት ስርዓቶችን፣ የግልባጭ መድረኮችን እና አውቶማቲክ የጥሪ ማዕከሎችን ለመገንባት ጠቃሚ ሊሆኑ ይችላሉ። ከዚህ ቀደም ከሚገኙ ፕሮጀክቶች በተለየ፣ የታተሙት ሞዴሎች በእንግሊዝኛ ቋንቋ እውቅና ላይ ብቻ የተገደቡ አይደሉም እና የተለያዩ ቋንቋዎችን፣ ዘዬዎችን እና የንግግር ዓይነቶችን ይሸፍናሉ።

የጋራ ቮይስ ፕሮጀክት የድምፅ እና የንግግር ዘይቤዎችን ልዩነት ያገናዘበ የድምፅ ዘይቤዎችን የውሂብ ጎታ ለመሰብሰብ የጋራ ስራዎችን ለማደራጀት ያለመ መሆኑን እናስታውስዎት። ተጠቃሚዎች በማያ ገጹ ላይ ለሚታዩ የድምጽ ሀረጎች ተጋብዘዋል ወይም በሌሎች ተጠቃሚዎች የተጨመረውን የውሂብ ጥራት ይገመግማሉ። የተከማቸ የውሂብ ጎታ የተለያዩ የሰዎች ንግግር የተለመዱ ሀረጎች አጠራር መዝገቦች በማሽን መማሪያ ስርዓቶች እና በምርምር ፕሮጀክቶች ውስጥ ያለ ገደብ ጥቅም ላይ ሊውል ይችላል.

እንደ ቮስክ ቀጣይነት ያለው የንግግር ማወቂያ ቤተ-መጽሐፍት ጸሐፊ ​​እንደገለጸው የጋራ ድምጽ ስብስብ ጉዳቶች የድምፅ ቁሳቁስ አንድ-ጎን (የወንዶች የበላይነት ከ20-30 ዓመት እድሜ ያላቸው እና የሴቶች ድምጽ ያላቸው ቁሳቁሶች አለመኖር ናቸው). , ልጆች እና አረጋውያን), በመዝገበ-ቃላቱ ውስጥ ተለዋዋጭነት አለመኖር (ተመሳሳይ ሀረጎች መደጋገም) እና የተቀረጹ ጽሑፎች በተዛባ የ MP3 ቅርጸት.

ምንጭ: opennet.ru

አስተያየት ያክሉ