RHVoice 1.8.0 የንግግር ማጠናከሪያ ልቀት

ክፍት የንግግር ውህደት ስርዓት RHVoice 1.8.0 ተለቀቀ ፣ መጀመሪያ ላይ ለሩሲያ ቋንቋ ከፍተኛ ጥራት ያለው ድጋፍ ለመስጠት ተዘጋጅቷል ፣ ግን እንግሊዝኛ ፣ ፖርቱጋልኛ ፣ ዩክሬንኛ ፣ ኪርጊዝ ፣ ታታር እና ጆርጂያኛን ጨምሮ ለሌሎች ቋንቋዎች ተስተካክሏል። ኮዱ በC++ ተጽፎ በLGPL 2.1 ፍቃድ ተሰራጭቷል። ድጋፎች በጂኤንዩ/ሊኑክስ፣ ዊንዶውስ እና አንድሮይድ ላይ ይሰራሉ። ፕሮግራሙ ጽሑፍን ወደ ንግግር ለመቀየር ከመደበኛ TTS (ጽሑፍ-ወደ-ንግግር) በይነገጾች ጋር ​​ተኳሃኝ ነው፡ SAPI5 (Windows)፣ Speech Dispatcher (GNU/Linux) እና Android Text-To-Speech API፣ ነገር ግን በNVDA ውስጥም መጠቀም ይቻላል ስክሪን አንባቢ። የ RHVoice ፈጣሪ እና ዋና አዘጋጅ ኦልጋ ያኮቭሌቫ ነው, እሱም ሙሉ በሙሉ ዓይነ ስውር ቢሆንም ፕሮጀክቱን ያዘጋጃል.

ስሪት 1.8 ለ አንድሮይድ መድረክ አዲስ የድምጽ እና የቋንቋ ውሂብ አስተዳደር ስርዓት ያስተዋውቃል ይህም የሞባይል መተግበሪያን ሳያዘምኑ የድምጽ ዳታ ዝመናዎችን እንዲያወርዱ ያስችልዎታል. ለተጨመሩ ድምጾች እና ቋንቋዎች የውሂብ ዝማኔዎች በራስ-ሰር ይጣራሉ። በተጨማሪም፣ አዲሱ ልቀት ለፖላንድ ቋንቋ ድጋፍን ያስተዋውቃል እና ለመቄዶኒያ ቋንቋ አዲስ ድምጽ ይጨምራል። ከ NVDA ስክሪን አንባቢ የቅርብ ጊዜ የአልፋ እና የቅድመ-ይሁንታ ልቀቶች ጋር ተኳሃኝነት የተረጋገጠ ነው። Speech Dispatcher በማይኖርበት ጊዜ የተከሰተውን የሊኑክስ መድረክ ላይ በመገንባት ላይ ያሉ ቋሚ ችግሮች።

እናስታውስ RHVoice የ HTS ፕሮጀክት እድገቶችን (HMM/DNN ላይ የተመሰረተ የንግግር ውህድ ስርዓት) እና የፓራሜትሪክ ውህደት ዘዴን ከስታቲስቲክስ ሞዴሎች ጋር (በ HMM - Hidden Markov Model ላይ የተመሰረተ የስታቲስቲክስ ፓራሜትሪክ ሲንቴሲስ) እንደሚጠቀም እናስታውስ። የስታቲስቲክስ ሞዴል ጥቅሙ ዝቅተኛ ወጪዎች እና የማይፈለግ የሲፒዩ ኃይል ነው። ሁሉም ስራዎች በተጠቃሚው ስርዓት ላይ በአካባቢው ይከናወናሉ. ሶስት ደረጃዎች የንግግር ጥራት ይደገፋሉ (የጥራት ዝቅተኛ, ከፍተኛ አፈፃፀሙ እና የአጸፋው ጊዜ አጭር ነው).

የስታቲስቲካዊው ሞዴል ጉዳቱ በአንጻራዊ ሁኔታ ዝቅተኛ ጥራት ያለው አነጋገር ነው ፣ እሱም በተፈጥሮ ንግግር ስብርባሪዎች ላይ በመመስረት ንግግርን ወደሚያመነጩ የማጠናቀቂያዎች ደረጃ ላይ አይደርስም ፣ ግን ውጤቱ በደንብ ሊነበብ የሚችል እና ከድምጽ ማጉያ ቀረፃን ከማሰራጨት ጋር ይመሳሰላል። . ለማነፃፀር በማሽን መማሪያ ቴክኖሎጂዎች ላይ የተመሰረተ ክፍት የንግግር ውህደት ሞተር የሚያቀርበው የሲሊሮ ፕሮጀክት እና ለሩሲያ ቋንቋ ሞዴሎች ስብስብ በጥራት ከ RHVoice የላቀ ነው።

ለሩሲያ ቋንቋ 14 የድምጽ አማራጮች እና 6 ለእንግሊዝኛ ይገኛሉ.ድምጾቹ የተፈጠሩት በተፈጥሮ ንግግር ቅጂዎች ላይ በመመስረት ነው. በቅንብሮች ውስጥ ፍጥነትን, ድምጽን እና ድምጽን መቀየር ይችላሉ. የ Sonic ቤተ-መጽሐፍት ጊዜውን ለመለወጥ ጥቅም ላይ ሊውል ይችላል. በግቤት ጽሑፍ ትንተና ላይ በመመስረት ቋንቋዎችን በራስ-ሰር መፈለግ እና መለወጥ ይቻላል (ለምሳሌ ፣ በሌላ ቋንቋ ለቃላቶች እና ጥቅሶች ፣ የዚያ ቋንቋ ተወላጅ ውህደት ሞዴል መጠቀም ይቻላል)። ለተለያዩ ቋንቋዎች የድምፅ ውህዶችን በመግለጽ የድምጽ መገለጫዎች ይደገፋሉ።

ምንጭ: opennet.ru

አስተያየት ያክሉ