RHVoice 1.6.0 የንግግር ማጠናከሪያ ልቀት

ክፍት የንግግር ውህደት ስርዓት RHVoice 1.6.0 ተለቀቀ ፣ መጀመሪያ ላይ ለሩሲያ ቋንቋ ከፍተኛ ጥራት ያለው ድጋፍ ለመስጠት ተዘጋጅቷል ፣ ግን እንግሊዝኛ ፣ ፖርቱጋልኛ ፣ ዩክሬንኛ ፣ ኪርጊዝ ፣ ታታር እና ጆርጂያኛን ጨምሮ ለሌሎች ቋንቋዎች ተስተካክሏል። ኮዱ በC++ ተጽፎ በLGPL 2.1 ፍቃድ ተሰራጭቷል። ድጋፎች በጂኤንዩ/ሊኑክስ፣ ዊንዶውስ እና አንድሮይድ ላይ ይሰራሉ። ፕሮግራሙ ጽሑፍን ወደ ንግግር ለመቀየር ከመደበኛ TTS (ጽሑፍ-ወደ-ንግግር) በይነገጾች ጋር ​​ተኳሃኝ ነው፡ SAPI5 (Windows)፣ Speech Dispatcher (GNU/Linux) እና Android Text-To-Speech API፣ ነገር ግን በNVDA ውስጥም መጠቀም ይቻላል ስክሪን አንባቢ። የ RHVoice ፈጣሪ እና ዋና አዘጋጅ ኦልጋ ያኮቭሌቫ ነው, እሱም ሙሉ በሙሉ ዓይነ ስውር ቢሆንም ፕሮጀክቱን ያዘጋጃል.

አዲሱ ስሪት ለሩሲያ ንግግር 5 አዲስ የድምጽ አማራጮችን ይጨምራል. የአልባኒያ ቋንቋ ድጋፍ ተግባራዊ ሆኗል. የዩክሬን ቋንቋ መዝገበ ቃላት ተዘምኗል። የኢሞጂ ገጸ-ባህሪያትን በድምጽ ለመስራት ድጋፍ ተዘርግቷል። ለ አንድሮይድ መድረክ አፕሊኬሽኑ ውስጥ ያሉ ስህተቶችን ለማስወገድ ስራ ተሰርቷል፣ ብጁ መዝገበ ቃላትን ማስመጣት ቀላል ሆኗል፣ እና የአንድሮይድ 11 መድረክ ድጋፍ ተጨምሯል። g2p ን ጨምሮ አዳዲስ ቅንጅቶች እና ተግባራት ወደ ሞተሩ ኮር ተጨምረዋል። መያዣ፣ ቃል_ሰበር እና ለእኩልነት ማጣሪያዎች ድጋፍ።

እናስታውስ RHVoice የ HTS ፕሮጀክት እድገቶችን (HMM/DNN ላይ የተመሰረተ የንግግር ውህድ ስርዓት) እና የፓራሜትሪክ ውህደት ዘዴን ከስታቲስቲክስ ሞዴሎች ጋር (በ HMM - Hidden Markov Model ላይ የተመሰረተ የስታቲስቲክስ ፓራሜትሪክ ሲንቴሲስ) እንደሚጠቀም እናስታውስ። የስታቲስቲክስ ሞዴል ጥቅሙ ዝቅተኛ ወጪዎች እና የማይፈለግ የሲፒዩ ኃይል ነው። ሁሉም ስራዎች በተጠቃሚው ስርዓት ላይ በአካባቢው ይከናወናሉ. ሶስት ደረጃዎች የንግግር ጥራት ይደገፋሉ (የጥራት ዝቅተኛ, ከፍተኛ አፈፃፀሙ እና የአጸፋው ጊዜ አጭር ነው).

የስታቲስቲካዊው ሞዴል ጉዳቱ በአንጻራዊ ሁኔታ ዝቅተኛ ጥራት ያለው አነጋገር ነው ፣ እሱም በተፈጥሮ ንግግር ስብርባሪዎች ላይ በመመስረት ንግግርን ወደሚያመነጩ የማጠናቀቂያዎች ደረጃ ላይ አይደርስም ፣ ግን ውጤቱ በደንብ ሊነበብ የሚችል እና ከድምጽ ማጉያ ቀረፃን ከማሰራጨት ጋር ይመሳሰላል። . ለማነፃፀር በማሽን መማሪያ ቴክኖሎጂዎች ላይ የተመሰረተ ክፍት የንግግር ውህደት ሞተር የሚያቀርበው የሲሊሮ ፕሮጀክት እና ለሩሲያ ቋንቋ ሞዴሎች ስብስብ በጥራት ከ RHVoice የላቀ ነው።

ለሩሲያ ቋንቋ 13 የድምጽ አማራጮች እና 5 ለእንግሊዝኛ ይገኛሉ.ድምጾቹ የተፈጠሩት በተፈጥሮ ንግግር ቅጂዎች ላይ በመመስረት ነው. በቅንብሮች ውስጥ ፍጥነትን, ድምጽን እና ድምጽን መቀየር ይችላሉ. የ Sonic ቤተ-መጽሐፍት ጊዜውን ለመለወጥ ጥቅም ላይ ሊውል ይችላል. በግቤት ጽሑፍ ትንተና ላይ በመመስረት ቋንቋዎችን በራስ-ሰር መፈለግ እና መለወጥ ይቻላል (ለምሳሌ ፣ በሌላ ቋንቋ ለቃላቶች እና ጥቅሶች ፣ የዚያ ቋንቋ ተወላጅ ውህደት ሞዴል መጠቀም ይቻላል)። ለተለያዩ ቋንቋዎች የድምፅ ውህዶችን በመግለጽ የድምጽ መገለጫዎች ይደገፋሉ።

ምንጭ: opennet.ru

አስተያየት ያክሉ