ጎግል የላይራ ኦዲዮ ኮዴክን ለንግግር ማስተላለፍ ጥራት ባለው ግንኙነት አሳትሟል

ጎግል አዲስ የኦዲዮ ኮዴክ አስተዋውቋል፣ ሊራ፣ በጣም ቀርፋፋ የመገናኛ ቻናሎችን በሚጠቀሙበት ጊዜ እንኳን ከፍተኛ የድምጽ ጥራትን ለማግኘት የተመቻቸ ነው። የላይራ አተገባበር ኮድ በC++ የተፃፈ እና በ Apache 2.0 ፍቃድ ስር የተከፈተ ቢሆንም ለስራ ከሚያስፈልጉት ጥገኞች መካከል ለሒሳብ ስሌት የከርነል አተገባበር ያለው የባለቤትነት ቤተመፃህፍት libsparse_inference.so አለ። የባለቤትነት ቤተ መጻሕፍቱ ጊዜያዊ እንደሆነ ተጠቁሟል - ወደፊት ጎግል ክፍት ምትክ ለማዘጋጀት እና ለተለያዩ መድረኮች ድጋፍ ለመስጠት ቃል ገብቷል ።

በዝቅተኛ ፍጥነት ከሚተላለፈው የድምፅ መረጃ ጥራት አንጻር ሊራ የዲጂታል ሲግናል ማቀነባበሪያ ዘዴዎችን ከሚጠቀሙ ባህላዊ ኮዴኮች በእጅጉ የላቀ ነው። ከፍተኛ ጥራት ያለው የድምፅ ስርጭት በተወሰነ መጠን የሚተላለፉ መረጃዎችን ለማግኘት ፣ ከተለመዱት የኦዲዮ መጭመቂያ እና የምልክት ልወጣ ዘዴዎች በተጨማሪ ሊራ በማሽን መማሪያ ስርዓት ላይ የተመሠረተ የንግግር ሞዴልን ትጠቀማለች ፣ ይህም የጎደለውን መረጃ መሠረት በማድረግ እንደገና እንዲፈጥሩ ያስችልዎታል ። የተለመዱ የንግግር ባህሪያት. ድምጹን ለማመንጨት ጥቅም ላይ የዋለው ሞዴል ከ 70 በሚበልጡ ቋንቋዎች ለብዙ ሺህ ሰዓታት የድምፅ ቅጂዎችን በመጠቀም የሰለጠነ ነው።

ጎግል የላይራ ኦዲዮ ኮዴክን ለንግግር ማስተላለፍ ጥራት ባለው ግንኙነት አሳትሟል

ኮዴክ ኢንኮደር እና ዲኮደርን ያካትታል። የመቀየሪያው አልጎሪዝም በየ 40 ሚሊሰከንድ የድምጽ ዳታ መለኪያዎችን በማውጣት፣ በመጭመቅ እና በአውታረ መረቡ ላይ ለተቀባዩ ያስተላልፋል። በሴኮንድ 3 ኪሎቢት ፍጥነት ያለው የመገናኛ ቻናል ለመረጃ ማስተላለፍ በቂ ነው። የወጡት የድምጽ መለኪያዎች በተለያዩ ድግግሞሽ ክልሎች የንግግርን የኢነርጂ ባህሪያት ያገናዘቡ እና የሰውን የመስማት ግንዛቤን ሞዴል ከግምት ውስጥ በማስገባት የተዘጋጁ ሎጋሪዝም ሜል ስፔክትሮግራሞችን ያካትታሉ።

ጎግል የላይራ ኦዲዮ ኮዴክን ለንግግር ማስተላለፍ ጥራት ባለው ግንኙነት አሳትሟል

ዲኮደሩ በሚተላለፉ የድምጽ መለኪያዎች ላይ በመመስረት የንግግር ምልክቱን የሚፈጥር የጄነሬቲቭ ሞዴል ይጠቀማል። የስሌቶችን ውስብስብነት ለመቀነስ በተደጋጋሚ የነርቭ ኔትወርክ ላይ የተመሰረተ ቀላል ክብደት ያለው ሞዴል ጥቅም ላይ ውሏል ይህም የWaveRNN የንግግር ውህደት ሞዴል ተለዋጭ ሲሆን ይህም ዝቅተኛ የናሙና ድግግሞሽ ይጠቀማል ነገር ግን በተለያዩ ድግግሞሽ ክልሎች በትይዩ በርካታ ምልክቶችን ይፈጥራል። ከዚያ በኋላ የተገኙት ምልክቶች ከተጠቀሰው የናሙና መጠን ጋር የሚዛመድ አንድ የውጤት ምልክት እንዲያመነጩ ይደረጋሉ።

በ64-ቢት ARM ፕሮሰሰር ውስጥ የሚገኙ ልዩ ፕሮሰሰር መመሪያዎች እንዲሁ ለማፋጠን ያገለግላሉ። በውጤቱም ፣ ምንም እንኳን የማሽን መማሪያ ጥቅም ላይ ቢውልም ፣ ሊራ ኮዴክ ለእውነተኛ ጊዜ የንግግር ኢንኮዲንግ እና በመካከለኛ ደረጃ ስማርትፎኖች ላይ ዲኮዲንግ ፣ የ 90 ሚሊሰከንድ የሲግናል ስርጭት መዘግየትን ያሳያል ።

ምንጭ: opennet.ru

አስተያየት ያክሉ