የሹክሹክታ ንግግር እውቅና እና የትርጉም ስርዓት ኮድ ተከፍቷል።

በአርቴፊሻል ኢንተለጀንስ መስክ የህዝብ ፕሮጀክቶችን የሚያዘጋጀው የOpenAI ፕሮጀክት ከዊስፐር ንግግር ማወቂያ ስርዓት ጋር የተያያዙ እድገቶችን አሳትሟል። በእንግሊዘኛ ቋንቋ ለንግግር ሲስተሙ ለሰው ልጅ እውቅና ቅርብ የሆነ አውቶማቲክ እውቅና አስተማማኝነት እና ትክክለኛነት ደረጃ ይሰጣል ተብሏል። በፒቶርች ማእቀፍ ላይ የተመሰረተ የማጣቀሻ አተገባበር ኮድ እና ቀደም ሲል የሰለጠኑ ሞዴሎች, ለአገልግሎት ዝግጁ ሆነው ተከፍተዋል. ኮዱ በ MIT ፍቃድ ስር ተከፍቷል።

ሞዴሉን ለማሰልጠን 680 ሺህ ሰአታት የንግግር መረጃ ጥቅም ላይ ውሏል, ከተለያዩ ቋንቋዎች እና ርዕሰ ጉዳዮችን ከሚሸፍኑ ስብስቦች የተሰበሰቡ ናቸው. በስልጠና ውስጥ ከተካተቱት የንግግር መረጃዎች ውስጥ 1/3 ያህሉ ከእንግሊዝኛ ሌላ ቋንቋዎች ናቸው. የታቀደው ስርዓት እንደ አጠራር አጠራር፣ የበስተጀርባ ጫጫታ እና የቴክኒክ ቃላት አጠቃቀም ያሉ ሁኔታዎችን በትክክል ያስተናግዳል። ሥርዓቱ ንግግርን ወደ ጽሑፍ ከመገልበጥ በተጨማሪ ንግግርን ከየትኛውም ቋንቋ ወደ እንግሊዘኛ መተርጎም እና የንግግርን ገጽታ በድምጽ ዥረቱ ውስጥ መለየት ይችላል።

ሞዴሎቹ በሁለት ውክልናዎች የተፈጠሩ ናቸው-የእንግሊዘኛ ቋንቋ ሞዴል እና ባለብዙ ቋንቋ ሞዴል, እሱም የሩሲያ, የዩክሬን እና የቤላሩስ ቋንቋዎችን ይደግፋል. በምላሹ, እያንዳንዱ ውክልና በ 5 አማራጮች ይከፈላል, በአምሳያው ውስጥ በተካተቱት መጠኖች እና ብዛት ይለያያል. ትልቅ መጠን, የበለጠ ትክክለኛነት እና እውቅና ጥራት, ነገር ግን ደግሞ ጂፒዩ ቪዲዮ ትውስታ መጠን ከፍተኛ መስፈርቶች እና ዝቅተኛ አፈጻጸም. ለምሳሌ ዝቅተኛው አማራጭ 39 ሚሊዮን መለኪያዎችን ያካትታል እና 1 ጂቢ የቪዲዮ ማህደረ ትውስታ ያስፈልገዋል, እና ከፍተኛው 1550 ሚሊዮን መለኪያዎች ያካትታል እና 10 ጂቢ የቪዲዮ ማህደረ ትውስታ ያስፈልገዋል. ዝቅተኛው አማራጭ ከከፍተኛው 32 እጥፍ ፈጣን ነው.

የሹክሹክታ ንግግር እውቅና እና የትርጉም ስርዓት ኮድ ተከፍቷል።

ስርዓቱ የትራንስፎርመር ነርቭ ኔትወርክ አርክቴክቸርን ይጠቀማል፣ እርስ በርስ የሚግባቡ ኢንኮደር እና ዲኮደርን ያካትታል። ኦዲዮው በ30 ሰከንድ ክፍሎች የተከፋፈለ ሲሆን እነዚህም ወደ ሎግ-ሜል ስፔክትሮግራም ተለውጠው ወደ ኢንኮደር ይላካሉ። የመቀየሪያው ውፅዓት ወደ ዲኮደር ይላካል ፣ እሱም በልዩ ምልክቶች የተቀላቀለ የጽሑፍ ውክልና ይተነብያል ፣ ይህም በአንድ አጠቃላይ ሞዴል ፣ እንደ ቋንቋ ፍለጋ ፣ የቃላት አጠራር የጊዜ ቅደም ተከተል ፣ የንግግር ግልባጭ ያሉ ችግሮችን ለመፍታት ያስችላል። የተለያዩ ቋንቋዎች, እና ወደ እንግሊዝኛ መተርጎም.

ምንጭ: opennet.ru

አስተያየት ያክሉ