አማዞን የንግግር ግንዛቤን በ 51 ቋንቋዎች ያትማል

Amazon በ CC BY 4.0 ፍቃድ "ማስሲቭ" (ባለብዙ ቋንቋ አማዞን SLURP ለ ማስገቢያ መሙላት፣ የሐሳብ ምደባ እና ምናባዊ አጋዥ ግምገማ) መረጃ ስብስብ፣ የማሽን መማሪያ ሥርዓቶች ሞዴሎችን እና የራስዎን ሞዴሎች ለማሰልጠን የሚረዱ መሳሪያዎችን አሳትሟል። በተፈጥሮ ቋንቋ (NLU, Natural Language Understanding) ላይ መረጃን ይረዱ. ስብስቡ ለ 51 ቋንቋዎች የተዘጋጁ ከአንድ ሚሊዮን በላይ የተብራሩ እና የተመደቡ የጽሑፍ አባባሎችን ያካትታል።

የ SLURP ስብስብ፣ በመጀመሪያ ለእንግሊዘኛ የሚገኝ፣ ፕሮፌሽናል ተርጓሚዎችን በመጠቀም ወደ 50 ሌሎች ቋንቋዎች የተተረጎመውን MASSIVE ስብስብን ለመገንባት እንደ ዋቢ ሆኖ አገልግሏል። የአሌክሳ የተፈጥሮ ቋንቋ ግንዛቤ (NLU) ቴክኖሎጂ በመጀመሪያ ንግግርን ወደ ጽሑፍ ይለውጣል፣ ከዚያም የተጠቃሚውን ጥያቄ ምንነት ለማወቅ የቁልፍ ቃላትን መኖር በሚተነትነው ጽሑፍ ላይ በርካታ NLU ሞዴሎችን ይተገበራል።

ስብስቡን የመፍጠር እና የማተም አንዱ ዓላማ የድምጽ ረዳቶችን በአንድ ጊዜ በተለያዩ ቋንቋዎች መረጃን ለማስኬድ እንዲሁም የሶስተኛ ወገን ገንቢዎች የድምጽ ረዳቶችን አቅም የሚያሰፉ መተግበሪያዎችን እና አገልግሎቶችን እንዲፈጥሩ ማበረታታት ነው። የገንቢዎችን ትኩረት ለመሳብ አማዞን የታተመ የውሂብ ስብስብ በመጠቀም ምርጡን አጠቃላይ ሞዴል ለመፍጠር ውድድር ጀምሯል።

በአሁኑ ጊዜ የድምጽ ረዳቶች ጥቂት ቋንቋዎችን ብቻ ይደግፋሉ እና ከአንድ የተወሰነ ቋንቋ ጋር የተሳሰሩ የማሽን መማሪያ ሞዴሎችን ይጠቀማሉ። MASSIVE ፕሮጀክት በተለያዩ ቋንቋዎች መረጃን መተንተን እና ማቀናበር የሚችሉ ሁለንተናዊ ሞዴሎችን እና የማሽን መማሪያ ስርዓቶችን በመፍጠር ይህንን ጉድለት ለማስወገድ ያለመ ነው።

ምንጭ: opennet.ru

አስተያየት ያክሉ