DeepMind Agent57 AI ከሰው በተሻለ የአታሪ ጨዋታዎችን አሸንፏል

የማጠናቀቂያውን ውጤት ለመገምገም ባለው ቀላል ችሎታ አማካኝነት የነርቭ ኔትወርክን በቀላል የቪዲዮ ጨዋታዎች ውስጥ እንዲሰራ ማድረግ የስልጠናውን ውጤታማነት ለመፈተሽ ጥሩ መንገድ ነው። እ.ኤ.አ. በ 2012 በ DeepMind (የፊደል ክፍል) የተገነባው የ 57 ታዋቂው Atari 2600 ጨዋታዎች መለኪያ የራስን የመማር ስርዓቶችን አቅም ለመፈተሽ ቀላል ፈተና ሆነ። እና እዚህ Agent57፣ የላቀ RL ወኪል (የማጠናከሪያ ትምህርት) DeepMind፣ በቅርቡ አሳይቷል ከቀደምት ስርዓቶች አንድ ትልቅ ዝላይ እና የሰው ተጫዋች መነሻ መስመርን ያለፈ የ AI የመጀመሪያ ድግግሞሽ ነው።

DeepMind Agent57 AI ከሰው በተሻለ የአታሪ ጨዋታዎችን አሸንፏል

Agent57 AI የኩባንያውን የቀድሞ ስርዓቶች ልምድ ከግምት ውስጥ ያስገባ እና አካባቢን በብቃት ለማሰስ ስልተ ቀመሮችን ከሜታ-ቁጥጥር ጋር ያጣምራል። በተለይም Agent57 በፒትፎል፣ ሞንቴዙማ በቀል፣ ሶላሪስ እና ስኪንግ - ከዚህ በፊት የነበሩትን የነርቭ ኔትወርኮች ክፉኛ የፈተኑ ጨዋታዎች ላይ ከሰው በላይ የሆነ ችሎታውን አረጋግጧል። በምርምር መሰረት ፒትፎል እና ሞንቴዙማ የበቀል እርምጃ ኤአይአይኤን የተሻለ ውጤት ለማምጣት የበለጠ እንዲሞክር ያስገድደዋል። ሶላሪስ እና ስኪንግ ለነርቭ ኔትወርኮች አስቸጋሪ ናቸው ምክንያቱም ብዙ የስኬት ምልክቶች ስለሌሉ - AI ትክክለኛውን ነገር እየሰራ መሆኑን ለረጅም ጊዜ አያውቅም። DeepMind በቀድሞው AI ወኪሎቹ ላይ የተገነባው Agent57 አካባቢን ለመፈተሽ እና የጨዋታዎችን አፈጻጸም ለመገምገም የተሻሉ ውሳኔዎችን እንዲያደርግ፣ እንዲሁም እንደ ስኪንግ ባሉ ጨዋታዎች ውስጥ በአጭር ጊዜ እና በረጅም ጊዜ ባህሪ መካከል ያለውን የንግድ ልውውጥ ማመቻቸት ነው።

ውጤቶቹ አስደናቂ ናቸው, ነገር ግን AI አሁንም ለመሄድ ረጅም መንገድ አለው. እነዚህ ስርዓቶች በአንድ ጊዜ አንድ ጨዋታ ብቻ ነው ማስተናገድ የሚችሉት፣ ይህም እንደ ገንቢዎቹ ገለጻ፣ ከሰው አቅም ጋር የሚቃረን ነው፡- “ወደ ሰው አእምሮ በቀላሉ የሚመጣ እውነተኛው ተለዋዋጭነት አሁንም ከ AI ሊደረስበት የማይችል ነው።



ምንጭ: 3dnews.ru

አስተያየት ያክሉ