DeepMind Agent57 AI-ak Atari jokoak baino hobeto gainditzen ditu

Sare neuronal bat bideo-joko sinpleen bidez exekutatzeko modu ezin hobea da bere prestakuntzaren eraginkortasuna probatzeko, osatzearen emaitzak ebaluatzeko gaitasun soilari esker. DeepMind-ek (Alphabet-eko parte) 2012an garatua, Atari 57 joko enblematikoen 2600 erreferentea autoikaskuntza sistemen gaitasunak probatzeko litmus proba bihurtu zen. Eta hemen Agent57, RL agente aurreratua (Reinforcement Learning) DeepMind, duela gutxi erakutsi aurreko sistemetatik jauzi handia izan zen eta giza jokalariaren oinarri-lerroa gainditzen zuen AIaren lehen iterazioa izan zen.

DeepMind Agent57 AI-ak Atari jokoak baino hobeto gainditzen ditu

Agent57 AI-k konpainiaren aurreko sistemen esperientzia hartzen du kontuan eta ingurunea eraginkortasunez esploratzeko algoritmoak meta-kontrolarekin konbinatzen ditu. Bereziki, Agent57-k bere giza gaindiko trebetasunak frogatu ditu Pitfall, Montezuma's Revenge, Solaris eta Skiing-en - aurreko sare neuronalak gogor probatu dituzten jokoetan. Ikerketaren arabera, Pitfall eta Montezuma's Revenge-k IA gehiago esperimentatzera behartzen dute emaitza hobeak lortzeko. Solaris eta eskia zailak dira neurona-sareentzat, arrakastaren zantzu asko ez daudelako; AIek ez daki denbora luzez ondo egiten ari den ala ez. DeepMind-ek bere ondare AI-ko agenteetan eraiki zuen Agent57-i ingurumena arakatzeari eta jolasak ebaluatzeari buruzko erabaki hobeak har ditzan, baita eskia bezalako jokoetan epe laburreko eta epe luzeko portaeraren arteko trukaketa optimizatzeko ere.

Emaitzak ikusgarriak dira, baina AI oraindik bide luzea du egiteko. Sistema hauek aldi berean joko bakarra kudeatu dezakete, eta hori, garatzaileen arabera, giza gaitasunen aurkakoa da: "Giza garunera hain erraz iristen den benetako malgutasuna AIren eskura ez dago oraindik".



Iturria: 3dnews.ru

Gehitu iruzkin berria