DeepMind Agent57 AI klop Atari-speletjies beter as 'n mens

Om 'n neurale netwerk deur eenvoudige videospeletjies te laat loop, is 'n ideale manier om die doeltreffendheid van sy opleiding te toets, danksy die eenvoudige vermoë om die resultate van die voltooiing te evalueer. Die maatstaf van 2012 ikoniese Atari 57-speletjies, wat in 2600 deur DeepMind (deel van Alphabet) ontwikkel is, het 'n lakmoestoets geword om die vermoëns van selfleerstelsels te toets. En hier is Agent57, 'n gevorderde RL-agent (Reinforcement Learning) DeepMind, onlangs gewys 'n groot sprong vanaf vorige stelsels en was die eerste herhaling van KI wat die menslike speler se basislyn oorskry het.

DeepMind Agent57 AI klop Atari-speletjies beter as 'n mens

Agent57 AI neem die ervaring van die maatskappy se vorige stelsels in ag en kombineer algoritmes vir doeltreffende verkenning van die omgewing met metabeheer. Agent57 het veral sy bomenslike vaardighede in Pitfall, Montezuma's Revenge, Solaris en Skiing bewys - speletjies wat vorige neurale netwerke ernstig getoets het. Volgens navorsing dwing Pitfall en Montezuma's Revenge die KI om meer te eksperimenteer om beter resultate te behaal. Solaris en Ski is moeilik vir neurale netwerke omdat daar nie baie tekens van sukses is nie - die KI weet lankal nie of dit die regte ding doen nie. DeepMind het voortgebou op sy erfenis-KI-agente om Agent57 in staat te stel om beter besluite te neem oor die verkenning van die omgewing en die evaluering van deurspeel, sowel as om die afweging tussen korttermyn- en langtermyngedrag in speletjies soos Ski te optimaliseer.

Die resultate is indrukwekkend, maar KI het nog 'n lang pad om te gaan. Hierdie stelsels kan net een speletjie op 'n slag hanteer, wat volgens die ontwikkelaars teenstrydig is met menslike vermoëns: "Die ware buigsaamheid wat so maklik na die menslike brein kom, is steeds buite die bereik van KI."



Bron: 3dnews.ru

Voeg 'n opmerking