DeepMind Agent57 AI slår Atari-spill bedre enn et menneske

Å få et nevralt nettverk til å kjøre gjennom enkle videospill er en ideell måte å teste effektiviteten av treningen på, takket være den enkle muligheten til å evaluere resultatene av fullføringen. Utviklet i 2012 av DeepMind (del av Alphabet), ble benchmarken til 57 ikoniske Atari 2600-spill en lakmustest for å teste egenskapene til selvlærende systemer. Og her Agent57, en avansert RL-agent (Reinforcement Learning) DeepMind, nylig viste et stort sprang fra tidligere systemer og var den første iterasjonen av AI som oversteg den menneskelige spillerens grunnlinje.

DeepMind Agent57 AI slår Atari-spill bedre enn et menneske

Agent57 AI tar hensyn til erfaringen fra selskapets tidligere systemer og kombinerer algoritmer for effektiv utforskning av miljøet med metakontroll. Spesielt har Agent57 bevist sine overmenneskelige ferdigheter i Pitfall, Montezuma's Revenge, Solaris og Skiing – spill som har testet tidligere nevrale nettverk alvorlig. Ifølge forskning tvinger Pitfall og Montezuma's Revenge AI til å eksperimentere mer for å oppnå bedre resultater. Solaris og ski er vanskelig for nevrale nettverk fordi det ikke er mange tegn på suksess - AI vet ikke på lenge om den gjør det rette. DeepMind bygde på sine eldre AI-agenter for å la Agent57 ta bedre beslutninger om å utforske miljøet og vurdere ytelsen til spill, i tillegg til å optimalisere avveiningen mellom kortsiktig og langsiktig atferd i spill som Ski.

Resultatene er imponerende, men AI har fortsatt en lang vei å gå. Disse systemene kan bare håndtere ett spill om gangen, noe som ifølge utviklerne er i strid med menneskelige evner: "Den sanne fleksibiliteten som kommer så lett til den menneskelige hjernen er fortsatt utenfor rekkevidden av AI."



Kilde: 3dnews.ru

Legg til en kommentar