DeepMind Agent57 AI slår Atari-spel bättre än en människa

Att få ett neuralt nätverk att köras genom enkla videospel är ett idealiskt sätt att testa effektiviteten av dess träning, tack vare den enkla förmågan att utvärdera resultatet av slutförandet. Utvecklat 2012 av DeepMind (en del av Alphabet), blev riktmärket för 57 ikoniska Atari 2600-spel ett lackmustest för att testa förmågan hos självlärande system. Och här Agent57, en avancerad RL-agent (Reinforcement Learning) DeepMind, nyligen visade ett stort steg från tidigare system och var den första iterationen av AI som överträffade den mänskliga spelarens baslinje.

DeepMind Agent57 AI slår Atari-spel bättre än en människa

Agent57 AI tar hänsyn till erfarenheten från företagets tidigare system och kombinerar algoritmer för effektiv utforskning av miljön med metakontroll. I synnerhet har Agent57 bevisat sina övermänskliga färdigheter i Pitfall, Montezuma's Revenge, Solaris och Skiing – spel som har testat tidigare neurala nätverk rejält. Enligt forskning tvingar Pitfall och Montezuma's Revenge AI att experimentera mer för att uppnå bättre resultat. Solaris och skidåkning är svåra för neurala nätverk eftersom det inte finns många tecken på framgång - AI:n vet inte på länge om den gör rätt. DeepMind byggde på sina äldre AI-agenter för att låta Agent57 fatta bättre beslut om att utforska miljön och bedöma spelprestanda, samt optimera avvägningen mellan kortsiktigt och långsiktigt beteende i spel som skidåkning.

Resultaten är imponerande, men AI har fortfarande en lång väg kvar att gå. Dessa system kan bara hantera ett spel åt gången, vilket, enligt utvecklarna, strider mot mänskliga förmågor: "Den verkliga flexibiliteten som kommer så lätt till den mänskliga hjärnan är fortfarande utom räckhåll för AI."



Källa: 3dnews.ru

Lägg en kommentar