DeepMind Agent57 AI verslaat Atari-games beter dan een mens

Een neuraal netwerk door eenvoudige videogames laten lopen, is een ideale manier om de effectiviteit van de training te testen, dankzij de eenvoudige mogelijkheid om de resultaten van de voltooiing te evalueren. De benchmark van 2012 iconische Atari 57-games, ontwikkeld in 2600 door DeepMind (onderdeel van Alphabet), werd een lakmoesproef voor het testen van de mogelijkheden van zelflerende systemen. En hier Agent57, onlangs een geavanceerde RL-agent (Reinforcement Learning) DeepMind toonde een enorme sprong ten opzichte van eerdere systemen en het was de eerste iteratie van AI die de basislijn van de menselijke speler overtrof.

DeepMind Agent57 AI verslaat Atari-games beter dan een mens

Agent57 AI houdt rekening met de ervaring van de eerdere systemen van het bedrijf en combineert algoritmen voor efficiënte verkenning van de omgeving met metacontrole. In het bijzonder heeft Agent57 zijn bovenmenselijke vaardigheden bewezen in Pitfall, Montezuma's Revenge, Solaris en Skiing - games die eerdere neurale netwerken zwaar op de proef hebben gesteld. Volgens onderzoek dwingen Pitfall en Montezuma's Revenge de AI om meer te experimenteren om betere resultaten te bereiken. Solaris en Skiën zijn moeilijk voor neurale netwerken omdat er niet veel tekenen van succes zijn - de AI weet lange tijd niet of hij het goede doet. DeepMind bouwde voort op zijn oude AI-agents om Agent57 in staat te stellen betere beslissingen te nemen over het verkennen van de omgeving en het beoordelen van de prestaties van games, en om de wisselwerking tussen gedrag op de korte en lange termijn in games als Skiën te optimaliseren.

De resultaten zijn indrukwekkend, maar AI heeft nog een lange weg te gaan. Deze systemen kunnen slechts één game tegelijk aan, wat volgens de ontwikkelaars in strijd is met de menselijke capaciteiten: “De echte flexibiliteit die zo gemakkelijk tot het menselijk brein komt, ligt nog steeds buiten het bereik van AI.”



Bron: 3dnews.ru

Voeg een reactie