DeepMind Agent57 AI supera els jocs Atari millor que un humà

Fer funcionar una xarxa neuronal a través de videojocs senzills és una manera ideal de provar l'efectivitat del seu entrenament a causa de la senzilla capacitat d'avaluar els resultats del pas. Desenvolupat el 2012 per DeepMind (part del holding Alphabet), el punt de referència de 57 jocs emblemàtics d'Atari 2600 s'ha convertit en una prova de foc per provar les capacitats dels sistemes d'autoaprenentatge. I aquí hi ha Agent57, un agent avançat de RL (aprenentatge de reforç) DeepMind, l'altre dia va mostrar un gran salt dels sistemes anteriors i va ser la primera iteració d'IA que va superar la línia de base d'un jugador humà.

DeepMind Agent57 AI supera els jocs Atari millor que un humà

Agent57 AI té en compte l'experiència dels sistemes anteriors de l'empresa i combina algorismes per a una exploració ambiental eficient amb metacontrol. En particular, Agent57 ha demostrat les seves habilitats sobrehumanes a Pitfall, Montezuma's Revenge, Solaris i Skiing, jocs que han estat una prova seriosa per a xarxes neuronals anteriors. Segons la investigació, Pitfall i Montezuma's Revenge obliguen la IA a experimentar més per aconseguir millors resultats. Solaris i Skiing són difícils per a les xarxes neuronals perquè no hi ha molts signes d'èxit; la IA fa molt de temps que no sap si està fent el correcte. DeepMind es va basar en els seus antics agents d'IA perquè Agent57 pogués prendre millors decisions pel que fa a l'exploració ambiental i l'avaluació del rendiment en jocs, així com optimitzar el compromís entre el comportament a curt i llarg termini en jocs com l'esquí.

Els resultats són impressionants, però la IA encara té un llarg camí per recórrer. Aquests sistemes només poden gestionar un joc a la vegada, cosa que, segons els desenvolupadors, va en contra de les capacitats humanes: "La veritable flexibilitat que arriba tan fàcilment al cervell humà encara està fora de l'abast de la IA".



Font: 3dnews.ru

Afegeix comentari