DeepMind Agent57 AI pobjeđuje Atari igre bolje od čovjeka

Provođenje neuronske mreže kroz jednostavne video igrice je idealan način da se testira efikasnost njenog treninga, zahvaljujući jednostavnoj sposobnosti evaluacije rezultata završetka. Razvijen 2012. godine od strane DeepMind-a (dio Alphabeta), benčmark od 57 kultnih Atari 2600 igara postao je lakmus test za testiranje sposobnosti sistema za samoučenje. A evo Agent57, napredni RL agent (Reinforcement Learning) DeepMind, nedavno pokazao ogroman skok u odnosu na prethodne sisteme i bila je prva iteracija AI koja je premašila osnovnu liniju ljudskog igrača.

DeepMind Agent57 AI pobjeđuje Atari igre bolje od čovjeka

Agent57 AI uzima u obzir iskustvo prethodnih sistema kompanije i kombinuje algoritme za efikasno istraživanje okruženja sa meta-kontrolom. Konkretno, Agent57 je dokazao svoje nadljudske vještine u Pitfall, Montezuma's Revenge, Solaris i Skiing - igricama koje su ozbiljno testirale prethodne neuronske mreže. Prema istraživanju, Pitfall i Montezuma's Revenge prisiljavaju AI da više eksperimentira kako bi postigla bolje rezultate. Solaris i skijanje su teški za neuronske mreže jer nema mnogo znakova uspjeha - AI dugo ne zna da li radi pravu stvar. DeepMind je izgradio svoje naslijeđene AI agente kako bi omogućio Agentu57 da donosi bolje odluke o istraživanju okoline i procjeni performansi igara, kao i optimizaciji kompromisa između kratkoročnog i dugoročnog ponašanja u igrama poput skijanja.

Rezultati su impresivni, ali AI još uvijek ima dug put. Ovi sistemi mogu da rukuju samo jednom igrom u isto vreme, što je, prema rečima programera, u suprotnosti sa ljudskim mogućnostima: „Prava fleksibilnost koja tako lako dolazi do ljudskog mozga je još uvek izvan domašaja veštačke inteligencije.“



izvor: 3dnews.ru

Dodajte komentar