Provođenje neuronske mreže kroz jednostavne video igrice je idealan način da se testira efikasnost njenog treninga, zahvaljujući jednostavnoj sposobnosti evaluacije rezultata završetka. Razvijen 2012. godine od strane DeepMind-a (dio Alphabeta), benčmark od 57 kultnih Atari 2600 igara postao je lakmus test za testiranje sposobnosti sistema za samoučenje. A evo Agent57, napredni RL agent (Reinforcement Learning) DeepMind, nedavno
Agent57 AI uzima u obzir iskustvo prethodnih sistema kompanije i kombinuje algoritme za efikasno istraživanje okruženja sa meta-kontrolom. Konkretno, Agent57 je dokazao svoje nadljudske vještine u Pitfall, Montezuma's Revenge, Solaris i Skiing - igricama koje su ozbiljno testirale prethodne neuronske mreže. Prema istraživanju, Pitfall i Montezuma's Revenge prisiljavaju AI da više eksperimentira kako bi postigla bolje rezultate. Solaris i skijanje su teški za neuronske mreže jer nema mnogo znakova uspjeha - AI dugo ne zna da li radi pravu stvar. DeepMind je izgradio svoje naslijeđene AI agente kako bi omogućio Agentu57 da donosi bolje odluke o istraživanju okoline i procjeni performansi igara, kao i optimizaciji kompromisa između kratkoročnog i dugoročnog ponašanja u igrama poput skijanja.
Rezultati su impresivni, ali AI još uvijek ima dug put. Ovi sistemi mogu da rukuju samo jednom igrom u isto vreme, što je, prema rečima programera, u suprotnosti sa ljudskim mogućnostima: „Prava fleksibilnost koja tako lako dolazi do ljudskog mozga je još uvek izvan domašaja veštačke inteligencije.“
izvor: 3dnews.ru