Provođenje neuronske mreže kroz jednostavne video igre idealan je način testiranja učinkovitosti njezine obuke, zahvaljujući jednostavnoj mogućnosti evaluacije rezultata završetka. Razvio ga je 2012. DeepMind (dio Alphabeta), mjerilo 57 kultnih igara Atari 2600 postalo je lakmus test za testiranje sposobnosti samoučećih sustava. I ovdje Agent57, napredni RL agent (Reinforcement Learning) DeepMind, nedavno
Agent57 AI uzima u obzir iskustvo prethodnih sustava tvrtke i kombinira algoritme za učinkovito istraživanje okoline s meta-kontrolom. Konkretno, Agent57 je dokazao svoje nadljudske vještine u igricama Pitfall, Montezuma's Revenge, Solaris i Skiing - igrama koje su ozbiljno testirale prethodne neuronske mreže. Prema istraživanju, Pitfall i Montezuma's Revenge tjeraju AI da više eksperimentira kako bi postigao bolje rezultate. Solaris i Skijanje su teški za neuronske mreže jer nema mnogo znakova uspjeha - AI dugo ne zna radi li pravu stvar. DeepMind je izgrađen na svojim naslijeđenim AI agentima kako bi Agentu57 omogućio donošenje boljih odluka o istraživanju okoline i procjeni performansi igara, kao i optimiziranju kompromisa između kratkoročnog i dugoročnog ponašanja u igrama kao što je Skijanje.
Rezultati su impresivni, ali pred umjetnom inteligencijom je još dug put. Ovi sustavi mogu nositi samo s jednom igrom u isto vrijeme, što je, prema programerima, u suprotnosti s ljudskim sposobnostima: "Prava fleksibilnost koja tako lako dolazi ljudskom mozgu još uvijek je izvan dosega AI."
Izvor: 3dnews.ru