DeepMind Agent57 AI pobjeđuje igre Atari bolje od čovjeka

Provođenje neuronske mreže kroz jednostavne video igre idealan je način testiranja učinkovitosti njezine obuke, zahvaljujući jednostavnoj mogućnosti evaluacije rezultata završetka. Razvio ga je 2012. DeepMind (dio Alphabeta), mjerilo 57 kultnih igara Atari 2600 postalo je lakmus test za testiranje sposobnosti samoučećih sustava. I ovdje Agent57, napredni RL agent (Reinforcement Learning) DeepMind, nedavno pokazala veliki skok u odnosu na prethodne sustave i bila je prva iteracija umjetne inteligencije koja je premašila osnovnu liniju ljudskog igrača.

DeepMind Agent57 AI pobjeđuje igre Atari bolje od čovjeka

Agent57 AI uzima u obzir iskustvo prethodnih sustava tvrtke i kombinira algoritme za učinkovito istraživanje okoline s meta-kontrolom. Konkretno, Agent57 je dokazao svoje nadljudske vještine u igricama Pitfall, Montezuma's Revenge, Solaris i Skiing - igrama koje su ozbiljno testirale prethodne neuronske mreže. Prema istraživanju, Pitfall i Montezuma's Revenge tjeraju AI da više eksperimentira kako bi postigao bolje rezultate. Solaris i Skijanje su teški za neuronske mreže jer nema mnogo znakova uspjeha - AI dugo ne zna radi li pravu stvar. DeepMind je izgrađen na svojim naslijeđenim AI agentima kako bi Agentu57 omogućio donošenje boljih odluka o istraživanju okoline i procjeni performansi igara, kao i optimiziranju kompromisa između kratkoročnog i dugoročnog ponašanja u igrama kao što je Skijanje.

Rezultati su impresivni, ali pred umjetnom inteligencijom je još dug put. Ovi sustavi mogu nositi samo s jednom igrom u isto vrijeme, što je, prema programerima, u suprotnosti s ljudskim sposobnostima: "Prava fleksibilnost koja tako lako dolazi ljudskom mozgu još uvijek je izvan dosega AI."



Izvor: 3dnews.ru

Dodajte komentar