DeepMind Agent57 AI premaga igre Atari bolje kot človek

Izdelava nevronske mreže, ki teče skozi preproste video igre, je idealen način za testiranje učinkovitosti njenega usposabljanja, zahvaljujoč preprosti zmožnosti ocenjevanja rezultatov dokončanja. Merilo uspešnosti 2012 ikoničnih iger Atari 57, ki ga je leta 2600 razvil DeepMind (del Alphabet), je postalo lakmusov papir za preizkušanje zmogljivosti samoučečih se sistemov. In tukaj je Agent57, napredni agent RL (Reinforcement Learning) DeepMind, pred kratkim pokazala velik preskok v primerjavi s prejšnjimi sistemi in je bila prva ponovitev umetne inteligence, ki je presegla osnovno linijo človeškega igralca.

DeepMind Agent57 AI premaga igre Atari bolje kot človek

Agent57 AI upošteva izkušnje prejšnjih sistemov podjetja in združuje algoritme za učinkovito raziskovanje okolja z metanadzorom. Še posebej je Agent57 dokazal svoje nadčloveške sposobnosti v Pitfall, Montezuma's Revenge, Solaris in Skiing – igrah, ki so bile na resni preizkušnji prejšnje nevronske mreže. Glede na raziskave Pitfall in Montezuma's Revenge prisilita AI, da več eksperimentira, da doseže boljše rezultate. Solaris in Skiing sta težka za nevronske mreže, ker ni veliko znakov uspeha - AI dolgo ne ve, ali dela pravo stvar. DeepMind je gradil na svojih podedovanih agentih AI, da bi Agentu57 omogočil sprejemanje boljših odločitev o raziskovanju okolja in ocenjevanju uspešnosti iger ter optimizaciji kompromisa med kratkoročnim in dolgoročnim vedenjem v igrah, kot je Skiing.

Rezultati so impresivni, a do umetne inteligence je še dolga pot. Ti sistemi lahko obdelujejo le eno igro naenkrat, kar je po besedah ​​razvijalcev v nasprotju s človeškimi zmožnostmi: "Prava prilagodljivost, ki jo tako enostavno dobijo človeški možgani, je še vedno izven dosega AI."



Vir: 3dnews.ru

Dodaj komentar