DeepMind Agent57 AI voittaa Atari-pelit paremmin kuin ihminen

Neuraaliverkon saattaminen toimimaan yksinkertaisten videopelien kautta on ihanteellinen tapa testata sen harjoittelun tehokkuutta, koska on helppo arvioida suorituksen tuloksia. DeepMindin (osa Alphabetia) vuonna 2012 kehittämä 57 ikonisen Atari 2600 -pelin vertailuarvo tuli lakmuskoetiksi itseoppivien järjestelmien ominaisuuksien testaamiseen. Ja tässä Agent57, edistynyt RL-agentti (Reinforcement Learning) DeepMind, äskettäin hän osoitti valtava harppaus aiemmista järjestelmistä ja oli ensimmäinen tekoälyn iteraatio, joka ylitti ihmispelaajan perustason.

DeepMind Agent57 AI voittaa Atari-pelit paremmin kuin ihminen

Agent57 AI ottaa huomioon kokemuksen yrityksen aiemmista järjestelmistä ja yhdistää tehokkaan ympäristön tutkimisen algoritmit metaohjaukseen. Erityisesti Agent57 on osoittanut yli-inhimilliset taitonsa Pitfall-, Montezuma's Revenge-, Solaris- ja Skiing-peleissä, jotka ovat koetelleet aiempia hermoverkkoja. Tutkimuksen mukaan Pitfall ja Montezuma's Revenge pakottavat tekoälyn kokeilemaan enemmän saavuttaakseen parempia tuloksia. Solaris ja hiihto ovat vaikeita hermoverkoille, koska menestymisen merkkejä ei ole juurikaan havaittavissa – tekoäly ei tiedä pitkään aikaan, toimiiko se oikein. DeepMind rakensi vanhoihin tekoälyagentteihinsa, jotta Agent57 voi tehdä parempia päätöksiä ympäristön tutkimisesta ja pelien suorituskyvyn arvioinnista sekä optimoida lyhyen ja pitkän aikavälin käyttäytymisen välinen kompromissi hiihtopeleissä.

Tulokset ovat vaikuttavia, mutta tekoälyllä on vielä pitkä matka kuljettavana. Nämä järjestelmät pystyvät käsittelemään vain yhtä peliä kerrallaan, mikä on kehittäjien mukaan vastoin ihmisen kykyjä: "Todellinen joustavuus, joka tulee niin helposti ihmisen aivoihin, on edelleen tekoälyn ulottumattomissa."



Lähde: 3dnews.ru

Lisää kommentti