DeepMind Agent57 AI võidab Atari mänge paremini kui inimene

Närvivõrgu käivitamine lihtsate videomängude kaudu on ideaalne viis selle koolituse tõhususe testimiseks tänu lihtsale võimalusele hinnata lõpetamise tulemusi. 2012. aastal DeepMindi (osa Alphabetist) poolt välja töötatud 57 ikoonilise Atari 2600 mängu etaloniks sai iseõppivate süsteemide võimekuse testimise lakmuspaber. Ja siin Agent57, arenenud RL agent (tugevõppe) DeepMind, hiljuti näitas tohutu hüpe eelmistest süsteemidest ja oli esimene AI iteratsioon, mis ületas inimmängija algtaseme.

DeepMind Agent57 AI võidab Atari mänge paremini kui inimene

Agent57 AI võtab arvesse ettevõtte varasemate süsteemide kogemusi ja kombineerib tõhusa keskkonna uurimise algoritme metakontrolliga. Eelkõige on Agent57 oma üliinimlikke oskusi tõestanud mängudes Pitfall, Montezuma's Revenge, Solaris ja Skiing – mängud, mis on varasemaid närvivõrke tõsiselt proovile pannud. Uuringute kohaselt sunnivad Pitfall ja Montezuma's Revenge AI-d paremate tulemuste saavutamiseks rohkem katsetama. Solaris ja suusatamine on närvivõrkude jaoks keerulised, sest edu märke pole palju – AI ei tea pikka aega, kas ta teeb õiget asja. DeepMind tugines oma AI-agentidele, et võimaldada Agent57-l teha paremaid otsuseid keskkonna uurimise ja mängude toimivuse hindamise kohta ning optimeerida lühi- ja pikaajalise käitumise vahelist kompromissi sellistes mängudes nagu suusatamine.

Tulemused on muljetavaldavad, kuid tehisintellektil on veel pikk tee minna. Need süsteemid saavad korraga hakkama ainult ühe mänguga, mis on arendajate sõnul vastuolus inimese võimalustega: "Tõeline paindlikkus, mis inimese ajule nii kergesti jõuab, on ikka veel AI-le kättesaamatu."



Allikas: 3dnews.ru

Lisa kommentaar