DeepMind Agent57 AI jegħleb il-logħob Atari aħjar minn bniedem

Li tagħmel netwerk newrali jaħdem permezz ta 'logħob tal-kompjuter sempliċi huwa mod ideali biex tittestja l-effettività tat-taħriġ tiegħu, grazzi għall-abbiltà sempliċi li tevalwa r-riżultati tat-tlestija. Żviluppat fl-2012 minn DeepMind (parti minn Alphabet), il-punt ta 'referenza ta' 57 logħba emblematika Atari 2600 sar test litmus għall-ittestjar tal-kapaċitajiet ta 'sistemi ta' tagħlim għal rashom. U hawn Agent57, aġent RL avvanzat (Reinforcement Learning) DeepMind, reċentement wera qabża kbira mis-sistemi preċedenti u kienet l-ewwel iterazzjoni tal-AI li qabeż il-linja bażi tal-plejer uman.

DeepMind Agent57 AI jegħleb il-logħob Atari aħjar minn bniedem

Agent57 AI tqis l-esperjenza tas-sistemi preċedenti tal-kumpanija u tgħaqqad algoritmi għal esplorazzjoni effiċjenti tal-ambjent b'meta-kontroll. B'mod partikolari, Agent57 wera l-ħiliet superumani tiegħu f'Pitfall, Montezuma's Revenge, Solaris u Skiing - logħob li ttestjaw severament in-netwerks newrali preċedenti. Skont ir-riċerka, Pitfall u Montezuma's Revenge jġiegħlu lill-AI tesperimenta aktar biex tikseb riżultati aħjar. Solaris u Skiing huma diffiċli għan-netwerks newrali minħabba li m'hemmx ħafna sinjali ta 'suċċess - l-AI ma tafx għal żmien twil jekk hijiex tagħmel it-tajjeb. DeepMind bena fuq l-aġenti AI tal-wirt tiegħu biex jippermetti lil Agent57 jieħu deċiżjonijiet aħjar dwar l-esplorazzjoni tal-ambjent u l-valutazzjoni tal-prestazzjoni tal-logħob, kif ukoll l-ottimizzazzjoni tal-kompromess bejn l-imġiba għal żmien qasir u fit-tul f’logħob bħall-Iskijar.

Ir-riżultati huma impressjonanti, iżda l-AI għad fadlilha triq twila. Dawn is-sistemi jistgħu jimmaniġġjaw logħba waħda biss, li, skont l-iżviluppaturi, hija kuntrarja għall-kapaċitajiet tal-bniedem: "Il-flessibbiltà vera li tasal daqshekk faċilment għall-moħħ tal-bniedem għadha lil hinn mil-lat tal-AI."



Sors: 3dnews.ru

Żid kumment