DeepMind Agent57 AI bat jwèt Atari pi byen pase yon moun

Fè yon rezo neral kouri nan jwèt videyo senp se yon fason ideyal yo teste efikasite nan fòmasyon li yo, gras a kapasite nan senp yo evalye rezilta yo nan fini an. Devlope nan 2012 pa DeepMind (ki fè pati Alphabet), referans nan 57 iconiţă jwèt Atari 2600 te vin tounen yon tès litmus pou teste kapasite yo nan sistèm oto-aprantisaj. Ak isit la Agent57, yon ajan avanse RL (Reinforcement Learning) DeepMind, dènyèman te montre yon gwo kwasans nan sistèm anvan yo e li te premye iterasyon nan AI ki depase debaz jwè imen an.

DeepMind Agent57 AI bat jwèt Atari pi byen pase yon moun

Agent57 AI pran an kont eksperyans nan sistèm anvan konpayi an ak konbine algoritm pou eksplorasyon efikas nan anviwònman an ak meta-kontwòl. An patikilye, Agent57 te pwouve ladrès supermoun li nan Pyèj, Revenge Montezuma, Solaris ak Ski - jwèt ki te teste sevè rezo neral anvan yo. Dapre rechèch, Pitfall ak Montezuma's Revenge fòse AI a fè eksperyans plis pou reyalize pi bon rezilta. Solaris ak ski yo difisil pou rezo neral paske pa gen anpil siy siksè - AI a pa konnen pou yon tan long si li ap fè sa ki dwat. DeepMind te bati sou ajan AI eritaj li yo pou pèmèt Agent57 pran pi bon desizyon sou eksplore anviwònman an ak evalye pèfòmans jwèt yo, epi tou pou optimize konpwomi ant konpòtman kout tèm ak alontèm nan jwèt tankou Ski.

Rezilta yo enpresyonan, men AI toujou gen anpil wout pou l ale. Sistèm sa yo ka sèlman jere yon jwèt nan yon moman, ki, dapre devlopè yo, se kontrè ak kapasite imen an: "Vrè fleksibilite ki vini tèlman fasil nan sèvo imen an toujou pi lwen pase AI."



Sous: 3dnews.ru

Add nouvo kòmantè