DeepMind Agent57 AI inashinda michezo ya Atari kuliko binadamu

Kufanya mtandao wa neva kupitia michezo rahisi ya video ni njia bora ya kupima ufanisi wa mafunzo yake, kutokana na uwezo rahisi wa kutathmini matokeo ya kukamilika. Iliyoundwa mwaka wa 2012 na DeepMind (sehemu ya Alfabeti), alama ya alama za michezo 57 ya Atari 2600 ikawa jaribio la kupima uwezo wa mifumo ya kujifunzia. Na hapa Agent57, wakala wa hali ya juu wa RL (Reinforcement Learning) DeepMind, hivi majuzi. ilionyeshwa kiwango kikubwa kutoka kwa mifumo ya awali na ilikuwa marudio ya kwanza ya AI kuzidi msingi wa mchezaji wa binadamu.

DeepMind Agent57 AI inashinda michezo ya Atari kuliko binadamu

Agent57 AI inazingatia uzoefu wa mifumo ya awali ya kampuni na inachanganya kanuni za uchunguzi wa mazingira kwa ufanisi na udhibiti wa meta. Hasa, Agent57 amethibitisha ujuzi wake wa ajabu katika Pitfall, Revenge ya Montezuma, Solaris na Skiing - michezo ambayo imejaribu sana mitandao ya awali ya neva. Kulingana na utafiti, Pitfall na Kisasi cha Montezuma hulazimisha AI kufanya majaribio zaidi ili kufikia matokeo bora. Solaris na Skiing ni ngumu kwa mitandao ya neural kwa sababu hakuna dalili nyingi za mafanikio - AI haijui kwa muda mrefu ikiwa inafanya jambo sahihi. DeepMind imejengwa juu ya mawakala wake wa zamani wa AI ili kuruhusu Agent57 kufanya maamuzi bora zaidi kuhusu kuchunguza mazingira na kutathmini utendakazi wa michezo, na pia kuboresha ubadilishanaji kati ya tabia ya muda mfupi na ya muda mrefu katika michezo kama vile Skiing.

Matokeo ni ya kuvutia, lakini AI bado ina njia ndefu ya kufanya. Mifumo hii inaweza kushughulikia mchezo mmoja tu kwa wakati mmoja, ambao, kulingana na watengenezaji, ni kinyume na uwezo wa binadamu: "Unyumbufu wa kweli unaokuja kwa urahisi kwa ubongo wa mwanadamu bado uko nje ya kufikiwa na AI."



Chanzo: 3dnews.ru

Kuongeza maoni