DeepMind Agent57 AI Atari ойындарын адамға қарағанда жақсы жеңеді

Нейрондық желіні қарапайым бейне ойындар арқылы іске қосу - өту нәтижелерін бағалаудың қарапайым мүмкіндігіне байланысты оның жаттығуларының тиімділігін тексерудің тамаша тәсілі. 2012 жылы DeepMind (Alphabet холдингінің бөлігі) әзірлеген 57 танымал Atari 2600 ойынының эталоны өздігінен білім алу жүйелерінің мүмкіндіктерін сынауға арналған лакмус сынағы болды. Міне, Agent57, алдыңғы қатарлы RL агенті (Reinforcement Learning) DeepMind, өткен күні көрсетті алдыңғы жүйелерден үлкен секіріс болды және адам ойыншысының негізгі деңгейінен асып түсетін алғашқы AI итерациясы болды.

DeepMind Agent57 AI Atari ойындарын адамға қарағанда жақсы жеңеді

Agent57 AI компанияның бұрынғы жүйелерінің тәжірибесін ескереді және тиімді қоршаған ортаны барлау алгоритмдерін мета-бақылаумен біріктіреді. Атап айтқанда, Agent57 өзінің адамшылық қабілетін Pitfall, Montezuma's Revenge, Solaris және Skiing ойындарында дәлелдеді - бұл бұрынғы нейрондық желілер үшін маңызды сынақ болды. Зерттеулерге сәйкес, Pitfall және Montezuma's Revenge AI-ны жақсы нәтижелерге жету үшін көбірек тәжірибе жасауға мәжбүр етеді. Solaris және Skiing нейрондық желілер үшін қиын, өйткені сәттілік белгілері көп емес - AI ұзақ уақыт бойы дұрыс нәрсені істеп жатқанын білмейді. DeepMind өзінің ескі AI агенттеріне негізделген, осылайша Agent57 қоршаған ортаны зерттеуге және ойындардағы өнімділікті бағалауға қатысты жақсырақ шешімдер қабылдауға, сондай-ақ шаңғы тебу сияқты ойындарда қысқа мерзімді және ұзақ мерзімді мінез-құлық арасындағы сауданы оңтайландыруға мүмкіндік береді.

Нәтижелері әсерлі, бірақ AI әлі де ұзақ жолды бағындыруы керек. Бұл жүйелер бір уақытта бір ойынды ғана басқара алады, әзірлеушілер бұл ойын адамның мүмкіндіктеріне қайшы келеді: «Адам миына оңай келетін шынайы икемділік әлі де AI қол жеткізе алмайды».



Ақпарат көзі: 3dnews.ru

пікір қалдыру