DeepMind Agent57 AI-ն ավելի լավ է հաղթում Atari-ի խաղերին, քան մարդուն

Պարզ տեսախաղերի միջոցով նեյրոնային ցանցի ստեղծումը իդեալական միջոց է փորձարկելու դրա ուսուցման արդյունավետությունը՝ ավարտի արդյունքները գնահատելու պարզ ունակության շնորհիվ: Մշակված 2012 թվականին DeepMind-ի կողմից (Alphabet-ի մի մաս), 57 խորհրդանշական Atari 2600 խաղերի չափանիշը դարձավ լակմուսի թեստ ինքնաուսուցման համակարգերի հնարավորությունները ստուգելու համար: Եվ ահա Agent57, առաջադեմ RL գործակալ (Reinforcement Learning) DeepMind, վերջերս ցույց տվեց հսկայական թռիչք նախորդ համակարգերից և AI-ի առաջին կրկնությունն էր, որը գերազանցեց մարդկային խաղացողի բազային ցուցանիշը:

DeepMind Agent57 AI-ն ավելի լավ է հաղթում Atari-ի խաղերին, քան մարդուն

Agent57 AI-ն հաշվի է առնում ընկերության նախորդ համակարգերի փորձը և համատեղում է ալգորիթմները շրջակա միջավայրի արդյունավետ հետազոտման համար մետա-վերահսկման հետ: Մասնավորապես, Agent57-ը ապացուցել է իր գերմարդկային հմտությունները Pitfall-ում, Montezuma's Revenge-ում, Solaris-ում և Skiing-ում, խաղեր, որոնք խստորեն փորձարկել են նախորդ նեյրոնային ցանցերը: Հետազոտության համաձայն՝ Փիթֆոլը և Մոնթեզումայի վրեժը ստիպում են AI-ին ավելի շատ փորձեր կատարել՝ ավելի լավ արդյունքների հասնելու համար: Solaris-ը և դահուկավազքը դժվար են նյարդային ցանցերի համար, քանի որ հաջողության շատ նշաններ չկան. AI-ն երկար ժամանակ չգիտի, թե արդյոք ճիշտ է անում: DeepMind-ը հիմնվել է իր ժառանգական AI գործակալների վրա, որպեսզի Agent57-ին թույլ տա ավելի լավ որոշումներ կայացնել շրջակա միջավայրը ուսումնասիրելու և խաղերի կատարողականությունը գնահատելու վերաբերյալ, ինչպես նաև օպտիմալացնել կարճաժամկետ և երկարաժամկետ վարքագծի փոխզիջումը այնպիսի խաղերում, ինչպիսին է դահուկավազքը:

Արդյունքները տպավորիչ են, բայց AI-ն դեռ երկար ճանապարհ ունի անցնելու: Այս համակարգերը կարող են միաժամանակ կառավարել միայն մեկ խաղ, ինչը, ըստ մշակողների, հակասում է մարդու հնարավորություններին.



Source: 3dnews.ru

Добавить комментарий