ДеепМинд Агент57 АИ побеђује Атари игре боље од човека

Провођење неуронске мреже кроз једноставне видео игрице је идеалан начин да се тестира ефикасност њене обуке, захваљујући једноставној способности да се процене резултати завршетка. Развијен 2012. од стране ДеепМинд-а (део Алпхабета), мерило од 57 култних Атари 2600 игара постало је лакмус тест за тестирање способности система за самоучење. А ево и Агент57, напредног РЛ агента (Реинфорцемент Леарнинг) ДеепМинд, недавно показао огроман скок у односу на претходне системе и била је прва итерација АИ која је премашила основну линију људског играча.

ДеепМинд Агент57 АИ побеђује Атари игре боље од човека

Агент57 АИ узима у обзир искуство претходних система компаније и комбинује алгоритме за ефикасно истраживање окружења са мета-контролом. Конкретно, Агент57 је доказао своје надљудске вештине у Питфалл, Монтезума'с Ревенге, Соларис и Скиинг - игрицама које су озбиљно тестирале претходне неуронске мреже. Према истраживању, Питфалл и Монтезума'с Ревенге присиљавају АИ да више експериментише како би постигао боље резултате. Соларис и скијање су тешки за неуронске мреже јер нема много знакова успеха - АИ дуго не зна да ли ради праву ствар. ДеепМинд је изградио своје старе АИ агенте како би омогућио Агенту57 да доноси боље одлуке о истраживању околине и процени перформанси игара, као и да оптимизује компромис између краткорочног и дугорочног понашања у играма као што је Скијање.

Резултати су импресивни, али АИ још треба да пређе дуг пут. Ови системи могу да рукују само једном игром у исто време, што је, према речима програмера, у супротности са људским могућностима: „Права флексибилност која тако лако долази до људског мозга је још увек ван домашаја вештачке интелигенције.“



Извор: 3дневс.ру

Додај коментар