Провођење неуронске мреже кроз једноставне видео игрице је идеалан начин да се тестира ефикасност њене обуке, захваљујући једноставној способности да се процене резултати завршетка. Развијен 2012. од стране ДеепМинд-а (део Алпхабета), мерило од 57 култних Атари 2600 игара постало је лакмус тест за тестирање способности система за самоучење. А ево и Агент57, напредног РЛ агента (Реинфорцемент Леарнинг) ДеепМинд, недавно
Агент57 АИ узима у обзир искуство претходних система компаније и комбинује алгоритме за ефикасно истраживање окружења са мета-контролом. Конкретно, Агент57 је доказао своје надљудске вештине у Питфалл, Монтезума'с Ревенге, Соларис и Скиинг - игрицама које су озбиљно тестирале претходне неуронске мреже. Према истраживању, Питфалл и Монтезума'с Ревенге присиљавају АИ да више експериментише како би постигао боље резултате. Соларис и скијање су тешки за неуронске мреже јер нема много знакова успеха - АИ дуго не зна да ли ради праву ствар. ДеепМинд је изградио своје старе АИ агенте како би омогућио Агенту57 да доноси боље одлуке о истраживању околине и процени перформанси игара, као и да оптимизује компромис између краткорочног и дугорочног понашања у играма као што је Скијање.
Резултати су импресивни, али АИ још треба да пређе дуг пут. Ови системи могу да рукују само једном игром у исто време, што је, према речима програмера, у супротности са људским могућностима: „Права флексибилност која тако лако долази до људског мозга је још увек ван домашаја вештачке интелигенције.“
Извор: 3дневс.ру