DeepMind Agent57 人工智能比人类更好地击败 Atari 游戏

让神经网络运行简单的视频游戏是测试其训练有效性的理想方法,因为它可以简单地评估完成结果。 由 DeepMind(Alphabet 旗下)于 2012 年开发,57 款标志性 Atari 2600 游戏的基准测试成为测试自学习系统能力的试金石。 这里 Agent57,一个高级 RL 代理(强化学习)DeepMind,最近 显示 与之前的系统相比,这是一个巨大的飞跃,也是人工智能首次超越人类玩家的基线。

DeepMind Agent57 人工智能比人类更好地击败 Atari 游戏

Agent57 AI考虑了公司之前系统的经验,并将有效探索环境的算法与元控制相结合。 特别是,Agent57 在《陷阱》、《蒙特祖玛的复仇》、《Solaris》和《滑雪》等游戏中证明了他超人的技能,这些游戏都对以前的神经网络进行了严格的考验。 根据研究,《陷阱》和《蒙特祖玛的复仇》迫使人工智能进行更多实验,以获得更好的结果。 Solaris 和 Skiing 对于神经网络来说很困难,因为没有太多成功的迹象 - AI 很长一段时间都不知道自己是否在做正确的事情。 DeepMind 在其传统 AI 代理的基础上构建,使 Agent57 能够在探索环境和评估游戏性能以及优化滑雪等游戏中的短期和长期行为之间的权衡方面做出更好的决策。

结果令人印象深刻,但人工智能还有很长的路要走。 这些系统一次只能处理一款游戏,据开发人员称,这与人类的能力相悖:“人脑如此容易实现的真正灵活性仍然超出了人工智能的能力范围。”



来源: 3dnews.ru

添加评论