DeepMind Agent57 人工智慧比人類更好地擊敗 Atari 遊戲

讓神經網路運行簡單的視頻遊戲是測試其訓練有效性的理想方法,因為它可以簡單地評估完成結果。 由 DeepMind(Alphabet 旗下)於 2012 年開發,57 款標誌性 Atari 2600 遊戲的基準測試成為測試自學習系統能力的試金石。 這裡 Agent57,一個高級 RL 代理(強化學習)DeepMind,最近 顯示 與先前的系統相比,這是一個巨大的飛躍,也是人工智慧首次超越人類玩家的基線。

DeepMind Agent57 人工智慧比人類更好地擊敗 Atari 遊戲

Agent57 AI考慮了公司先前系統的經驗,並將有效探索環境的演算法與元控制相結合。 特別是,Agent57 在《陷阱》、《蒙特祖瑪的復仇》、《Solaris》和《滑雪》等遊戲中證明了他超人的技能,這些遊戲都對以前的神經網路進行了嚴格的考驗。 根據研究,《陷阱》和《蒙特祖瑪的復仇》迫使人工智慧進行更多實驗,以獲得更好的結果。 Solaris 和 Skiing 對神經網路來說很困難,因為沒有太多成功的跡象 - AI 很長一段時間都不知道自己是否在做正確的事情。 DeepMind 在其傳統 AI 代理的基礎上構建,使 Agent57 能夠在探索環境和評估遊戲性能以及優化滑雪等遊戲中的短期和長期行為之間的權衡方面做出更好的決策。

結果令人印象深刻,但人工智慧還有很長的路要走。 這些系統一次只能處理一款遊戲,據開發人員稱,這與人類的能力相悖:“人腦如此容易實現的真正靈活性仍然超出了人工智慧的能力範圍。”



來源: 3dnews.ru

添加評論