A DeepMind Agent57 AI jobban veri az Atari játékokat, mint az ember

A neurális hálózat egyszerű videojátékokon keresztül történő futtatása ideális módja annak, hogy tesztelje a képzés hatékonyságát, köszönhetően a befejezés eredményeinek egyszerű értékelésének. A DeepMind (az Alphabet része) által 2012-ben kifejlesztett 57 ikonikus Atari 2600 játék etalonja az öntanuló rendszerek képességeinek tesztelésének lakmusz tesztjévé vált. És itt a közelmúltban az Agent57, egy fejlett RL ügynök (Reinforcement Learning) DeepMind megmutatta hatalmas ugrás a korábbi rendszerekhez képest, és ez volt az AI első iterációja, amely túllépte az emberi játékos alapvonalát.

A DeepMind Agent57 AI jobban veri az Atari játékokat, mint az ember

Az Agent57 AI figyelembe veszi a vállalat korábbi rendszereinek tapasztalatait, és a környezet hatékony feltárására szolgáló algoritmusokat kombinálja a metavezérléssel. Az Agent57 különösen a Pitfall, a Montezuma's Revenge, a Solaris és a Skiing játékokban bizonyította emberfeletti képességeit – olyan játékokban, amelyek komolyan tesztelték a korábbi neurális hálózatokat. Kutatások szerint a Pitfall és a Montezuma's Revenge arra kényszeríti az AI-t, hogy többet kísérletezzen a jobb eredmények elérése érdekében. A Solaris és a Skiing nehézkes a neurális hálózatok számára, mert nem sok jele van a sikernek – az AI sokáig nem tudja, hogy helyesen cselekszik-e. A DeepMind a régi mesterséges intelligencia-ügynökeire épített, hogy lehetővé tegye az Agent57 számára, hogy jobb döntéseket hozzon a környezet feltárásával és a játékok teljesítményének felmérésével kapcsolatban, valamint optimalizálja a kompromisszumot a rövid távú és hosszú távú viselkedés között olyan játékokban, mint a síelés.

Az eredmények lenyűgözőek, de a mesterséges intelligencia még mindig hosszú út áll előttünk. Ezek a rendszerek egyszerre csak egy játékot tudnak kezelni, ami a fejlesztők szerint ellentétes az emberi képességekkel: „Az igazi rugalmasság, amely az emberi agyat oly könnyen eléri, még mindig meghaladja az AI-t.”



Forrás: 3dnews.ru

Hozzászólás