DeepMind Agent57 AI schléit Atari Spiller besser wéi e Mënsch

En neuralt Netzwierk duerch einfache Videospiller ze maachen ass en ideale Wee fir d'Effizienz vu sengem Training ze testen, dank der einfacher Fäegkeet fir d'Resultater vun der Fäerdegstellung ze evaluéieren. Entwéckelt am 2012 vum DeepMind (Deel vum Alphabet), de Benchmark vu 57 ikonesche Atari 2600 Spiller gouf e Litmustest fir d'Fäegkeete vu Selbstléiersystemer ze testen. An hei Agent57, en fortgeschratt RL Agent (Reinforcement Learning) DeepMind, viru kuerzem gewisen e grousse Sprong vu fréiere Systemer a war déi éischt Iteratioun vun AI fir d'Basisline vum mënschleche Spiller ze iwwerschreiden.

DeepMind Agent57 AI schléit Atari Spiller besser wéi e Mënsch

Agent57 AI berücksichtegt d'Erfahrung vun de fréiere Systemer vun der Firma a kombinéiert Algorithmen fir effizient Exploratioun vun der Ëmwelt mat Meta-Kontroll. Besonnesch Agent57 huet seng iwwermënschlech Fäegkeeten an Pitfall, Montezuma's Revenge, Solaris a Ski bewisen - Spiller déi fréier neural Netzwierker schwéier getest hunn. Laut Fuerschung, Pitfall a Montezuma's Revenge forcéiere den AI ​​méi ze experimentéieren fir besser Resultater ze erreechen. Solaris a Ski sinn schwéier fir neural Netzwierker well et net vill Zeeche vum Erfolleg sinn - den AI weess laang net ob et déi richteg Saach mécht. DeepMind huet op seng legacy AI Agenten gebaut fir Agent57 z'erméiglechen besser Entscheedungen iwwer d'Entdeckung vun der Ëmwelt ze huelen an d'Leeschtung vu Spiller ze bewäerten, souwéi d'Optimisatioun vum Austausch tëscht kuerzfristeg a laangfristeg Verhalen a Spiller wéi Ski.

D'Resultater sinn beandrockend, awer AI huet nach e laange Wee ze goen. Dës Systemer kënnen nëmmen ee Spill gläichzäiteg handhaben, wat, laut den Entwéckler, am Géigesaz zu de mënschleche Fäegkeeten ass: "Déi richteg Flexibilitéit déi sou einfach zum mënschleche Gehir kënnt ass nach ëmmer iwwer d'Erreeche vun AI."



Source: 3dnews.ru

Setzt e Commentaire