Spustenie neurónovej siete pomocou jednoduchých videohier je ideálny spôsob, ako otestovať efektivitu jej tréningu vďaka jednoduchej schopnosti vyhodnocovať výsledky dokončenia. Benchmark 2012 ikonických hier Atari 57, vyvinutý v roku 2600 spoločnosťou DeepMind (súčasť Alphabet), sa stal lakmusovým papierikom na testovanie schopností samoučiacich sa systémov. A tu Agent57, pokročilý RL agent (Reinforcement Learning) DeepMind, nedávno
Agent57 AI zohľadňuje skúsenosti z predchádzajúcich systémov spoločnosti a kombinuje algoritmy na efektívne skúmanie prostredia s meta-kontrolou. Agent57 preukázal svoje nadľudské schopnosti najmä v hrách Pitfall, Montezuma's Revenge, Solaris a Skiing – hry, ktoré tvrdo testovali predchádzajúce neurónové siete. Podľa výskumu Pitfall a Montezuma's Revenge nútia AI viac experimentovať, aby dosiahli lepšie výsledky. Solaris a Skiing sú ťažké pre neurónové siete, pretože nie je veľa známok úspechu - AI dlho nevie, či robí správnu vec. DeepMind staval na svojich starších agentoch AI, aby umožnil Agent57 robiť lepšie rozhodnutia o skúmaní prostredia a hodnotení výkonu hier, ako aj pri optimalizácii kompromisu medzi krátkodobým a dlhodobým správaním v hrách, ako je Lyžovanie.
Výsledky sú pôsobivé, ale AI má pred sebou ešte dlhú cestu. Tieto systémy dokážu naraz zvládnuť iba jednu hru, čo je podľa vývojárov v rozpore s ľudskými schopnosťami: „Skutočná flexibilita, ktorá sa tak ľahko dostáva do ľudského mozgu, je stále mimo dosahu AI.“
Zdroj: 3dnews.ru