Umelá inteligencia DeepMind Agent57 porazí hry Atari lepšie ako človek

Spustenie neurónovej siete pomocou jednoduchých videohier je ideálny spôsob, ako otestovať efektivitu jej tréningu vďaka jednoduchej schopnosti vyhodnocovať výsledky dokončenia. Benchmark 2012 ikonických hier Atari 57, vyvinutý v roku 2600 spoločnosťou DeepMind (súčasť Alphabet), sa stal lakmusovým papierikom na testovanie schopností samoučiacich sa systémov. A tu Agent57, pokročilý RL agent (Reinforcement Learning) DeepMind, nedávno ukázal obrovský skok oproti predchádzajúcim systémom a bola to prvá iterácia AI, ktorá prekročila základnú líniu ľudského hráča.

Umelá inteligencia DeepMind Agent57 porazí hry Atari lepšie ako človek

Agent57 AI zohľadňuje skúsenosti z predchádzajúcich systémov spoločnosti a kombinuje algoritmy na efektívne skúmanie prostredia s meta-kontrolou. Agent57 preukázal svoje nadľudské schopnosti najmä v hrách Pitfall, Montezuma's Revenge, Solaris a Skiing – hry, ktoré tvrdo testovali predchádzajúce neurónové siete. Podľa výskumu Pitfall a Montezuma's Revenge nútia AI viac experimentovať, aby dosiahli lepšie výsledky. Solaris a Skiing sú ťažké pre neurónové siete, pretože nie je veľa známok úspechu - AI dlho nevie, či robí správnu vec. DeepMind staval na svojich starších agentoch AI, aby umožnil Agent57 robiť lepšie rozhodnutia o skúmaní prostredia a hodnotení výkonu hier, ako aj pri optimalizácii kompromisu medzi krátkodobým a dlhodobým správaním v hrách, ako je Lyžovanie.

Výsledky sú pôsobivé, ale AI má pred sebou ešte dlhú cestu. Tieto systémy dokážu naraz zvládnuť iba jednu hru, čo je podľa vývojárov v rozpore s ľudskými schopnosťami: „Skutočná flexibilita, ktorá sa tak ľahko dostáva do ľudského mozgu, je stále mimo dosahu AI.“



Zdroj: 3dnews.ru

Pridať komentár