Umělá inteligence DeepMind Agent57 poráží hry Atari lépe než člověk

Zprovoznění neuronové sítě pomocí jednoduchých videoher je ideální způsob, jak otestovat efektivitu jejího tréninku, a to díky jednoduché schopnosti vyhodnotit výsledky dokončení. Benchmark 2012 ikonických her Atari 57, vyvinutý v roce 2600 společností DeepMind (součást Alphabet), se stal lakmusovým papírkem pro testování schopností samoučících se systémů. A zde Agent57, pokročilý RL agent (Reinforcement Learning) DeepMind, nedávno ukázáno obrovský skok oproti předchozím systémům a byla to první iterace umělé inteligence, která překonala základní linii lidského hráče.

Umělá inteligence DeepMind Agent57 poráží hry Atari lépe než člověk

Agent57 AI zohledňuje zkušenosti z předchozích systémů společnosti a kombinuje algoritmy pro efektivní průzkum prostředí s meta-kontrolou. Agent57 prokázal své nadlidské schopnosti zejména v Pitfall, Montezuma's Revenge, Solaris a Skiing – hrách, které tvrdě testovaly předchozí neuronové sítě. Podle výzkumu Pitfall a Montezuma's Revenge nutí AI více experimentovat, aby dosáhli lepších výsledků. Solaris a Skiing jsou pro neuronové sítě obtížné, protože není mnoho známek úspěchu - AI dlouho neví, zda dělá správnou věc. DeepMind stavěl na svých starších agentech umělé inteligence, aby umožnil Agent57 činit lepší rozhodnutí o prozkoumávání prostředí a hodnocení výkonu her a také optimalizovat kompromis mezi krátkodobým a dlouhodobým chováním ve hrách, jako je lyžování.

Výsledky jsou působivé, ale AI má před sebou ještě dlouhou cestu. Tyto systémy dokážou zpracovat pouze jednu hru najednou, což je podle vývojářů v rozporu s lidskými schopnostmi: „Skutečná flexibilita, která se tak snadno dostává do lidského mozku, je stále mimo dosah AI.“



Zdroj: 3dnews.ru

Přidat komentář