DeepMind Agent57 AI vence jogos Atari melhor que um humano

Fazer uma rede neural rodar por meio de videogames simples é uma forma ideal de testar a eficácia de seu treinamento, graças à simples capacidade de avaliar os resultados da finalização. Desenvolvido em 2012 pela DeepMind (parte da Alphabet), o benchmark de 57 jogos icônicos do Atari 2600 tornou-se um teste decisivo para testar as capacidades dos sistemas de autoaprendizagem. E aqui Agent57, um agente RL avançado (Aprendizagem de Reforço) DeepMind, recentemente mostrou um grande salto em relação aos sistemas anteriores e foi a primeira iteração da IA ​​a exceder a linha de base do jogador humano.

DeepMind Agent57 AI vence jogos Atari melhor que um humano

Agent57 AI leva em consideração a experiência dos sistemas anteriores da empresa e combina algoritmos para exploração eficiente do ambiente com metacontrole. Em particular, o Agente57 provou suas habilidades sobre-humanas em Pitfall, Montezuma's Revenge, Solaris e Skiing - jogos que testaram severamente as redes neurais anteriores. Segundo a pesquisa, Pitfall e Montezuma's Revenge forçam a IA a experimentar mais para obter melhores resultados. Solaris e Skiing são difíceis para redes neurais porque não há muitos sinais de sucesso - a IA há muito tempo não sabe se está fazendo a coisa certa. A DeepMind baseou-se em seus agentes legados de IA para permitir que o Agent57 tomasse melhores decisões sobre a exploração do ambiente e a avaliação do desempenho dos jogos, bem como otimizasse o equilíbrio entre o comportamento de curto e longo prazo em jogos como o esqui.

Os resultados são impressionantes, mas a IA ainda tem um longo caminho a percorrer. Esses sistemas só conseguem lidar com um jogo por vez, o que, segundo os desenvolvedores, é contrário às capacidades humanas: “A verdadeira flexibilidade que chega tão facilmente ao cérebro humano ainda está além do alcance da IA”.



Fonte: 3dnews.ru

Adicionar um comentário