DeepMind Agent57 AI supera os xogos de Atari mellor que un humano

Facer que unha rede neuronal funcione a través de videoxogos sinxelos é un xeito ideal de probar a eficacia do seu adestramento, grazas á simple capacidade de avaliar os resultados da finalización. Desenvolvido en 2012 por DeepMind (parte de Alphabet), o punto de referencia de 57 xogos emblemáticos de Atari 2600 converteuse nunha proba de lume para probar as capacidades dos sistemas de autoaprendizaxe. E aquí Agent57, un axente RL avanzado (Aprendizaxe de Reforzo) DeepMind, recentemente amosou un gran salto con respecto aos sistemas anteriores e foi a primeira iteración da IA ​​que superou a liña de base do xogador humano.

DeepMind Agent57 AI supera os xogos de Atari mellor que un humano

Agent57 AI ten en conta a experiencia dos sistemas anteriores da compañía e combina algoritmos para unha exploración eficiente do medio co metacontrol. En particular, Agent57 demostrou as súas habilidades sobrehumanas en Pitfall, Montezuma's Revenge, Solaris e Skiing, xogos que puxeron a proba as redes neuronais anteriores. Segundo a investigación, Pitfall e Montezuma's Revenge obrigan á IA a experimentar máis para conseguir mellores resultados. Solaris e Skiing son difíciles para as redes neuronais porque non hai moitos signos de éxito: a IA non sabe durante moito tempo se está a facer o correcto. DeepMind baseouse nos seus axentes de IA legados para permitir que Agent57 tome mellores decisións sobre a exploración do medio ambiente e a avaliación do rendemento dos xogos, ademais de optimizar a compensación entre o comportamento a curto e a longo prazo en xogos como o esquí.

Os resultados son impresionantes, pero a IA aínda ten un longo camiño por percorrer. Estes sistemas só poden xestionar un xogo á vez, o que, segundo os desenvolvedores, é contrario ás capacidades humanas: "A verdadeira flexibilidade que chega tan facilmente ao cerebro humano aínda está fóra do alcance da IA".



Fonte: 3dnews.ru

Engadir un comentario