La IA de DeepMind Agent57 supera a los juegos de Atari mejor que un humano

Hacer funcionar una red neuronal a través de videojuegos simples es una forma ideal de probar la efectividad de su entrenamiento, gracias a la simple capacidad de evaluar los resultados de su finalización. Desarrollado en 2012 por DeepMind (parte de Alphabet), el punto de referencia de 57 juegos icónicos de Atari 2600 se convirtió en una prueba de fuego para probar las capacidades de los sistemas de autoaprendizaje. Y aquí Agent57, un agente avanzado de RL (Aprendizaje por refuerzo) DeepMind, recientemente mostró un gran salto con respecto a los sistemas anteriores y fue la primera iteración de IA que superó la línea de base del jugador humano.

La IA de DeepMind Agent57 supera a los juegos de Atari mejor que un humano

Agent57 AI tiene en cuenta la experiencia de los sistemas anteriores de la empresa y combina algoritmos para la exploración eficiente del entorno con metacontrol. En particular, Agent57 ha demostrado sus habilidades sobrehumanas en Pitfall, Montezuma's Revenge, Solaris y Skiing, juegos que han puesto a prueba severamente las redes neuronales anteriores. Según la investigación, Pitfall y Montezuma's Revenge obligan a la IA a experimentar más para lograr mejores resultados. Solaris y Skiing son difíciles para las redes neuronales porque no hay muchos signos de éxito: la IA no sabe durante mucho tiempo si está haciendo lo correcto. DeepMind se basó en sus agentes de IA heredados para permitir que Agent57 tomara mejores decisiones sobre la exploración del entorno y la evaluación del rendimiento de los juegos, además de optimizar el equilibrio entre el comportamiento a corto y largo plazo en juegos como Skiing.

Los resultados son impresionantes, pero a la IA aún le queda un largo camino por recorrer. Estos sistemas sólo pueden manejar un juego a la vez, lo que, según los desarrolladores, es contrario a las capacidades humanas: "La verdadera flexibilidad que tan fácilmente llega al cerebro humano está aún más allá del alcance de la IA".



Fuente: 3dnews.ru

Añadir un comentario