L'IA DeepMind Agent57 bat les jeux Atari mieux qu'un humain

Faire fonctionner un réseau de neurones à travers des jeux vidéo simples est un moyen idéal pour tester l'efficacité de sa formation, grâce à la simple capacité d'évaluer les résultats de sa réalisation. Développé en 2012 par DeepMind (qui fait partie d'Alphabet), le benchmark de 57 jeux Atari 2600 emblématiques est devenu un test décisif pour tester les capacités des systèmes d'auto-apprentissage. Et ici Agent57, un agent RL avancé (Reinforcement Learning) DeepMind, récemment a montré un énorme pas en avant par rapport aux systèmes précédents et a été la première itération de l'IA à dépasser la base de référence du joueur humain.

L'IA DeepMind Agent57 bat les jeux Atari mieux qu'un humain

Agent57 AI prend en compte l’expérience des systèmes précédents de l’entreprise et combine des algorithmes pour une exploration efficace de l’environnement avec un méta-contrôle. En particulier, Agent57 a prouvé ses compétences surhumaines dans Pitfall, Montezuma's Revenge, Solaris et Skiing - des jeux qui ont mis à rude épreuve les réseaux neuronaux précédents. Selon les recherches, Pitfall et Montezuma's Revenge obligent l'IA à expérimenter davantage pour obtenir de meilleurs résultats. Solaris et Skiing sont difficiles pour les réseaux de neurones car il n'y a pas beaucoup de signes de succès - l'IA ne sait pas longtemps si elle fait la bonne chose. DeepMind s'est appuyé sur ses anciens agents d'IA pour permettre à Agent57 de prendre de meilleures décisions concernant l'exploration de l'environnement et l'évaluation des performances des jeux, ainsi que d'optimiser le compromis entre le comportement à court terme et à long terme dans des jeux comme le ski.

Les résultats sont impressionnants, mais l’IA a encore un long chemin à parcourir. Ces systèmes ne peuvent gérer qu’un seul jeu à la fois, ce qui, selon les développeurs, est contraire aux capacités humaines : « La véritable flexibilité qui s’offre si facilement au cerveau humain est encore hors de portée de l’IA. »



Source: 3dnews.ru

Ajouter un commentaire