DeepMind Agent57 AI bate jocurile Atari mai bine decât un om

Realizarea unei rețele neuronale prin jocuri video simple este o modalitate ideală de a testa eficiența antrenamentului său, datorită capacității simple de a evalua rezultatele finalizării. Dezvoltat în 2012 de DeepMind (parte din Alphabet), etalonul de 57 de jocuri emblematice Atari 2600 a devenit un test de turnesol pentru testarea capabilităților sistemelor de auto-învățare. Și aici Agent57, un agent avansat RL (Învățare prin consolidare) DeepMind, recent a arătat un salt uriaș față de sistemele anterioare și a fost prima iterație a AI care a depășit linia de bază a jucătorului uman.

DeepMind Agent57 AI bate jocurile Atari mai bine decât un om

Agent57 AI ia în considerare experiența sistemelor anterioare ale companiei și combină algoritmi pentru explorarea eficientă a mediului cu meta-control. În special, Agent57 și-a dovedit abilitățile supraomenești în Pitfall, Montezuma's Revenge, Solaris și Skiing - jocuri care au testat sever rețelele neuronale anterioare. Potrivit cercetărilor, Pitfall și Montezuma's Revenge forțează AI să experimenteze mai mult pentru a obține rezultate mai bune. Solaris și Skiing sunt dificile pentru rețelele neuronale, deoarece nu există multe semne de succes - AI ​​nu știe de multă vreme dacă face ceea ce trebuie. DeepMind s-a bazat pe agenții AI moșteniți pentru a-i permite lui Agent57 să ia decizii mai bune în ceea ce privește explorarea mediului și evaluarea performanței jocurilor, precum și optimizarea compromisului între comportamentul pe termen scurt și cel pe termen lung în jocuri precum Schi.

Rezultatele sunt impresionante, dar AI mai are un drum lung de parcurs. Aceste sisteme pot gestiona doar un joc la un moment dat, ceea ce, potrivit dezvoltatorilor, este contrar capacităților umane: „Adevărata flexibilitate care ajunge atât de ușor la creierul uman este încă dincolo de atingerea inteligenței artificiale”.



Sursa: 3dnews.ru

Adauga un comentariu