DeepMind Agent57 AI, Atari oyunlarını insandan daha iyi yener

Bir sinir ağının basit video oyunları aracılığıyla çalıştırılması, tamamlamanın sonuçlarını değerlendirmenin basit yeteneği sayesinde, eğitiminin etkinliğini test etmenin ideal bir yoludur. 2012 yılında DeepMind (Alphabet'in bir parçası) tarafından geliştirilen, 57 ikonik Atari 2600 oyununun referans noktası, kendi kendine öğrenme sistemlerinin yeteneklerini test etmek için bir turnusol testi haline geldi. Ve burada, gelişmiş bir RL aracısı (Güçlendirilmiş Öğrenme) DeepMind olan Agent57, yakın zamanda gösterdi Önceki sistemlerden büyük bir sıçramaydı ve yapay zekanın insan oyuncunun temel çizgisini aşan ilk yinelemesiydi.

DeepMind Agent57 AI, Atari oyunlarını insandan daha iyi yener

Agent57 AI, şirketin önceki sistemlerinin deneyimini hesaba katıyor ve ortamın verimli bir şekilde keşfedilmesine yönelik algoritmaları meta kontrolle birleştiriyor. Agent57 özellikle daha önceki sinir ağlarını ciddi şekilde test eden Pitfall, Montezuma's Revenge, Solaris ve Skiing oyunlarında insanüstü becerilerini kanıtladı. Araştırmalara göre Pitfall ve Montezuma's Revenge, yapay zekayı daha iyi sonuçlar elde etmek için daha fazla denemeye zorluyor. Solaris ve Kayak sinir ağları için zordur çünkü pek fazla başarı belirtisi yoktur - yapay zeka uzun süredir doğru şeyi yapıp yapmadığını bilmiyor. DeepMind, Agent57'nin çevreyi keşfetme ve oyunların performansını değerlendirme konusunda daha iyi kararlar almasına ve ayrıca Kayak gibi oyunlarda kısa vadeli ve uzun vadeli davranışlar arasındaki dengeyi optimize etmesine olanak sağlamak için eski AI ajanlarını geliştirdi.

Sonuçlar etkileyici ancak yapay zekanın hâlâ kat etmesi gereken uzun bir yol var. Bu sistemler aynı anda yalnızca bir oyunu yönetebiliyor ve geliştiricilere göre bu, insan yeteneklerine aykırı: "İnsan beynine bu kadar kolay gelen gerçek esneklik, hala yapay zekanın ulaşamayacağı bir yerde."



Kaynak: 3dnews.ru

Yorum ekle