DeepMind Agent57 AI mengalahkan permainan Atari lebih baik daripada manusia

Membuat rangkaian saraf berjalan melalui permainan video mudah adalah cara yang ideal untuk menguji keberkesanan latihannya kerana keupayaan mudah untuk menilai keputusan petikan. Dibangunkan pada 2012 oleh DeepMind (sebahagian daripada pegangan Alphabet), penanda aras 57 permainan ikonik Atari 2600 telah menjadi ujian litmus untuk menguji keupayaan sistem pembelajaran kendiri. Dan inilah Agent57, ejen RL lanjutan (Pembelajaran Pengukuhan) DeepMind, pada hari yang lain menunjukkan lonjakan besar daripada sistem sebelumnya dan merupakan lelaran AI pertama yang mengatasi prestasi asas pemain manusia.

DeepMind Agent57 AI mengalahkan permainan Atari lebih baik daripada manusia

Agent57 AI mengambil kira pengalaman sistem terdahulu syarikat dan menggabungkan algoritma untuk penerokaan alam sekitar yang cekap dengan kawalan meta. Khususnya, Agent57 telah membuktikan kemahiran luar biasa beliau dalam Pitfall, Montezuma's Revenge, Solaris dan Skiing - permainan yang telah menjadi ujian serius untuk rangkaian saraf sebelumnya. Menurut penyelidikan, Pitfall dan Montezuma's Revenge memaksa AI untuk mencuba lebih banyak untuk mencapai hasil yang lebih baik. Solaris dan Skiing sukar untuk rangkaian saraf kerana tidak banyak tanda kejayaan - AI tidak tahu untuk masa yang lama sama ada ia melakukan perkara yang betul. DeepMind membina ejen AI lamanya supaya Agent57 boleh membuat keputusan yang lebih baik berkenaan penerokaan alam sekitar dan penilaian prestasi dalam permainan, serta mengoptimumkan pertukaran antara tingkah laku jangka pendek dan jangka panjang dalam permainan seperti Ski.

Hasilnya mengagumkan, tetapi AI masih mempunyai perjalanan yang panjang. Sistem ini hanya boleh mengendalikan satu permainan pada satu masa, yang menurut pembangun bertentangan dengan keupayaan manusia: "Fleksibiliti sebenar yang datang dengan mudah kepada otak manusia masih di luar jangkauan AI."



Sumber: 3dnews.ru

Tambah komen