DeepMind Agent57 AI mengalahkan game Atari lebih baik daripada manusia

Membuat jaringan saraf dijalankan melalui video game sederhana adalah cara ideal untuk menguji efektivitas pelatihannya, berkat kemampuan sederhana untuk mengevaluasi hasil penyelesaiannya. Dikembangkan pada tahun 2012 oleh DeepMind (bagian dari Alphabet), tolok ukur dari 57 game ikonik Atari 2600 menjadi ujian lakmus untuk menguji kemampuan sistem pembelajaran mandiri. Dan di sini Agent57, agen RL tingkat lanjut (Reinforcement Learning) DeepMind, baru-baru ini ditampilkan lompatan besar dari sistem sebelumnya dan merupakan iterasi AI pertama yang melampaui batas dasar pemain manusia.

DeepMind Agent57 AI mengalahkan game Atari lebih baik daripada manusia

Agent57 AI memperhitungkan pengalaman sistem perusahaan sebelumnya dan menggabungkan algoritme untuk eksplorasi lingkungan yang efisien dengan kontrol meta. Secara khusus, Agent57 telah membuktikan keterampilan manusia supernya dalam Pitfall, Montezuma's Revenge, Solaris, dan Ski - game yang telah menguji jaringan saraf sebelumnya secara ketat. Menurut penelitian, Pitfall dan Montezuma's Revenge memaksa AI untuk lebih banyak bereksperimen untuk mencapai hasil yang lebih baik. Solaris dan Ski sulit untuk jaringan saraf karena tidak banyak tanda keberhasilan - AI tidak tahu untuk waktu yang lama apakah mereka melakukan hal yang benar. DeepMind membangun agen AI lamanya untuk memungkinkan Agent57 membuat keputusan yang lebih baik dalam mengeksplorasi lingkungan dan menilai kinerja game, serta mengoptimalkan trade-off antara perilaku jangka pendek dan jangka panjang dalam game seperti Ski.

Hasilnya mengesankan, namun perjalanan AI masih panjang. Sistem ini hanya dapat menangani satu permainan dalam satu waktu, yang menurut pengembangnya, bertentangan dengan kemampuan manusia: β€œFleksibilitas sejati yang dapat diperoleh dengan mudah oleh otak manusia masih di luar jangkauan AI.”



Sumber: 3dnews.ru

Tambah komentar