راه اندازی یک شبکه عصبی از طریق بازی های ویدئویی ساده، به لطف توانایی ساده برای ارزیابی نتایج تکمیل، راه ایده آلی برای آزمایش اثربخشی آموزش آن است. معیار 2012 بازی نمادین Atari 57 که در سال 2600 توسط DeepMind (بخشی از Alphabet) ساخته شد، به آزمونی برای آزمایش قابلیتهای سیستمهای خودآموز تبدیل شد. و در اینجا Agent57، یک عامل پیشرفته RL (Reinforcement Learning) DeepMind، اخیرا
Agent57 AI تجربه سیستمهای قبلی شرکت را در نظر میگیرد و الگوریتمهایی را برای اکتشاف کارآمد محیط با متاکنترل ترکیب میکند. به ویژه، Agent57 مهارت های مافوق بشری خود را در Pitfall، Montezuma's Revenge، Solaris و Skiing به اثبات رسانده است - بازی هایی که شبکه های عصبی قبلی را به شدت آزمایش کرده اند. طبق تحقیقات، Pitfall و Montezuma's Revenge هوش مصنوعی را مجبور میکنند تا برای دستیابی به نتایج بهتر آزمایشهای بیشتری انجام دهد. سولاریس و اسکی برای شبکههای عصبی دشوار هستند زیرا نشانههای موفقیت زیادی وجود ندارد - هوش مصنوعی برای مدت طولانی نمیداند که آیا کار درست را انجام میدهد یا خیر. DeepMind بر اساس عوامل هوش مصنوعی قدیمی خود به Agent57 اجازه می دهد تا تصمیمات بهتری در مورد کاوش در محیط و ارزیابی عملکرد بازی ها بگیرد و همچنین بهینه سازی تعادل بین رفتار کوتاه مدت و بلند مدت در بازی هایی مانند اسکی.
نتایج چشمگیر هستند، اما هوش مصنوعی هنوز راه درازی در پیش دارد. این سیستم ها فقط می توانند یک بازی را در یک زمان مدیریت کنند، که به گفته سازندگان، برخلاف توانایی های انسان است: "انعطاف پذیری واقعی که به راحتی به مغز انسان می رسد هنوز از دسترس هوش مصنوعی خارج است."
منبع: 3dnews.ru