DeepMind Agent57 AI بازی های آتاری را بهتر از یک انسان شکست می دهد

راه اندازی یک شبکه عصبی از طریق بازی های ویدئویی ساده، به لطف توانایی ساده برای ارزیابی نتایج تکمیل، راه ایده آلی برای آزمایش اثربخشی آموزش آن است. معیار 2012 بازی نمادین Atari 57 که در سال 2600 توسط DeepMind (بخشی از Alphabet) ساخته شد، به آزمونی برای آزمایش قابلیت‌های سیستم‌های خودآموز تبدیل شد. و در اینجا Agent57، یک عامل پیشرفته RL (Reinforcement Learning) DeepMind، اخیرا نشان داد یک جهش بزرگ نسبت به سیستم های قبلی و اولین تکرار هوش مصنوعی بود که از خط پایه بازیکن انسانی فراتر رفت.

DeepMind Agent57 AI بازی های آتاری را بهتر از یک انسان شکست می دهد

Agent57 AI تجربه سیستم‌های قبلی شرکت را در نظر می‌گیرد و الگوریتم‌هایی را برای اکتشاف کارآمد محیط با متاکنترل ترکیب می‌کند. به ویژه، Agent57 مهارت های مافوق بشری خود را در Pitfall، Montezuma's Revenge، Solaris و Skiing به اثبات رسانده است - بازی هایی که شبکه های عصبی قبلی را به شدت آزمایش کرده اند. طبق تحقیقات، Pitfall و Montezuma's Revenge هوش مصنوعی را مجبور می‌کنند تا برای دستیابی به نتایج بهتر آزمایش‌های بیشتری انجام دهد. سولاریس و اسکی برای شبکه‌های عصبی دشوار هستند زیرا نشانه‌های موفقیت زیادی وجود ندارد - هوش مصنوعی برای مدت طولانی نمی‌داند که آیا کار درست را انجام می‌دهد یا خیر. DeepMind بر اساس عوامل هوش مصنوعی قدیمی خود به Agent57 اجازه می دهد تا تصمیمات بهتری در مورد کاوش در محیط و ارزیابی عملکرد بازی ها بگیرد و همچنین بهینه سازی تعادل بین رفتار کوتاه مدت و بلند مدت در بازی هایی مانند اسکی.

نتایج چشمگیر هستند، اما هوش مصنوعی هنوز راه درازی در پیش دارد. این سیستم ها فقط می توانند یک بازی را در یک زمان مدیریت کنند، که به گفته سازندگان، برخلاف توانایی های انسان است: "انعطاف پذیری واقعی که به راحتی به مغز انسان می رسد هنوز از دسترس هوش مصنوعی خارج است."



منبع: 3dnews.ru

اضافه کردن نظر