DeepMind Agent57 AI เอาชนะเกม Atari ได้ดีกว่ามนุษย์

การทำให้โครงข่ายประสาทเทียมทำงานผ่านวิดีโอเกมง่ายๆ เป็นวิธีที่ดีเยี่ยมในการทดสอบประสิทธิภาพของการฝึกฝน เนื่องจากความสามารถที่เรียบง่ายในการประเมินผลลัพธ์ของความสำเร็จ เกณฑ์มาตรฐานของเกม Atari 2012 อันโด่งดัง 57 เกมได้รับการพัฒนาในปี 2600 โดย DeepMind (ส่วนหนึ่งของ Alphabet) ซึ่งกลายเป็นบททดสอบสำหรับทดสอบความสามารถของระบบการเรียนรู้ด้วยตนเอง และนี่คือ Agent57 ซึ่งเป็นตัวแทน RL ขั้นสูง (การเรียนรู้การเสริมกำลัง) DeepMind เมื่อเร็วๆ นี้ แสดงให้เห็นว่า เป็นการก้าวกระโดดครั้งใหญ่จากระบบก่อนหน้านี้ และเป็นการทำซ้ำครั้งแรกของ AI ที่จะเกินมาตรฐานของมนุษย์

DeepMind Agent57 AI เอาชนะเกม Atari ได้ดีกว่ามนุษย์

Agent57 AI คำนึงถึงประสบการณ์ของระบบก่อนหน้าของบริษัท และรวมอัลกอริธึมเพื่อการสำรวจสภาพแวดล้อมอย่างมีประสิทธิภาพด้วยการควบคุมเมตา โดยเฉพาะอย่างยิ่ง Agent57 ได้พิสูจน์ทักษะเหนือมนุษย์ของเขาในเกม Pitfall, Montezuma's Revenge, Solaris และ Skiing - เกมที่ได้ทดสอบโครงข่ายประสาทเทียมก่อนหน้านี้อย่างเข้มงวด จากการวิจัยพบว่า Pitfall และการแก้แค้นของ Montezuma บังคับให้ AI ทดลองมากขึ้นเพื่อให้ได้ผลลัพธ์ที่ดีขึ้น Solaris และการเล่นสกีเป็นเรื่องยากสำหรับโครงข่ายประสาทเทียมเนื่องจากมีสัญญาณแห่งความสำเร็จไม่มากนัก - AI ไม่รู้มานานแล้วว่ากำลังทำสิ่งที่ถูกต้องหรือไม่ DeepMind สร้างขึ้นจากตัวแทน AI รุ่นเก่าเพื่อให้ Agent57 ตัดสินใจได้ดีขึ้นเกี่ยวกับการสำรวจสภาพแวดล้อมและประเมินประสิทธิภาพของเกม รวมถึงการเพิ่มประสิทธิภาพการแลกเปลี่ยนระหว่างพฤติกรรมระยะสั้นและระยะยาวในเกม เช่น การเล่นสกี

ผลลัพธ์ที่ได้น่าประทับใจ แต่ AI ยังคงมีเส้นทางอีกยาวไกล ระบบเหล่านี้สามารถรองรับเกมได้ครั้งละหนึ่งเกมเท่านั้น ซึ่งตามที่นักพัฒนาระบุว่าตรงกันข้ามกับความสามารถของมนุษย์: “ความยืดหยุ่นที่แท้จริงที่มากับสมองของมนุษย์ได้อย่างง่ายดายนั้นยังอยู่นอกเหนือขอบเขตของ AI”



ที่มา: 3dnews.ru

เพิ่มความคิดเห็น