DeepMind Agent57 AI کٽي ٿو Atari رانديون انسان کان بهتر

سادي ويڊيو گيمز ذريعي هڪ اعصابي نيٽ ورڪ هلائڻ هڪ مثالي طريقو آهي ان جي تربيت جي تاثير کي جانچڻ لاءِ، مڪمل ٿيڻ جي نتيجن جو جائزو وٺڻ جي سادي صلاحيت جي مهرباني. 2012 ۾ ڊيپ مائنڊ (الفابيٽ جو حصو) پاران ترقي ڪئي وئي، 57 آئڪنڪ اٽاري 2600 گيمز جو بينچ مارڪ سيلف لرننگ سسٽم جي صلاحيتن کي جانچڻ لاءِ لٽمس ٽيسٽ بڻجي ويو. ۽ هتي Agent57، هڪ جديد RL ايجنٽ (Reinforcement Learning) DeepMind، تازو ڏيکاريائين پوئين سسٽم کان هڪ وڏي ڇنڊڇاڻ ۽ انساني پليئر جي بيس لائين کان وڌڻ لاءِ AI جو پهريون ورجاءُ هو.

DeepMind Agent57 AI کٽي ٿو Atari رانديون انسان کان بهتر

Agent57 AI ڪمپني جي پوئين سسٽم جي تجربي کي حساب ۾ رکي ٿو ۽ ميٽا ڪنٽرول سان ماحول جي موثر ڳولا لاءِ الگورتھم کي گڏ ڪري ٿو. خاص طور تي، Agent57 Pitfall، Montezuma's Revenge، Solaris ۽ Skiing - رانديون جيڪي اڳئين اعصابي نيٽ ورڪن کي سختي سان آزمايا آهن، انهن ۾ هن جي عظيم انساني صلاحيتن کي ثابت ڪيو آهي. تحقيق موجب، Pitfall ۽ Montezuma's Revenge AI کي مجبور ڪري ٿو ته بهتر نتيجا حاصل ڪرڻ لاءِ وڌيڪ تجربا ڪري. سولاريس ۽ اسڪائينگ نيورل نيٽ ورڪن لاءِ مشڪل آهن ڇو ته اتي ڪاميابيءَ جون ڪيتريون نشانيون نه آهن - AI کي گهڻي وقت تائين خبر ناهي ته ڇا اهو صحيح ڪم ڪري رهيو آهي. ڊيپ مائنڊ پنهنجي ورثي واري AI ايجنٽن تي ٺاهي ٿو Agent57 کي ماحول کي ڳولڻ ۽ راندين جي ڪارڪردگي جو جائزو وٺڻ بابت بهتر فيصلا ڪرڻ جي اجازت ڏيڻ، انهي سان گڏ اسڪائينگ جهڙن راندين ۾ مختصر مدت ۽ ڊگهي مدي واري رويي جي وچ ۾ واپار کي بهتر ڪرڻ.

نتيجا شاندار آهن، پر AI اڃا تائين هڪ ڊگهو رستو آهي. اهي سسٽم هڪ وقت ۾ صرف هڪ راند کي سنڀالي سگهن ٿا، جيڪو، ڊولپرز جي مطابق، انساني صلاحيتن جي برخلاف آهي: "حقيقي لچڪ جيڪا انساني دماغ ۾ ايتري آسانيء سان اچي ٿي، اڃا تائين AI جي پهچ کان ٻاهر آهي."



جو ذريعو: 3dnews.ru

تبصرو شامل ڪريو