DeepMind Agent57 AI د انسان په پرتله د اټاري لوبې غوره کوي

د ساده ویډیو لوبو له لارې د عصبي شبکې رامینځته کول د تیریدو پایلو ارزولو ساده وړتیا له امله د دې روزنې اغیزې ازموینې لپاره غوره لاره ده. په 2012 کې د ډیپ مینډ لخوا رامینځته شوی (د الفبا د ساتلو برخه)، د 57 غوره اټاري 2600 لوبو بنچمارک د ځان زده کړې سیسټمونو وړتیاو ازموینې لپاره د لیټموس ټیسټ بدل شوی. او دلته Agent57 دی، یو پرمختللی RL ایجنټ (د پیاوړتیا زده کړه) DeepMind، بله ورځ ښودل د پخوانیو سیسټمونو څخه یو لوی کود او د AI لومړی تکرار و چې د انسان لوبغاړي بیس لاین ته وده ورکوي.

DeepMind Agent57 AI د انسان په پرتله د اټاري لوبې غوره کوي

Agent57 AI د شرکت پخوانیو سیسټمونو تجربه په پام کې نیسي او د میټا کنټرول سره د اغیزمن چاپیریال سپړنې لپاره الګوریتمونه ترکیب کوي. په ځانګړې توګه، Agent57 په Pitfall، Montezuma's Revenge، Solaris او Skiing - لوبو کې خپل فوق العاده مهارتونه ثابت کړي دي چې د پخوانیو عصبي شبکو لپاره جدي ازموینه وه. د څیړنې په وینا، Pitfall او Montezuma's Revenge AI مجبوروي چې د غوره پایلو ترلاسه کولو لپاره نوره تجربه وکړي. سولاریس او سکیینګ د عصبي شبکو لپاره ستونزمن دي ځکه چې د بریالیتوب ډیری نښې شتون نلري - AI د اوږدې مودې لپاره نه پوهیږي چې ایا دا سم کار کوي. DeepMind په خپلو پخوانیو AI اجنټانو باندې جوړ شوی ترڅو Agent57 وکولی شي په لوبو کې د چاپیریال سپړنې او فعالیت ارزونې په اړه غوره پریکړې وکړي ، په بیله بیا د سکیینګ په څیر لوبو کې د لنډ مهاله او اوږدمهاله چلند ترمینځ سوداګرۍ ته مطلوب.

پایلې اغیزمنې دي، مګر AI لاهم اوږده لاره لري. دا سیسټمونه کولی شي په یو وخت کې یوازې یوه لوبه اداره کړي، کوم چې پراختیا کونکي وایي چې د انسان د وړتیاوو په وړاندې ځي: "ریښتینی انعطاف چې د انسان دماغ ته په اسانۍ سره راځي لاهم د AI د لاسرسي څخه بهر دی."



سرچینه: 3dnews.ru

Add a comment