د عصبي شبکې لخوا د ساده ویډیو لوبو لوبول د هغې د زده کړې اغیزمنتوب ازموینې لپاره یوه غوره لاره ده، د دې د فعالیت ارزولو اسانه وړتیا څخه مننه. په 2012 کې د ډیپ مائنډ (د الفبا برخه) لخوا رامینځته شوی، د 57 مشهور اټاري 2600 لوبو معیار د ځان زده کړې سیسټمونو وړتیاو لپاره یو لټمس ازموینه ګرځیدلې ده. او اوس، اجنټ 57، د ډیپ مائنډ د عصري RL (تقویه زده کړې) اجنټ، پدې وروستیو کې د پخوانیو سیسټمونو په پرتله یو لوی پرمختګ او د مصنوعي ذهانت لومړی تکرار شو چې د انسان د لومړني فعالیت څخه تیر شو.

د اجنټ ۵۷ AI د شرکت په پخوانیو سیسټمونو باندې جوړ شوی او د میټا کنټرول سره د اغیزمنې پلټنې لپاره الګوریتمونه سره یوځای کوي. په ځانګړې توګه، اجنټ ۵۷ په پټفال، مونټیزوما ریوینج، سولاریس، او سکیینګ کې فوق العاده مهارتونه ښودلي - هغه لوبې چې د پخوانیو عصبي شبکو لپاره یې جدي ننګونه رامینځته کړې. څیړنې ښیې چې پټفال او مونټیزوما ریوینج AI ته اړتیا لري چې د غوره پایلو ترلاسه کولو لپاره ډیرې تجربې وکړي. سولاریس او سکیینګ د عصبي شبکو لپاره ننګونکي دي ځکه چې د بریالیتوب لږ شاخصونه شتون لري - AI د اوږدې مودې لپاره نه پوهیږي چې ایا دا سم حرکتونه کوي. ډیپ مائنډ د خپل میراثي AI اجنټانو باندې جوړ کړی ترڅو اجنټ ۵۷ ته وړتیا ورکړي چې د سپړنې او د لوبې پایلو ارزونې په اړه ډیرې دقیقې پریکړې وکړي، او همدارنګه د سکیینګ په څیر لوبو کې د لنډمهاله او اوږدمهاله چلند ترمنځ سوداګري غوره کړي.

پایلې اغیزمنې دي، مګر مصنوعي ذهانت لا هم اوږده لاره لري. دا سیسټمونه یوازې په یو وخت کې یوه لوبه اداره کولی شي، کوم چې د پراختیا کونکو په وینا، د انساني وړتیاو څخه بهر دی: "هغه ریښتینی انعطاف چې د انسان دماغ ته په اسانۍ سره راځي لاهم د مصنوعي ذهانت له لاسرسي څخه بهر دی."
سرچینه: 3dnews.ru
