DeepMind Agent57 AI Atari оюндарын адамга караганда жакшыраак жеңет

Нейрондук тармакты жөнөкөй видеооюндар аркылуу ишке ашыруу - бүтүрүүнүн натыйжаларын баалоо жөндөмүнүн аркасында анын тренингинин натыйжалуулугун текшерүүнүн идеалдуу жолу. 2012-жылы DeepMind (Alphabetтин бир бөлүгү) тарабынан иштелип чыккан, 57 белгилуу Atari 2600 оюндарынын эталондору өзүн-өзү окутуу системаларынын мүмкүнчүлүктөрүн текшерүү үчүн лакмус тести болуп калды. Жана бул жерде Agent57, өнүккөн RL агенти (Reinforcement Learning) DeepMind, жакында көрсөттү мурунку системалардан чоң секирик жана адам оюнчусунун базалык деңгээлинен ашкан AIнын биринчи итерациясы болду.

DeepMind Agent57 AI Atari оюндарын адамга караганда жакшыраак жеңет

Agent57 AI компаниянын мурунку системаларынын тажрыйбасын эске алат жана айлана-чөйрөнү натыйжалуу чалгындоо үчүн алгоритмдерди мета-башкаруу менен айкалыштырат. Атап айтканда, Agent57 өзүнүн адамдан тышкаркы жөндөмдөрүн Pitfall, Montezuma's Revenge, Solaris жана Skiing оюндарында далилдеди - алар мурунку нейрон тармактарын катуу сынаган. Изилдөөлөргө ылайык, Pitfall жана Montezuma's Revenge жакшы натыйжаларга жетүү үчүн AIны көбүрөөк эксперимент кылууга мажбурлайт. Нейрондук тармактар ​​үчүн Solaris жана лыжа тебүү кыйын, анткени ийгиликтин белгилери көп эмес - AI көпкө чейин туура иш кылып жатабы же жокпу билбейт. DeepMind Agent57ге айлана-чөйрөнү изилдөө жана оюндардын натыйжалуулугун баалоо, ошондой эле лыжа тебүү сыяктуу оюндарда кыска мөөнөттүү жана узак мөөнөттүү жүрүм-турумду оптималдаштыруу боюнча жакшыраак чечимдерди кабыл алууга мүмкүндүк берүү үчүн өзүнүн AI агенттерине курулган.

Натыйжалар таасирдүү, бирок AI дагы деле көп жолду басып өтүшү керек. Бул системалар бир эле учурда бир гана оюнду башкара алат, бул, иштеп чыгуучулардын айтымында, адамдын мүмкүнчүлүктөрүнө карама-каршы келет: "Адамдын мээсине ушунчалык оңой келген чыныгы ийкемдүүлүк AI дагы эле жете албайт."



Source: 3dnews.ru

Комментарий кошуу