DeepMind Agent57 AI i mposht lojërat Atari më mirë se një njeri

Kryerja e një rrjeti nervor përmes lojërave të thjeshta video është një mënyrë ideale për të testuar efektivitetin e trajnimit të tij, falë aftësisë së thjeshtë për të vlerësuar rezultatet e përfundimit. Zhvilluar në vitin 2012 nga DeepMind (pjesë e Alphabet), standardi i 57 lojërave ikonike Atari 2600 u bë një provë lakmusi për testimin e aftësive të sistemeve të vetë-mësimit. Dhe këtu Agent57, një agjent i avancuar RL (Reinforcement Learning) DeepMind, kohët e fundit tregoi një hap i madh nga sistemet e mëparshme dhe ishte përsëritja e parë e AI që tejkaloi vijën bazë të lojtarit njerëzor.

DeepMind Agent57 AI i mposht lojërat Atari më mirë se një njeri

Agent57 AI merr parasysh përvojën e sistemeve të mëparshme të kompanisë dhe kombinon algoritme për eksplorim efikas të mjedisit me meta-kontroll. Në veçanti, Agent57 ka provuar aftësitë e tij mbinjerëzore në Pitfall, Montezuma's Revenge, Solaris dhe Skiing - lojëra që kanë testuar ashpër rrjetet e mëparshme nervore. Sipas hulumtimit, Pitfall dhe Montezuma's Revenge e detyrojnë AI të eksperimentojë më shumë për të arritur rezultate më të mira. Solaris dhe skijimi janë të vështira për rrjetet nervore sepse nuk ka shumë shenja suksesi - AI nuk e di për një kohë të gjatë nëse po bën gjënë e duhur. DeepMind ka ndërtuar mbi agjentët e tij të vjetër të AI për të lejuar Agent57 të marrë vendime më të mira për eksplorimin e mjedisit dhe vlerësimin e performancës së lojërave, si dhe optimizimin e shkëmbimit midis sjelljes afatshkurtër dhe afatgjatë në lojëra si Ski.

Rezultatet janë mbresëlënëse, por AI ka ende një rrugë të gjatë për të bërë. Këto sisteme mund të trajtojnë vetëm një lojë në një kohë, e cila, sipas zhvilluesve, është në kundërshtim me aftësitë njerëzore: "Fleksibiliteti i vërtetë që vjen kaq lehtë në trurin e njeriut është ende përtej mundësive të AI".



Burimi: 3dnews.ru

Shto një koment