DeepMind Agent57 AI superas Atari-ludojn pli bone ol homo

Fari neŭralan reton funkcii per simplaj videoludoj estas ideala maniero testi la efikecon de ĝia trejnado, danke al la simpla kapablo taksi la rezultojn de la kompletigo. Disvolvita en 2012 de DeepMind (parto de Alphabet), la komparnormo de 57 ikonecaj ludoj de Atari 2600 iĝis tornasolda testo por testado de la kapabloj de memlernantaj sistemoj. Kaj ĉi tie Agent57, altnivela RL-agento (Plifortiga Lernado) DeepMind, lastatempe montris grandega salto de antaŭaj sistemoj kaj estis la unua ripeto de AI se temas pri superi la bazlinion de la homa ludanto.

DeepMind Agent57 AI superas Atari-ludojn pli bone ol homo

Agent57 AI konsideras la sperton de la antaŭaj sistemoj de la kompanio kaj kombinas algoritmojn por efika esplorado de la medio kun metaregado. Aparte, Agent57 pruvis siajn superhomajn kapablojn en Pitfall, Montezuma's Revenge, Solaris kaj Skiing - ludoj kiuj severe provis antaŭajn neŭralaj retoj. Laŭ esplorado, Pitfall kaj Montezuma's Revenge devigas la AI eksperimenti pli por atingi pli bonajn rezultojn. Solaris kaj Skiado estas malfacilaj por neŭralaj retoj ĉar ne estas multaj signoj de sukceso - la AI ​​ne scias delonge ĉu ĝi faras la ĝustan aferon. DeepMind konstruis sur siaj heredaĵoj AI-agentoj por permesi al Agent57 fari pli bonajn decidojn pri esplorado de la medio kaj taksado de la agado de ludoj, kaj ankaŭ optimumigi la kompromison inter mallongperspektiva kaj longdaŭra konduto en ludoj kiel Skiado.

La rezultoj estas impresaj, sed AI ankoraŭ havas longan vojon por iri. Ĉi tiuj sistemoj povas trakti nur unu ludon samtempe, kio, laŭ la programistoj, estas kontraŭa al homaj kapabloj: "La vera fleksebleco, kiu venas tiel facile al la homa cerbo, estas ankoraŭ ekster la atingo de AI."



fonto: 3dnews.ru

Aldoni komenton